日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

你們知道DCT究竟有多重要嗎

訊維官方公眾號 ? 來源:LiveVideoStack ? 作者:ALex、趙軍 ? 2021-08-16 17:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Nasir Ahmed

聲影傳奇

#003#

前段時間,LiveVideoStack發(fā)布了一篇文章《視頻壓縮簡史:從1920到2020》,這篇文章獲得了很高的閱讀量,文章中記錄了一個又一個視頻壓縮歷史上的里程碑事件,而其中最引人注目,也最重要的發(fā)明之一就是DCT。沒有DCT,后面的H.26X, JPEG等一系列壓縮標準將無從談起。

什么是DCT?

隨著現(xiàn)代人越來越依賴計算機,需要傳輸?shù)臄?shù)據(jù)數(shù)量和種類也越來越多,比如我們經(jīng)常分享給別人的照片和視頻。如何在不丟失主要信息的情況下,縮減數(shù)據(jù)量,提升存儲空間,從而提高傳輸效率,降低傳輸成本呢?

數(shù)據(jù)壓縮技術(shù)登場了。數(shù)據(jù)壓縮分為無損壓縮和有損壓縮。無損壓縮是指數(shù)據(jù)在解壓縮時可以100%被恢復(fù),而有損壓縮(常用于聲音、圖片和視頻的壓縮)在解壓縮的過程中會舍棄一部分數(shù)據(jù),達到相對較高的壓縮比,同時圖像質(zhì)量也會有所下降。但顯而易見,有損壓縮可以大大壓縮文件數(shù)據(jù),節(jié)省磁盤空間,并提高傳輸效率。

而有損壓縮的核心之一就是DCT。

DCT全稱為Discrete Cosine Transform,即離散余弦變換。DCT變換屬于傅里葉變換的一種,常用于對信號和圖像(包括圖片和視頻)進行有損數(shù)據(jù)壓縮。

DCT將圖像分成由不同頻率組成的小塊,然后進行量化。在量化過程中,舍棄高頻分量,剩下的低頻分量被保存下來用于后面的圖像重建。

簡單介紹一下整個圖像壓縮過程:

將圖像分解為8*8的圖像塊

將表示像素的RGB系統(tǒng)轉(zhuǎn)換成YUV系統(tǒng)

然后從左至右,從上至下對每個圖像塊做DCT變換,舍棄高頻分量,保留低頻分量

對余下的圖像塊進行量化壓縮,由壓縮后的數(shù)據(jù)所組成的圖像大大縮減了存儲空間

解壓縮時對每個圖像塊做DCT反轉(zhuǎn)換(IDCT),然后重建一幅完整的圖像

由于舍棄了某些頻率的圖像,所以最終呈現(xiàn)出來的圖像清晰度會有差異。

可以看到,壓縮后的圖像比原始圖像模糊一些,但圖像的主要特征仍然可以識別。

本質(zhì)上,離散余弦變換需要一組N個相關(guān)(相似)的數(shù)據(jù)點,變換之后,返回N個去相關(guān)(不相似)的數(shù)據(jù)點(系數(shù)),其特點是能量被壓縮在僅有的M個系數(shù)中,其中M《N。

技術(shù)文獻中通常這樣描述DCT,說它具備去相關(guān)性和能量集中的特性,初看可能稍有點難以理解。其中,DCT將矩陣的能量壓縮到第一個元素中,被稱為直流(DC)系數(shù)。其余的系數(shù)被稱為交流(AC)系數(shù)。

這意味著輸出的二維DCT的左上角被稱為DC系數(shù)。它是DCT最重要的輸出,包含了很多關(guān)于原始圖像的信息。其余的系數(shù)被稱為交流系數(shù)(AC coefficients)。如果你使用DCT對圖像進行轉(zhuǎn)換,AC系數(shù)包含了圖像的更多細節(jié)。同時,如果把這些DCT系數(shù)應(yīng)用于反向的2D-DCT,將得到原始系數(shù)。DCT本身并不會壓縮數(shù)據(jù),它為隨后的量化之類的操作,提供了一個良好的基礎(chǔ)。

DCT是誰發(fā)明的?

第一個提出DCT的人是Nasir Ahmed。

1940年,Nasir出生于印度的班加羅爾,并在那里完成了電機工程的本科學(xué)業(yè)。隨后,他來到美國求學(xué)。在新墨西哥大學(xué),他獲得了電子和計算機工程專業(yè)的碩士和博士學(xué)位。

1966~1968年,Nasir就職于霍尼韋爾公司,之后在堪薩斯州立大學(xué)開始了他的教學(xué)生涯。1984年,他成為新墨西哥大學(xué)電子和計算機工程專業(yè)的教授,并一直留在那里任教,直到2001年退休。他現(xiàn)在是新墨西哥大學(xué)的榮譽退休教授。

在任教期間,Nasir同時還是桑迪亞國家實驗室的顧問(1976~1990),這所實驗室歸屬于霍尼韋爾公司,專注于與大學(xué)和公司合作進行科技創(chuàng)新。

DCT是Nasir一生中最重要的成就。

20世紀70年代中期,Nasir在堪薩斯州立大學(xué)帶領(lǐng)一組研究人員開發(fā)了DCT技術(shù)。

DCT是世界上應(yīng)用最廣泛的數(shù)據(jù)壓縮轉(zhuǎn)換技術(shù),同時也是大多數(shù)數(shù)字媒體標準(圖像、視頻和音頻)的基礎(chǔ)。

DCT是如何被創(chuàng)造出來的?

在上世紀60~70年代,關(guān)于數(shù)字正交變換及其在圖像數(shù)據(jù)壓縮中應(yīng)用的研究層出不窮。許多變換聲稱與其他變換相比具有更好的性能,但這些對比全部是建立在定性比較的基礎(chǔ)上,即查看一組使用變換編碼技術(shù)進行數(shù)據(jù)壓縮的“標準”圖像。

同一時期,在定量比較方面取得了重要進展。方差準則(variance criterion)和率失真標準(rate distortion criterion)被開發(fā)出來并廣泛用于評估圖像數(shù)據(jù)壓縮的性能指標。此外,KLT(Karhunen-Loeve transform,K-L變換)一躍成為用作比較目的的最優(yōu)變換。

正是在這樣的技術(shù)背景下,Nasir才能開始著手解決DCT問題。

Nasir發(fā)現(xiàn),KLT確實是基于均方誤差準則和一階馬爾科夫模型的最佳變換,但是卻缺少有效算法來計算它。于是,如何有效計算 KLT 的最佳近似值成為了他的研究重點。

他當時想到一種值得研究的方法——切比雪夫插值。1972年,他將這一想法寫成一份提案,提交給了美國國家科學(xué)基金會(NSF),希望獲得該基金會的資助。在提案中,Nasir提出使用切比雪夫多項式來研究“余弦變換”——也就是后來大名鼎鼎的DCT:

f19c9d0a-fe6f-11eb-9bcf-12bb97331649.png

但令他非常失望的是,NSF 并沒有為該提案提供資金,其中一位審查者給出的原因竟然是“太簡單”。

不過Nasir并沒有放棄,他找到了他的博士生T. Natarajan和他的朋友K.R.Rao,1973年的整個夏天,他們都在研究這一問題。最終,他們的研究有了結(jié)果,但這個結(jié)果好得讓Nasir不敢相信。正巧之后Nasir要和Harry Andrews(美國數(shù)學(xué)家)一起出席新奧爾良的一個數(shù)學(xué)會議,所以Nasir決定在會上向他請教。

Harry Andrews建議Nasir使用率失真標準來檢查這個“余弦變換”的性能,并發(fā)給他一個計算機程序幫助他計算結(jié)果。

最終,結(jié)果再次表明,DCT變換比其他所有變換都表現(xiàn)得更好,在性能上也與KLT十分接近。隨后Harry Andrews建議Nasir發(fā)表這一成果。Nasir聽從了他的建議,將論文以信件的形式發(fā)給了IEEE Computer Transactions(IEEE的通訊期刊),并在1974年1月獲得發(fā)表。

據(jù)Nasir后來回憶,當初誰也沒有想到DCT會在未來造成如此大的轟動。

DCT的重要性和其被發(fā)現(xiàn)的時間遠不匹配,以至于Gilbert Strang在一篇1999年的論文中寫道:“離散問題是如此之尋常,而且?guī)缀跏且粋€不可避免的問題,而讓人異常驚訝的一個事實在于,業(yè)界直到1974年才由Nasir Ahmed等人發(fā)現(xiàn)了DCT?!弊罱灿幸恍┭芯孔C據(jù)表明,雖然DCT由 Ahmed 等人開發(fā)是一個無可置疑的事實,但馮諾依曼(John von Neumann)在1941年左右也對DCT做了一些開創(chuàng)性的研究,不過馮諾依曼自身可能并未意識到其重要性。

DCT的實現(xiàn)簡介

DCT有8種形態(tài),我們通常所說的DCT,其實指的是DCT-II,其對應(yīng)的反變換是DCT-III。DCT-II、DCT-III的原始定義非常簡單:

f1b7c9c2-fe6f-11eb-9bcf-12bb97331649.png

其中:X:X 是DCT輸出.x:x 是DCT輸入.k:k 是計算結(jié)果的輸出數(shù)據(jù)索引, 從 0 to N?1N:N 變換元素的數(shù)目.s:s是縮放函數(shù), 除去s(0)=0.5,其他s(y)=1

原始的N點的DCT-II變換算法最樸素的實現(xiàn)大概可以這樣:

void dct_ii(int N, const double x[], double X[]) { for (int k = 0; k 《 N; ++k) { double sum = 0.; double s = (k == 0) ? sqrt(0.5) : 1.; for (int n = 0; n 《 N; ++n) { sum += s * x[n] * cos(PI * (n + 0.5) * k / N); } X[k] = sum * sqrt(2.0 / N); }}

隨后,DCT的一些快速算法陸續(xù)被開發(fā)出來,其中最引入注目的大概是LLM DCT(LLM 來自于三位對應(yīng)算法的作者:Loeffler、Ligtenberg和 Moschytz,其論文“Practical Fast 1-D DCT Algorithms with 11 Multiplications”)和AAN DCT(AAN 的名字也來自于三位算法作者: Arai、Agui 和 Nakajima,其對應(yīng)的論文是“A fast DCT-SQ scheme for images”)。

LLM DCT的算法流程如下:

f1db842a-fe6f-11eb-9bcf-12bb97331649.png

它引入了非常經(jīng)典的蝶形:

f1f1de64-fe6f-11eb-9bcf-12bb97331649.png

需要注意的是,LLM DCT的算法論文中,蝶形圖的標識說明里面還有一個明顯的錯誤在上面,其描述中,O1 均出現(xiàn)兩次,明顯第一個應(yīng)該是O0。

AAN DCT的計算流程如下,該算法使用了五個乘法(加上八個用于縮放的后乘法,文章中認為這不算,因為它們可以被移到后面的量化矩陣中被平攤掉)。

以H.264標準為例,它實際上是把DCT 變換和后續(xù)的量化放在了一起,以減輕DCT變換計算的復(fù)雜度,所以有時候看H.264的DCT變換系數(shù),你甚至第一眼很難想象它其實是個DCT的變換;從H.264的時代開始,DCT的變換開始使用整數(shù)變換,避免類似MPEG2年代因不同DCT、IDCT實現(xiàn)精度帶來的編碼、解碼不完全匹配的問題。

DCT的應(yīng)用

DCT的去相關(guān)和能量壓縮特性使其在圖像和視頻壓縮中極具吸引力。Karhunen-Loève變換(KLT)通常被稱為理想變換,具有更好的去重特性,但在計算上是難以解決的。另一方面,DCT很容易編程,這使得它迅速占領(lǐng)了圖像和視頻壓縮領(lǐng)域。現(xiàn)在常見的圖片、視頻壓縮,如JPEG、H.26X、MPEG等,都用到了DCT。

圖像

Nasir近況

今年二月份,在熱播美劇《我們的生活》(This is Us)第5季第8集中,穿插了一段“艾哈邁德夫婦的故事”。這段故事取材于現(xiàn)實,講述的正是Nasir和他的太太Esther之間發(fā)生的事。兩人是新墨西哥大學(xué)的校友,在一次大學(xué)國際學(xué)生聚會中偶然結(jié)識并相戀,然后步入了婚姻殿堂,并且一直相知相守到今天。2018年,Nasir和Esther還出版了一本講述他們生活故事的限量版圖書——Parallel Lives In Curved Space。去年,兩人慶祝了他們的結(jié)婚56周年紀念日。

《我們的生活》劇組工作人員正在和Nasir、Esther視頻對話

為什么要在《我們的生活》劇集中穿插這樣一段故事?

原來導(dǎo)演是想通過這個故事向DCT技術(shù)的發(fā)明者Nasir Ahmed致敬。如果沒有Nasir,劇中的皮爾森一家不可能在新冠疫情期間通過視頻會話保持聯(lián)系,慰藉彼此。

現(xiàn)實中的我們也是一樣。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1096

    瀏覽量

    42448
  • 編碼
    +關(guān)注

    關(guān)注

    6

    文章

    1041

    瀏覽量

    57156
  • DCT
    DCT
    +關(guān)注

    關(guān)注

    1

    文章

    56

    瀏覽量

    20735
  • mpeg2
    +關(guān)注

    關(guān)注

    0

    文章

    7

    瀏覽量

    8630

原文標題:DCT如此重要,作者當初竟然不知道?

文章出處:【微信號:xunwei201508,微信公眾號:訊維官方公眾號】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    OTP語音芯片與Flash語音芯片究竟有何區(qū)別?一文讀懂選型關(guān)鍵與行業(yè)應(yīng)用

    芯片到底有什么區(qū)別?究竟該選哪一種?本文將從存儲方式、成本、功耗、應(yīng)用場景等多個維度進行全面對比,并介紹國內(nèi)知名語音IC廠家廣州唯創(chuàng)電子旗下的代表性產(chǎn)品矩陣,幫助您
    的頭像 發(fā)表于 04-20 09:48 ?311次閱讀
    OTP語音芯片與Flash語音芯片<b class='flag-5'>究竟有</b>何區(qū)別?一文讀懂選型關(guān)鍵與行業(yè)應(yīng)用

    OCAD應(yīng)用:多重轉(zhuǎn)換式斷續(xù)變焦系統(tǒng)設(shè)計

    | | 多組轉(zhuǎn)換型變焦系統(tǒng)可以實現(xiàn)多檔斷續(xù)變焦。設(shè)計時同時設(shè)計多重可打入活動組,在打入時隨意轉(zhuǎn)換。多組轉(zhuǎn)換型的活動組可以放置在會聚光路中也可以在平行光路中。選擇在平行光路中,可利用活動組的無焦性來回
    發(fā)表于 04-10 08:05

    提升可靠性,防水透氣膜的多重功能的重要

    提升可靠性,防水透氣膜的多重功能的重要
    的頭像 發(fā)表于 12-03 17:34 ?678次閱讀
    提升可靠性,防水透氣膜的<b class='flag-5'>多重</b>功能的<b class='flag-5'>重要</b>性

    大神們,想知道你們都用什么ide編程調(diào)試器? Arduino IDE?還是 e2studio ?還有其他嗎?哪個好用呢

    大神們,想知道你們都用什么ide編程調(diào)試器? Arduino IDE? 還是 e2studio ? 還有其他嗎? 哪個IDE好用呢? 求指點呀
    發(fā)表于 11-30 12:05

    弱電智能化中究竟有多少個子系統(tǒng)?

    子系統(tǒng),每個子系統(tǒng)都承擔著特定的功能,共同為建筑提供全面的智能化服務(wù)。隨著技術(shù)的不斷進步,弱電智能化系統(tǒng)的子系統(tǒng)也在不斷發(fā)展和完善。那么,弱電智能化中究竟有多少個子系統(tǒng)呢?本文將詳細列舉并介紹這些子系統(tǒng)。 一
    的頭像 發(fā)表于 11-24 09:57 ?1507次閱讀
    弱電智能化中<b class='flag-5'>究竟有</b>多少個子系統(tǒng)?

    邊緣計算網(wǎng)關(guān)對物聯(lián)網(wǎng)行業(yè)重要嗎

    邊緣計算網(wǎng)關(guān)對物聯(lián)網(wǎng)行業(yè)至關(guān)重要,它是推動物聯(lián)網(wǎng)技術(shù)落地與產(chǎn)業(yè)升級的核心組件,具體體現(xiàn)在技術(shù)架構(gòu)優(yōu)化、行業(yè)應(yīng)用深化及產(chǎn)業(yè)生態(tài)發(fā)展三個層面: 一、技術(shù)架構(gòu)優(yōu)化:解決物聯(lián)網(wǎng)核心痛點 降低延遲,提升實時性
    的頭像 發(fā)表于 10-24 15:13 ?666次閱讀

    防水連接器8芯:信號連接重要嗎?

    在多路信號傳輸場景中,防水連接器 8 芯是設(shè)備間的 “信息樞紐”—— 它能同時承載 8 路獨立信號或電力,且具備防水防塵能力。不少人疑惑:不就是多幾根芯線,信號連接真有那么重要?其實,惟興科技 8 芯防水連接器的信號連接質(zhì)量,直接關(guān)系到設(shè)備能否精準協(xié)同、穩(wěn)定運行,在復(fù)雜場景中堪稱 “命脈所在”。
    的頭像 發(fā)表于 10-15 18:25 ?807次閱讀

    能耗管理系統(tǒng)的數(shù)據(jù)精準度有多重要?這些誤區(qū)要避開

    能耗管理系統(tǒng)的數(shù)據(jù)精準度有多重要?這些誤區(qū)要避開 在能耗管理系統(tǒng)的應(yīng)用中,“數(shù)據(jù)精準度” 常被視為 “隱性基石”—— 它不像 “一鍵調(diào)控”“異常預(yù)警” 那樣直觀可見,卻直接決定著系統(tǒng)能否真正發(fā)揮價值
    的頭像 發(fā)表于 10-11 15:37 ?617次閱讀

    看不見的靜電危害大,做好防護究竟有多重要?#電子元器件 #電路知識 #

    電子元器件
    jf_15747056
    發(fā)布于 :2025年09月23日 16:09:29

    在輻射整改中接地有多重要!

    整改。在整改時我們除了要知道EMC三要素,即:噪聲源、傳播路徑和敏感設(shè)備。我們還要知道整改的三大手段,即:屏蔽、濾波和接地。相對來說濾波是在整改實例中應(yīng)用得最多的一
    的頭像 發(fā)表于 08-12 11:34 ?785次閱讀
    在輻射整改中接地有<b class='flag-5'>多重要</b>!

    Microsoft AD究竟有多重要

    勒索軟件攻防已成一場永無止境的貓鼠游戲——在IT和安全團隊不斷提升能力的同時,攻擊者也在不斷尋找新的攻擊路徑,而AD作為集中管理的核心要素,已成為勒索軟件攻擊的主要目標和執(zhí)行路徑。
    的頭像 發(fā)表于 07-22 13:57 ?895次閱讀

    KSC DCT系列輕觸開關(guān)的主要優(yōu)勢和應(yīng)用領(lǐng)域

    雙電路技術(shù)是指在一個輕觸開關(guān)(單刀雙擲,SPDT)內(nèi)部產(chǎn)生兩個獨立輸出信號的功能。請參見下面的SPDT電路。KSC DCT輕觸開關(guān)有一個共用引腳、一個常關(guān)(NC)引腳和一個常開(NO)引腳。如果用戶
    的頭像 發(fā)表于 06-26 14:35 ?1250次閱讀
    KSC <b class='flag-5'>DCT</b>系列輕觸開關(guān)的主要優(yōu)勢和應(yīng)用領(lǐng)域

    OCAD應(yīng)用:多重轉(zhuǎn)換式斷續(xù)變焦系統(tǒng)設(shè)計

    多組轉(zhuǎn)換型變焦系統(tǒng)可以實現(xiàn)多檔斷續(xù)變焦。設(shè)計時同時設(shè)計多重可打入活動組,在打入時隨意轉(zhuǎn)換。多組轉(zhuǎn)換型的活動組可以放置在會聚光路中也可以在平行光路中。選擇在平行光路中,可利用活動組的無焦性來回倒置獲得
    發(fā)表于 06-18 08:49

    家用電器氣密性檢測儀,背后究竟有啥神秘力量?

    在現(xiàn)代生活中,家用電器的氣密性至關(guān)重要,它直接影響著產(chǎn)品的性能、使用壽命甚至是用戶的安全。而家用電器氣密性檢測儀,就像是一位“隱形衛(wèi)士”,默默守護著家電的質(zhì)量。那么,它背后究竟隱藏著怎樣的神秘力量呢
    的頭像 發(fā)表于 06-12 14:19 ?1094次閱讀
    家用電器氣密性檢測儀,背后<b class='flag-5'>究竟有</b>啥神秘力量?

    FOC電機控制究竟該如何學(xué)?

    學(xué)習(xí)FOC電機控制究竟是學(xué)哪些內(nèi)容? 電機知識 軟件知識 純分享貼,有需要可以直接下載附件獲取完整資料! (如果內(nèi)容有幫助可以關(guān)注、點贊、評論支持一下哦~)
    發(fā)表于 05-09 14:09
    湟中县| 左贡县| 桐城市| 葵青区| 江安县| 凤山县| 独山县| 齐齐哈尔市| 綦江县| 精河县| 广灵县| 讷河市| 驻马店市| 西安市| 海兴县| 淮北市| 清镇市| 平泉县| 黄浦区| 博野县| 伊吾县| 平南县| 昌邑市| 萨嘎县| 安宁市| 册亨县| 藁城市| 淮阳县| 新野县| 梅州市| 上犹县| 郁南县| 大港区| 长泰县| 株洲市| 东明县| 精河县| 北海市| 句容市| 曲靖市| 乌兰浩特市|