MPEG于1988年成立,是為數(shù)字音/視頻制定壓縮標準的專家組,目前已擁有300多名成員,包括IBM、SUN、BBC、NEC、INTEL、AT&T等世界知名公司。MPEG組織最初得到的授權(quán)是制定用于“活動圖像”編碼的各種標準,隨后擴充為“及其伴隨的音頻”及其組合編碼。MPEG能夠比其他算法提供更好的壓縮比,最高可達200:1。更重要的是,MPEG在提供高壓縮比的同時,對數(shù)據(jù)的損失很小。MPEG視頻壓縮編碼包括了MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21。MPEG-1即俗稱的VCD制式,MPEG-2則為DVD所采用,MPEG-4是為交互式多媒體通訊制定得壓縮標準,MPEG-7是為互聯(lián)網(wǎng)視頻檢索制定的壓縮標準,MPEG-21側(cè)重于支持大范圍網(wǎng)絡(luò)的各種設(shè)備可以透明地訪問各種多媒體資源。由于MPEG-7及MPEG-21標準重點已經(jīng)不在壓縮方面,不在本文討論范圍。
a) MPEG-1
1992年推出的MPEG-1用于傳輸1.5Mbps數(shù)據(jù)傳輸率的數(shù)字存儲媒體運動圖像及其伴音的編碼。它包括五個部分,第一部分(系統(tǒng)部分)說明了如何根據(jù)第二部分(視頻部分)以及第三部分(音頻部分)的規(guī)定,對音頻和視頻進行復(fù)合編碼;第四部分(一致性部分)說明了檢驗解碼器或編碼器的輸出比特流符合前三部分規(guī)定的過程;第五部分是用C語言實現(xiàn)編碼和解碼器的參考軟件。MPEG-1以其高效的壓縮技術(shù)和較為滿意的圖像質(zhì)量成為紅極一時的家庭化VCD的基礎(chǔ)。
b) MPEG-2
1995年推出的MPEG-2圖像壓縮的原理是利用了圖像中的兩種特性:空間相關(guān)性和時間相關(guān)性。這兩種相關(guān)性使得圖像中存在大量的冗余信息。如果我們能將這些冗余信息去除,只保留少量非相關(guān)信息進行傳輸,就可以大大節(jié)省傳輸頻帶。而接收機利用這些非相關(guān)信息,按照一定的解碼算法,可以在保證一定的圖像質(zhì)量的前提下恢復(fù)原始圖像。
MPEG-2,以其更高的像素分辨率,大大提高了視頻質(zhì)量,為DVD(高密度數(shù)字視頻光盤),特別是HDTV(高清晰度電視)、DAB(數(shù)字音頻廣播) 等廣播級的數(shù)字電視的編碼和傳送的迅速推廣提供了基礎(chǔ),并大大推進了許多基于視頻的試驗性及商業(yè)性服務(wù)。MPEG-2標準是針對SDTV和HDTV在各種應(yīng)用下的壓縮方案和系統(tǒng)層的詳細規(guī)定,編碼碼率從3Mbps到100Mbps,能夠提供廣播級的視頻和CD級的音質(zhì)。
根據(jù)MPEG-2標準,不同廠家的編碼器雖然可以采用不同算法,但產(chǎn)生的MPEG-2碼流都必須遵守相同的語法和解碼規(guī)則,任何支持同樣或更高級別的MPEG-2格式的解碼器都可以解碼。這一點保證在整個信號數(shù)據(jù)鏈路中的設(shè)備互換性,解決多種視頻數(shù)據(jù)格式并存帶來的許多問題,這在開放性網(wǎng)絡(luò)設(shè)備構(gòu)架中是非常重要。全球正在開始實施的數(shù)字電視廣播傳輸?shù)膰H標準有三個:美國的AISC、歐洲的DVB及日本的ISDB。它們在傳送視音頻流時都采用MPEG-2的傳輸流。MPEG-2 IBP幀方式由于采用幀間壓縮,大大降低了碼率,已在傳輸、播出中獲得了廣泛應(yīng)用,并為國際所公認。
MPEG-2不是MPEG-1的簡單升級,MPEG-2在系統(tǒng)和傳送方面作了更加詳細的規(guī)定和進一步的完善。MPEG-2解決了MPEG-1不能滿足的日益增長的多媒體應(yīng)用對分辨率和傳輸率的要求,支持固定比特率傳送、可變比特率傳送、隨機訪問、分級編碼、比特流編輯等功能。
c) MPEG-4
1998年制定的MPEG-4第一版及1999年推出 的MPEG-4第二版 被視為第一個真正意義上的多媒體標準。它以客觀對像作為編碼形式,實現(xiàn)多媒體交互應(yīng)用。它在移動通信、視頻交互及計算機圖片2D/3D計算處理以及專業(yè)數(shù)字視頻等方面起著決策性作用。
MPEG4于1998 年11月公布。MPEG-4標準主要應(yīng)用于視像電話(Video Phone),視像電子郵件(Video Email)和電子新聞(Electronic News)等,其傳輸速率要求較低,在4800-64000bits/sec之間,分辨率為176X144。MPEG-4利用很窄的帶寬,通過幀重建技術(shù),壓縮和傳輸數(shù)據(jù),以求以最少的數(shù)據(jù)獲得最佳的圖象質(zhì)量。
MPEG-1、MPEG-2都是采用傳統(tǒng)壓縮編碼技術(shù),著眼于圖像信號的統(tǒng)計特性來設(shè)計編碼器,屬于波形編碼的范疇。傳統(tǒng)壓縮編碼方案把視頻序列按時間先后分為一系列幀,每一幀圖像又分成宏塊以進行運動補償和編碼,這種編碼方案存在以下缺陷:
·在高壓縮比的情況下會出現(xiàn)嚴重的“馬賽克效應(yīng)”。
·不能對圖像內(nèi)容進行訪問、編輯和回放 。
·未充分利用HVS(人類視覺系統(tǒng))特性。
MPEG-4則是基于對象的新型壓縮編碼技術(shù),它利用了人眼視覺特性,適應(yīng)了多媒體信息的應(yīng)用由播放型轉(zhuǎn)向基于內(nèi)容的訪問、檢索及操作的發(fā)展趨勢,更適于交互AV服務(wù)以及遠程監(jiān)控。
AV對象(AVO,Audio Visual Object)是MPEG-4為支持基于內(nèi)容編碼而提出的重要概念。對象是指在一個場景中能夠訪問和操縱的實體。在MPEG-4中所見的視音頻已不再是過去MPEG-1、MPEG-2中圖像幀的概念,而是一個個視聽場景(AV場景),這些不同的AV場景由不同的AV對象組成。AV對象是聽覺、視覺、或者視聽內(nèi)容的表示單元,可以是自然的或合成的聲音、圖像。因此MPEG-4標準的基本內(nèi)容就是對AV對象進行高效編碼、組織、存儲與傳輸。AV對象的提出,使多媒體通信具有高度交互及高效編碼的能力,AV對象編碼就是MPEG-4的核心編碼技術(shù)。從而實現(xiàn)了從基于像素的傳統(tǒng)編碼向基于對象和內(nèi)容的現(xiàn)代編碼的轉(zhuǎn)變,因而引領(lǐng)著新一代智能圖像編碼的發(fā)展潮流。
在具體的技術(shù)方面,MPEG-4除采用第一代的視頻編碼的核心技術(shù),如變換編碼、運動估計與運動補償、量化、熵編碼外,還提出了一些新的關(guān)鍵技術(shù)。這些新的技術(shù)包括:
·對象提取技術(shù)-MPEG-4實現(xiàn)基于內(nèi)容交互的首要任務(wù)就是把視頻/圖像分割成不同對象或者把運動對象從背景中分離出來,然后針對不同對象采用相應(yīng)編碼方法,以實現(xiàn)高效壓縮。
·VOP技術(shù)-VOP(視頻對象平面)是視頻對象在某一時刻的采樣。VOP技術(shù)不僅克服了方塊效應(yīng),而且提高了壓縮比,實現(xiàn)了基于內(nèi)容的交互。
·編碼可分級技術(shù)-指碼率的可調(diào)整性,即視頻數(shù)據(jù)只壓縮一次,卻能以多個幀率、空間分辨率或視頻質(zhì)量進行解碼,從而可支持多種類型用戶的各種不同應(yīng)用要求。
MPEG系列標準中的每個標準都是建立在前面標準的基礎(chǔ)之上的。MPEG-1和MPEG-2是目前成熟的廣泛應(yīng)用的標準。多媒體數(shù)據(jù)壓縮編碼的發(fā)展趨勢是基于內(nèi)容的壓縮。MPEG-4第一次提出了基于內(nèi)容、基于對象的壓縮編碼思想,它要求對自然或合成視聽對象作更多分析甚至是理解,這正是信息處理的高級階段,因而代表了現(xiàn)代數(shù)據(jù)壓縮編碼技術(shù)的發(fā)展方向。MPEG-4作為一個開放的多媒體標準出現(xiàn)在市場上的確受到了廣大的矚目,所以為眾多的廠商所采用。