在上次對MPEG-2的學(xué)習(xí)整理中,有一個疑惑,雙聲道理解,就是左右立體聲,但是5.1聲道是什么?我們經(jīng)常看到杜比5.1聲道的說法。“0.1”聲道具體指什么?今天去wiki查了一下,相關(guān)內(nèi)容也整理入我們的學(xué)習(xí)筆記。本文檔資料來源:
5.1聲道
使用杜比數(shù)字技術(shù)下,最標(biāo)準(zhǔn)常用的是5.1聲道設(shè)置,但杜比數(shù)字容許一系列不同聲道的選擇。全部可供選擇的聲道如下列所示:
以上所有這些設(shè)置可選擇性地使用低頻效果和杜比數(shù)字EX矩陣編碼中加入附加后環(huán)繞聲道。杜比編碼技術(shù)是向下兼容的,很多杜比播放器/解碼器均備有向下混音作用是發(fā)布不同聲道至可供使用的揚聲器。這包括一些功能例如聲音數(shù)據(jù)通過前揚聲器播放(如適用),和當(dāng)中央揚聲器不適用時發(fā)布中央頻道至左或右揚聲器?;虍?dāng)用戶只有2.0喇叭時,杜比解碼器能把多聲道信號混音編碼為2.0立體聲。
在5.1, 7.1 或其他等文字中,'.1'指的是低頻LFE聲道。
其實5.1聲道就是使用5個喇叭和1個超低音揚聲器來實現(xiàn)一種身臨其境的音樂播放方式,它是由杜比公司開發(fā)的,所以叫做“杜比5.1聲道”。在5.1聲道系統(tǒng)里采用左(L)、中(C)、右(R)、左后(LS)、右后(RS)五個方向輸出聲音,使人產(chǎn)生猶如身臨音樂廳的感覺。五個聲道相互獨立,其中“.1”聲道,則是一個專門設(shè)計的超低音聲道。正是因為前后左右都有喇叭,所以就會產(chǎn)生被音樂包圍的真實感。如右圖所示。
MPEG-4
總體介紹
MPEG-4是一套用于音頻、視頻信息的壓縮編碼標(biāo)準(zhǔn),由國際標(biāo)準(zhǔn)化組織(ISO) 和國際電工委員會(IEC)下屬的“動態(tài)影像專家組”(Moving Picture ExpertsGroup,即MPEG) 制定,第一版在1998年10月通過,第二版在1999年12月通過。MPEG-4格式的主要用途在於網(wǎng)上流媒體、光碟、語音傳送(視訊電話),以及電視廣播。MPEG-4作為ISO/IEC 14496正式發(fā)布。ISO/IEC 14496-Coding ofaudio-visual object (AV對象編碼)。
為了應(yīng)對網(wǎng)絡(luò)傳輸?shù)拳h(huán)境,傳統(tǒng)的 MPEG-1/2 已經(jīng)不能適應(yīng),所以促使了 MPEG-4 的誕生。 與MPEG-1和MPEG-2相比,MPEG-4的特點是其更適于交互AV服務(wù)以及遠程監(jiān)控。MPEG-4是第一個使你由被動變?yōu)橹鲃?不再只是觀看,允許你加入其中,即有交互性)的動態(tài)圖像標(biāo)準(zhǔn),它的另一個特點是其綜合性。從根源上說,MPEG-4試圖將自然物體與人造物體相溶合(視覺效果意義上的)。MPEG-4的設(shè)計目標(biāo)還有更廣的適應(yīng)性和更靈活的可擴展性。MPEG-4 采用了一系列新技術(shù),來滿足在低帶寬下傳輸較高視頻質(zhì)量的需求。DivX,XviD,MS MPEG4 都是采用的 MPEG-4 視頻編碼,除了在 DVDRip 上面的應(yīng)用,3GPP 現(xiàn)在也接納了 MPEG-4 作為視頻編碼方案。
最初MPEG-4的主要目的是用于低比特率下的視頻通信,但是作為一個多媒體的編碼標(biāo)準(zhǔn),它的范圍最后得到了擴展。在技術(shù)方面MPEG-4允許不同的軟件/硬件開發(fā)商創(chuàng)建多媒體對象來提供更好的適應(yīng)性、靈活性,為數(shù)字電視,動態(tài)圖像,互聯(lián)網(wǎng)等業(yè)務(wù)提供更好的質(zhì)量。
MPEG-4提供范圍從每秒幾k比特到每秒數(shù)十兆比特的,它具有下面功能:
MPEG-4視頻編碼核心思想
在MPEG-4制定之前,MPEG-1、MPEG-2、H.261、H.263都是采用第一代壓縮編碼技術(shù),著眼于圖像信號的統(tǒng)計特性來設(shè)計編碼器,屬于波形編碼的范疇。第一代壓縮編碼方案把視頻序列按時間先后分為一系列幀,每一幀圖像又分成宏塊以進行運動補償和編碼,這種編碼方案存在以下缺陷:
MPEG-4則代表了基于模型/對象的第二代壓縮編碼技術(shù),它充分利用了人眼視覺特性,抓住了圖像信息傳輸?shù)谋举|(zhì),從輪廓、紋理思路出發(fā),支持基于視覺內(nèi)容的交互功能,這適應(yīng)了多媒體信息的應(yīng)用由播放型轉(zhuǎn)向基于內(nèi)容的訪問、檢索及操作的發(fā)展趨勢。
AV對象(AVO,Audio VisualObject)是MPEG-4為支持基于內(nèi)容編碼而提出的重要概念。對象是指在一個場景中能夠訪問和操縱的實體,對象的劃分可根據(jù)其獨特的紋理、運動、形狀、模型和高層語義為依據(jù)。在MPEG-4中所見的視音頻已不再是過去MPEG-1、MPEG-2中圖像幀的概念,而是一個個視聽場景(AV場景),這些不同的AV場景由不同的AV對象組成。AV對象是聽覺、視覺、或者視聽內(nèi)容的表示單元,其基本單位是原始AV對象,它可以是自然的或合成的聲音、圖像。原始AV對象具有高效編碼、高效存儲與傳輸以及可交互操作的特性,它又可進一步組成復(fù)合AV對象。因此MPEG-4標(biāo)準(zhǔn)的基本內(nèi)容就是對AV對象進行高效編碼、組織、存儲與傳輸。AV對象的提出,使多媒體通信具有高度交互及高效編碼的能力,AV對象編碼就是MPEG-4的核心編碼技術(shù)。
MPEG-4實現(xiàn)基于內(nèi)容交互的首要任務(wù)就是把視頻/圖像分割成不同對象或者把運動對象從背景中分離出來,然后針對不同對象采用相應(yīng)編碼方法,以實現(xiàn)高效壓縮。因此視頻對象提取即視頻對象分割,是MPEG-4視頻編碼的關(guān)鍵技術(shù),也是新一代視頻編碼的研究熱點和難點。
MPEG-4不僅可提供高壓縮率,同時也可實現(xiàn)更好的多媒體內(nèi)容互動性及全方位的存取性,它采用開放的編碼系統(tǒng),可隨時加入新的編碼算法模塊,同時也可根據(jù)不同應(yīng)用需求現(xiàn)場配置解碼器,以支持多種多媒體應(yīng)用。
MPEG-4各部分
MPEG-4由一系列的子標(biāo)準(zhǔn)組成,被稱為部,包括以下的部分。對于媒體編解碼,重點關(guān)注Part2, Part 3, Part 10。
第一部(ISO/IEC 14496-1):系統(tǒng)
描述視訊和音訊的同步以及混合方式(Multiplexing,簡寫為MUX)。定義了 MP4 容器格式, 支持類似 DVD 菜單這樣的直觀和互動特性等。
第二部(ISO/IEC 14496-2):視頻
定義了一個對各種視覺信息(包括視訊、靜止紋理、計算機合成圖形等等)的編解碼器。對視訊部分來說,眾多”Profiles”中很常用的一種是Advanced Simple Profile (ASP),例如XviD編碼就屬于MPEG-4 Part 2。包括 3ivx, DivX4/Project Mayo, DivX 5, Envivio,ffmpeg/ffds, mpegable, Nero Digital, QuickTime, Sorenson, XviD 等常見的視頻格式,需要注意的是 Divx 3.11, MS MPEG-4, RV9/10, VP6, WMV9 并不屬于標(biāo)準(zhǔn)的 MPEG-4 標(biāo)準(zhǔn)。
第三部(ISO/IEC 14496-3):音頻
定義了一個對各種音訊信號進行編碼的編解碼器的集合。包括高級音訊編碼(Advanced Audio Coding,縮寫為AAC) 的若干變形和其他一些音頻/語音編碼工具。即 AAC 音頻標(biāo)準(zhǔn), 包括 LCAAC, HE AAC 等, 支持 5.1 聲道編碼, 可以用更低的碼率實現(xiàn)更好的效果 (相對于 MP3, OGG 等)。
第四部(ISO/IEC 14496-4):一致性
定義了對本標(biāo)準(zhǔn)其他的部分進行一致性測試的程序。
第五部(ISO/IEC 14496-5):參考軟件
提供了用于演示功能和說明本標(biāo)準(zhǔn)其他部分功能的軟件。
第六部(ISO/IEC 14496-6):多媒體傳輸集成框架
即DMIF:Delivery Multimedia Integration Framework
第七部(ISO/IEC 14496-7):優(yōu)化的參考軟件
提供了對實現(xiàn)進行優(yōu)化的例子(這裡的實現(xiàn)指的是第五部分)。
第八部(ISO/IEC 14496-8):在IP網(wǎng)絡(luò)上傳輸
定義了在IP網(wǎng)絡(luò)上傳輸MPEG-4內(nèi)容的方式。
第九部(ISO/IEC 14496-9):參考硬件
提供了用于演示怎樣在硬件上實現(xiàn)本標(biāo)準(zhǔn)其他部分功能的硬件設(shè)計方案。
第十部(ISO/IEC 14496-10):進階視頻編碼,也即ITU H.264,常寫為H.264/AVC
或稱高級視頻編碼(Advanced VideoCoding,縮寫為AVC):定義了一個視頻編解碼器(codec),AVC和XviD都屬于MPEG-4編碼,但由于AVC屬于MPEG-4Part 10,在技術(shù)特性上比屬于MPEG-4 Part2的XviD要先進。另外從技術(shù)上講,它和ITU-TH.264標(biāo)準(zhǔn)是一致的,故全稱為MPEG-4 AVC/H.264。
第十一部(ISO/IEC 14496-11):場景描述和應(yīng)用引擎
可用于多種profile(包括2D和3D版本)的互交互媒體。修訂了MPEG-4 Part1:2001以及Part1的兩個修訂方案。它定義了應(yīng)用引擎(交付,生命周期,格式,可下載Java字節(jié)代碼應(yīng)用程序的行為),二進制場景格式(BIFS:Binary Format forScene),可擴展MPEG-4文本格式(一種使用XML描述MPEG-4多媒體內(nèi)容的文本格式)系統(tǒng)level表述。也就是MPEG-4Part21中的BIFS,XMT,MPEG-J。
第十二部(ISO/IEC 14496-12):基于ISO的媒體文件格式
定義了一個存儲媒體內(nèi)容的文件格式。
第十三部(ISO/IEC 14496-13):IP
知識產(chǎn)權(quán)管理和保護(IPMP for Intellectual Property Management and Protection)拓展。
第十四部(ISO/IEC 14496-14):MPEG-4文件格式
定義了基于第十二部分的用于存儲MPEG-4內(nèi)容的視訊檔案格式。
第十五部(ISO/IEC 14496-15):AVC文件格式
定義了基于第十二部分的用于存儲第十部分的視頻內(nèi)容的文件格式。
第十六部(ISO/IEC 14496-16):動畫框架擴展
動畫框架擴展(AFX : Animation Framework eXtension)。
第十七部(ISO/IEC 14496-17):同步文本字幕格式
尚未完成-2005年1月達成”最終委員會草案”,F(xiàn)CD: Final Committee Draft。
第十八部(ISO/IEC 14496-18):字體壓縮和流式傳輸(針對公開字體格式)。
第十九部(ISO/IEC 14496-19):綜合用材質(zhì)流(Synthesized Texture Stream)。
第二十部(ISO/IEC 14496-20):簡單場景表示
LASeR for Lightweight Scene Representation,尚未完成-2005年1月達成”最終委員會草案”,F(xiàn)CD for Final Committee Draft。
第二十一部(ISO/IEC 14496-21):用于描繪(Rendering)的MPEG-J拓展
尚未完成-2005年1月達成“委員會草案”,CD for Committee Draft)。
Profile和Level
MPEG-4提供大量的編碼方式和豐富的設(shè)置。和MPEG-2一樣,應(yīng)用一般不可能支持MPEG-4全集,通過profile和level來描述子集。這些子集,通過“profile”來表明解碼器要求,為了避免計算的復(fù)雜,每個profile都有一個或者多個“level”。profile和level的有效組合使得編碼生成器只需實現(xiàn)標(biāo)準(zhǔn)中所需的子集,同時保持與其他MPEG-4設(shè)備的互通。(解碼支持范圍通常比編碼支持范圍大),檢查其他MPEG-4設(shè)備是否符合標(biāo)準(zhǔn),即一致性測試。
對于H.264/AVC(也就是MPEG-4 Part 4)提供下面的profile:
Feature support in particular profiles
Feature | CBP | BP | XP | MP | HiP | Hi10P | Hi422P | Hi444PP |
---|---|---|---|---|---|---|---|---|
B slices | No | No | Yes | Yes | Yes | Yes | Yes | Yes |
SI and SP slices | No | No | Yes | No | No | No | No | No |
Flexible macroblock ordering (FMO) | No | Yes | Yes | No | No | No | No | No |
Arbitrary slice ordering (ASO) | No | Yes | Yes | No | No | No | No | No |
Redundant slices (RS) | No | Yes | Yes | No | No | No | No | No |
Data partitioning | No | No | Yes | No | No | No | No | No |
Interlaced coding (PicAFF, MBAFF) | No | No | Yes | Yes | Yes | Yes | Yes | Yes |
CABAC entropy coding | No | No | No | Yes | Yes | Yes | Yes | Yes |
8×8 vs. 4×4 transform adaptivity | No | No | No | No | Yes | Yes | Yes | Yes |
Quantization scaling matrices | No | No | No | No | Yes | Yes | Yes | Yes |
Separate Cb and Cr QP control | No | No | No | No | Yes | Yes | Yes | Yes |
Monochrome (4:0:0) | No | No | No | No | Yes | Yes | Yes | Yes |
Chroma formats | 4:2:0 | 4:2:0 | 4:2:0 | 4:2:0 | 4:2:0 | 4:2:0 | 4:2:0/4:2:2 | 4:2:0/4:2:2/4:4:4 |
Sample depths (bits) | 8 | 8 | 8 | 8 | 8 | 8 to 10 | 8 to 10 | 8 to 14 |
Separate color plane coding | No | No | No | No | No | No | No | Yes |
Predictive lossless coding | No | No | No | No | No | No | No | Yes |
level用來表明一個profile的解碼器的性能要求的范圍,例如最大圖片分配了,幀頻,比特率等等。對于解碼器,一個指定的level要求可以對該level以及低于該level的碼流進行解碼。(A decoderthat conforms to a given level is required to be capable of decoding allbitstreams that are encoded for that level and for all lower levels.來源:http://en.wikipedia.org/wiki/H.264/MPEG-4_AVC)
Levels with maximum property values
Level | Max macroblocks | Max video bit rate (VCL) | Examples for high resolution @ frame rate (max stored frames) | ||||
---|---|---|---|---|---|---|---|
per second | per frame | BP, XP, MP (kbit/s) | HiP (kbit/s) | Hi10P (kbit/s) | Hi422P, Hi444PP (kbit/s) | ||
1 | 1,485 | 99 | 64 | 80 | 192 | 256 | 128×96@30.9 (8) 176×144@15.0 (4) |
1b | 1,485 | 99 | 128 | 160 | 384 | 512 | 128×96@30.9 (8) 176×144@15.0 (4) |
1.1 | 3,000 | 396 | 192 | 240 | 576 | 768 | 176×144@30.3 (9) 320×240@10.0 (3) 352×288@7.5 (2) |
1.2 | 6,000 | 396 | 384 | 480 | 1,152 | 1,536 | 320×240@20.0 (7) 352×288@15.2 (6) |
1.3 | 11,880 | 396 | 768 | 960 | 2,304 | 3,072 | 320×240@36.0 (7) 352×288@30.0 (6) |
2 | 11,880 | 396 | 2,000 | 2,500 | 6,000 | 8,000 | 320×240@36.0 (7) 352×288@30.0 (6) |
2.1 | 19,800 | 792 | 4,000 | 5,000 | 12,000 | 16,000 | 352×480@30.0 (7) 352×576@25.0 (6) |
2.2 | 20,250 | 1,620 | 4,000 | 5,000 | 12,000 | 16,000 | 352×480@30.7(10) 352×576@25.6 (7) 720×480@15.0 (6) 720×576@12.5 (5) |
3 | 40,500 | 1,620 | 10,000 | 12,500 | 30,000 | 40,000 | 352×480@61.4 (12) 352×576@51.1 (10) 720×480@30.0 (6) 720×576@25.0 (5) |
3.1 | 108,000 | 3,600 | 14,000 | 17,500 | 42,000 | 56,000 | 720×480@80.0 (13) 720×576@66.7 (11) 1280×720@30.0 (5) |
3.2 | 216,000 | 5,120 | 20,000 | 25,000 | 60,000 | 80,000 | 1,280×720@60.0 (5) 1,280×1,024@42.2 (4) |
4 | 245,760 | 8,192 | 20,000 | 25,000 | 60,000 | 80,000 | 1,280×720@68.3 (9) 1,920×1,080@30.1 (4) 2,048×1,024@30.0 (4) |
4.1 | 245,760 | 8,192 | 50,000 | 62,500 | 150,000 | 200,000 | 1,280×720@68.3 (9) 1,920×1,080@30.1 (4) 2,048×1,024@30.0 (4) |
4.2 | 522,240 | 8,704 | 50,000 | 62,500 | 150,000 | 200,000 | 1,920×1,080@64.0 (4) 2,048×1,080@60.0 (4) |
5 | 589,824 | 22,080 | 135,000 | 168,750 | 405,000 | 540,000 | 1,920×1,080@72.3 (13) 2,048×1,024@72.0 (13) 2,048×1,080@67.8 (12) 2,560×1,920@30.7 (5) 3,680×1,536@26.7 (5) |
5.1 | 983,040 | 36,864 | 240,000 | 300,000 | 720,000 | 960,000 | 1,920×1,080@120.5 (16) 4,096×2,048@30.0 (5) 4,096×2,304@26.7 (5) |