新選擇?開放媒體聯盟最近推出全新沉浸式音頻格式IAMF

早在兩三年前,流媒體巨頭Netflix宣布在電視上推出AV1編解碼器,當時,大家都好奇什麼是AV1?AV1是一種先進的編碼格式,與其他編解碼器進行了比較可發現,AV1的壓縮效率有了明顯的提高。從數字時代的第一個實用的視頻編碼標準H.261,到MPEG-2 / H.262成為DVD和標清數字電視的標準視頻格式,視頻編碼標準一直推動着電視高清化和數字媒體技術的發展。2013年,HEVC(High Efficiency Video Coding)視頻編碼標準的出現,相較於之前的AVC,視頻壓縮效率提高25-50%,帶寬需求更低。

Netflix是AV1編碼的早期測試用戶之一,用戶在使用Netflix App開啟節省流量功能時,部分節目將會啟用AV1編碼進行流傳輸,相比起原來使用的VP9,它可以節約不少的流量。但說到底,AV1編碼到底是誰開發出來的?AV1編碼是由開放媒體聯盟(Alliance for Open Media-AOMedia)組織開發的,AOMedia組織的目的是為互聯網提供開放、無使用費用的技術,成員有亞馬遜、思科、Google、Intel、微軟、Mozilla和Netflix。該聯盟旨在通過制定全新、開放、免版權費的視頻編碼標準和視頻格式,為下一代多媒體體驗創造新的機遇,AV1是開放媒體聯盟AOMedia開發的第一代視頻編碼標準。

回顧AOMedia和AV1

開放媒體聯盟(AOMedia)已經有八年的歷史了,它成立於2015年,是由谷歌發起的下一代編解碼器AV1的標準聯盟,Chair是AOmedia的現任副總裁。

AOMedia成立的意義在於,通過制定全新、開放、免版權費的視頻編碼標準和視頻格式,為下一代多媒體體驗創造新的機遇。作為VP9視頻編碼的繼任者,取代需要專利的HEVC視頻編碼。

2018年3月28日,AOMedia在官網上發佈AV1定稿的消息,並開放了相關規格和參考代碼,由此,掀起了一個新的時代。

顯而易見的是,AV1的硬件解碼器密集發佈、AV1軟件編碼器的開發和持續優化以及多個視頻播放平台陸續對AV1的支持,讓AV1的生態發展繁榮起來。2020年以來,AV1硬件生態得到顯着突破,加入了AV1硬件解碼器支持行列的企業有英特爾、英偉達等。也正是有了硬件支持,AV1編碼才算是真正擁有廣泛應用的基礎。硬件生態之外,就是YouTube、Bilibili等視頻內容公司來坐陣,得益於此,AV1視頻的內容量不斷增加

AOMedia已推出全新沉浸式音頻格式IAMF

不久前,AOMedia發佈了旗下首個沉浸式音頻規範IAMF,可以攜帶回放時間渲染算法和音頻混音的信息,而且和旗下的AV1視頻標準一樣為免版稅。

IAMF全稱為「Immersive Audio Model and Formats」,指沉浸式音頻模型和格式。IAMF是開源的,具有垂直聲道、基於人工智能的場景分析以及根據聆聽偏好靈活定製內容音頻等功能,該格式可用於流媒體、遊戲、虛擬現實和音樂電台。

據介紹,儘管3D音頻具有諸多優勢,但是受限於技術,長久以來它一直難以被應用於家用音頻設備中。工程師表示,當前來自影音內容的3D音頻信息無法被電視音箱或條形音箱(Soundbar)等家用音頻系統正確解讀,導致最終呈現出來的音頻體驗有限。

為此,AOMedia開發出了一種音頻解決方案。官方表示,IAMF是開放媒體聯盟採用的首個基於開放源碼的音頻技術標準,這意味着整個行業的企業或個人創作者都可採用這項技術並擴大使用範圍。官方稱,若設備製造商可以讀取3D音頻數據,便可調整音頻設備中的聲音,從而通過家中的標準電視揚聲器或音箱,也可以獲得「身臨其境」的音頻體驗。

IAMF三大特點

1、垂直表達聲音的能力

之前的開源音頻編解碼器僅支持水平聲音表達。藉助IAMF技術,音頻現在可以垂直表達,從而使聲音變得越來越多向。研究人員Nam解釋說:「IAMF允許聽眾聽到前方、後方或兩側以及上方或下方的音頻,從而使聲音更加真實,因此,當IAMF技術應用於家庭電視音箱和條形音箱時,聽眾可以在家裡的電視上聽到鳥兒從頭頂飛過的聲音。」

2、基於AI的場景分析和3D音頻效果

IAMF利用人工智能和深度學習技術來分析場景並強調內容的某些方面——調整音頻電平以在整個觀看體驗中增強聲音。在電視和電影中,某些場景的配樂或背景音樂是主要焦點,IAMF將平衡這些情況下的聲音。同樣,當有角色對話時,該技術會微調音頻,讓聽眾能夠專註於對話。此外,即使設備環境發生變化,IAMF技術也能提供最佳聲音。通過根據設備環境調整場景分析音頻數據,IAMF技術使聽眾能夠在標準家用電視上享受內容的原始音質。

3、高度定製的音頻

通過IAMF技術,用戶將能夠根據自己的喜好自由調節聲音。無論觀眾想要放大動作場景的音效還是增強對話,IAMF都可以讓他們靈活地定製內容音頻,以獲得更加個性化的體驗。據此,研究團隊目前正在開發IAMF技術的高級版本,該技術可應用於移動設備、元宇宙、視頻遊戲等不同領域。鑒於IAMF的成功,研究團隊有動力為消費者創造更好的音頻技術。每個團隊成員都分享了他們對3D音頻未來的渴望。

有何亮點

目前,AOMedia的成員中還包括Amazon、Meta、微軟、Netflix、騰訊、oppo、Vimeo等內容平台方,這些平台的選擇將很大程度決定IAMF的命運。此前,AV1的成功在於AOMedia把多媒體各個關鍵環節的企業拉到了一起。如今IAMF的出現會有何亮點?

首先,適用於所有設備的空間音頻,IAMF可以將基於通道和基於場景的全景聲空間音頻演示無縫傳送到包括耳機、流動電話、電視機、家庭影院和網絡在內的各種設備上。這種多功能性確保在各個平台上提供一致的高質量音頻體驗。

其次,靈活的音頻傳輸,IAMF提供了一種靈活的方法,可以將不同類型的音頻元素傳輸到終端設備上。無論是將3.1.2通道音頻與立體聲音頻相結合,IAMF都可以實現。IAMF提供了一種信號渲染算法(例如EAR和BEAR)的方式,以便在音箱布局和耳機中播放。

第三,AI驅動,IAMF利用人工智能和深度學習技術來分析場景,並突出內容的某些方面,調整音頻水平以增強整個觀看體驗中的聲音效果。使用IAMF技術,用戶將能夠根據自己的喜好自由調整聲音。無論觀眾想要增強動作場景的音效還是增強對話的清晰度,IAMF都為他們提供了自定義內容音頻的靈活性,以實現更個性化的體驗。

最後,創作者友好,創作者可以使用現有的開源插件,如EAR Production Suite,開始創建符合IAMF規範的沉浸式音頻內容,該插件包括多揚聲器布局和雙耳監控的渲染器。IAMF能夠攜帶並包含多個音頻混音配置,使創作者和用戶能夠根據不同的播放偏好進行可控的響度調整。在不久的將來,AOMedia開源參考軟件將添加一種IAMF編碼工具,用於將各種音頻混音壓縮為IAMF。

從AV1開始,AOMedia就在用開放來對抗老牌的標準組織ITU與ISO/IEC的HEVC、VVC等標準。目前,AV1已經成為主流視頻平台的主力標準,包括Netflix、Meta、蘋果等都在持續擴大AV1的應用部署。同樣,IAMF也自然成為對抗商業沉浸式音頻方案的主力。

目前,業界影響力最大的沉浸式音頻解決方案是杜比(Dolby Atmos),蘋果就採用了Dolby Atmos作為自身沉浸式音頻的解決方案。考慮到杜比在多媒體生產與消費領域擁有全方位的滲透,蘋果選擇杜比是順其自然的。此外,全景聲科技也是沉浸式音頻主要的解決方案商。

競爭性如何

IAMF是開放媒體聯盟採用的首個基於開放源碼的音頻技術標準,這意味着整個行業的企業或個人創作者都可採用這項技術並擴大使用範圍。拋開與其他視頻編碼格式的技術優劣對比,IAMF打上免版稅的標籤,已足夠讓它引人注目。據介紹,AOMedia對於聯盟的成員只提出了兩項義務:一是,對聯盟開發的每一項技術承諾免版稅的專利許可。但這並不意味着聯盟成員放棄了收取專利費的權利。如果某成員同時加入免版稅的AV1和收費的HEVC,對AV1免費授權,仍可以根據HEVC的標準收費。二是,繳納會員費,用於聘請負責專利評估的律師,審查加入聯盟的成員的專利。成立以來,AOMedia的成員基本上都是互聯網科技領域的頭部企業。目前,已有50多家企業成為聯盟成員。其中,華為、騰訊等中國公司是聯盟的創始成員。