AV1为何有信心打败H.265?

实时音视频 3373℃

今年一月的时候,开放媒体联盟(AOM,Alliance for Open Media)举行了董事会议,对AV1编解码器的发布日期进行了讨论,Netflix和YouTube能够在2018年初开始使用AV1。那么AV1究竟是什么?今天我们和大家聊聊AV1(全称:AOMedia Video 1)。

什么是AOM?

AOM(AOMedia)是一个非盈利的中立跨行业的开源联盟(非盈利的中立组织这个属性非常重要,下文有详解),这个联盟由半导体企业、视频点播供应商和网页浏览器开发商于2015年成立。AV1的目标是取代其前身VP9并与动态图像专家组(MPEG)的高效率视频编码(HEVC)以及第二代数字音视频编解码技术标准(AVS2)竞争。是作为H.265又名HEVC的竞争对手。

Open.Fast.Roytay-free. ULTRA High Definition是AOM联盟的宗旨
现在AOM的成员已经涵盖了Amazon、Cisco、Google、Intel、Microsoft、Mozilla、Netflix、AMD、ARM和 NVIDIA,它成立的目的是为互联网和其他市场创建一个开源的视频编解码器(AV1,AOMedia Video codec),这种会员制的建立预示了AV1可以被软硬件开发商迅速接纳,可以快速部署于Chrome、Internet Explorer和Firefox浏览器中,并被YOUTUBE和Netfilx两个顶级的优质内容发行商使用,从这个角度看,HEVC的前途有点暗淡。

什么是AV1?

AV1编解码器将是AOM发布的第一个视频编解码器,AOM的强力支持赋予了AV1巨大的竞争优势,这样可以确保在浏览器、移动设备、OTT和智能电视中及时部署AV1以及快速增加YouTube、Netflix和Amazon的AV1编码内容的发行。但是HEVC在硬件部署方面的多年集聚优势以及相关视频的专利权所有者也不会坐以待毙。

虽然最初的AV1实现将吸收Daala和Thor的一些特色,但是它的大部分代码来自于VP10,AOM的目标是使AV1的压缩性能比VP9/HEVC提高50%,允许合理地增加编码和播放的复杂度,AV1主要应用于UHD视频(包括更高的码率、更宽的色域和增加的帧率)并具有在相当快的计算机的浏览器上播放4K 60fps视频的能力,编解码器的基础版本和BT.2020的彩色空间一样将支持10bit和12bit编码,此外AV1还要为WebRTC(实时通信)提供编解码支持。

一旦AV1可以使用,YouTube希望将视频编解码器尽快转换为AV1,特别是对于UHD、HDR和高帧率视频,因为它们的编解码器需要实现比VP9更显著的带宽节省。

说白了,省钱。

就如Bitmovin的CEO(他们在研发能够同时适应 2D 和 3D 观看环境的流媒体传输技术,带宽消耗更甚)说的2018年的一个重点领域是优化带宽,以提高质量并降低CDN成本。这是每个内容提供商的一个重要工作。自从美国取消网络中立保护以来,这一点尤为重要。优化视频传输已经成为业界许多软件架构师的首要考虑事项。提高终端消费者的视频质量是一个重要的驱动因素,但数据使用和CDN成本仍然扮演重要角色。

为什么AV1会诞生?

第一省专利费,第二反垄断。

先说专利费,可能刚开始所有人都没有想到H.265的专利费使用会如此之高,授权政策如此复杂。举例HEVC Advance,收费范围广泛同时费用高到令人乍舌。电视、智能手机、流媒体播放器、机顶盒、游戏主机、数字媒体存储设备、监控设备等几乎所有的硬件终端以及Netflix、YouTube等内容提供商都需要付高昂的费用,虽然之前微微下调了一下,
但是杯水车薪。终端设备要缴纳0.2-1.2美元不等,封顶年费4000万美元。在内容方面,除了对终端用户提供免费内容的供应商外,其他内容提供商也要根据订阅数、节目数和媒体数收费,封顶年费500万美元。以此估算,每年需向三个专利池和Technicolor公司缴纳的H.265/HEVC专利许可封顶费用会超过1亿美元,鲜血淋漓。

再说垄断风险,H.265贵,谷歌趁机除了一个免费的VP9,坚持免费开源,同时解码难度相对更低。但风险点就在于如果VP9广泛面世,那么如此重要的国际标准就会被单个独立巨头垄断,未知风险非常大,可以说是被扼住咽喉。

但现实是,当下企业级市场,侧重点基本都以HEVC/H.265为主,很少看到基于VP9的产品面世,这其中最重要的理由就是,行业中绝大多数企业根本不愿意让这么重要的国际标准被一个独立的公司(谷歌)所控制。

AV1的诞生只能说明了哪里有压迫哪里就有反抗……大家思索再三,终于决心推出AV1,技术能pk,同时兼具免费开源,浏览器友好的各种优势,同时他的维护开发权是放在一个非盈利组织(AOM)中。

规范的重点在于使用的人越多越有价值,而获得扩散效应的直接手段就是结盟。音视频编解码这个级别技术比较复杂,硬件厂商和服务提供商需要大量的资金来支持一种新的技术。支持两个标准比支持一个标准所需的花费要多得多,所以厂商有强大的动力只主要支持一种协议。十年前的HD-DVD与Blu-ray之争几乎在一夜之间倒向Blu-ray,这种临界态就是网络扩散效应的正反馈机制导致的。

如果不结盟,面对HEVC每个公司都有巨大的压力去尽早加入HEVC,新规范即使技术优越也很难获得足够的支持而让人们去使用,比如ogg vs mp3。而一代某种编码规范占统治地位,要想取代它就需要不可忽视的巨大技术优势了,而这显然不是短期内能实现的。

AV1性能是否真的足够强悍?

由于多种原因,AV1与现有编解码器的性能不太容易比较,

以AV1由补充了很多测试功能的基本代码组成,这些测试功能可以默认开启或关闭,作为一个开源的编解码器,每一个公司都可以编辑自己的编解码器,选择需要开启的测试功能并设置他们自己的默认配置,因此与H.264、H.265和VP9类似,存在多种形式的AV1编解码器。

根据Streaming Media East中的一个报告,图1给出了Bitmovin AV1编解码器和VP9、x.265、MainConcept以及x.264的性能对比,从总体的平均值来看,Bitmovin AV1编解码器是最好的。

不得不提的是,AV1发展道路上也是阻力重重,硬件适配的滞后所有人都能理解,同时H.265的专利方和相关视频版权所有者也不会坐以待毙。

附上一张音视频编解码历史小图:

以上文章信息参考来源:

https://en.wikipedia.org/wiki/AOM

AV1

https://www.zhihu.com/question/54731561/answer/226428994

Alliance for Open Media – An Alliance of Global Technology Visionaries https://aomedia.org/

https://www.cnet.com/news/facebook-av1-video-technology-speeds-streaming/

另外,想要获取更多产品干货、技术干货,点击“阅读原文”关注网易云信博客。


网易云信(NeteaseYunXin)是集网易18年IM以及音视频技术打造的PaaS服务产品,来自网易核心技术架构的通信与视频云服务,稳定易用且功能全面,致力于提供全球领先的技术能力和场景化解决方案。开发者通过集成客户端SDK和云端OPEN API,即可快速实现包含IM、音视频通话、直播、点播、互动白板、短信等功能。