【原创深度】高分辨率音频及便携式播放器的未来

作者:Benjamin Miller

声音的数字化捕捉及复制以供人类消费,这个历程已持续了几十年。有损压缩技术——减小文件尺寸使音乐更加便携的技术,使得年轻的一代更好地接纳一路随他们成长的MP3“退化的声音”。激光唱盘(CD)比MP3的音质更高。音频开发的另一面便是高分辨率、音质高于CD的音频。这种新的音质范式要比CD唱片(标准清晰度文件)更加清晰,并能提供更多的音乐空间。不管高分辨率音频是否已成为主流,当它发展得如MP3一样便捷的时候,越来越多的人便可以很快走向一个CD音质或标准清晰度音乐的“中间地带”。

尽管MP3的音质已被大众接纳,但音乐家、音频工程师和高保真音响爱好者对音质有更高的需求。自90年代初,当CD开始替代黑胶唱片和磁带接管市场时,听众一度对数字媒体是否能准确地捕捉现场音乐表演的重要品质存有争议。大部分持批评意见者将矛头指向严重有损便携式文件,虽然这些文件经过重度压缩后下载速度更快。音乐家和制作人则倾向于为便携式消费发行高分辨率音频文件。相比压缩文件格式存储音乐的方式,这已经是很大的改进,但它也超越了标准清晰度文件(CD文件)。CD音质并不限制音频分辨率,但优于CD的分辨率 (高清)造价昂贵,改进不佳,这是个问题,尤其是如果人们认为没有必要购买标准清晰度的音频时。

音质相关的考虑因素

想了解音频质量,必须首先理解两个主要考虑事项。第一便是采样率和位深度(请参阅文末术语栏的定义)。这两个规范都是在录制歌曲时进行确定。目前CD质量的标准是采样率44.1千赫(kHz)、位深度16位。

“”
图1:音频采样:蓝色点是红色模拟信号的样本。位深度垂直显示,采样率水平显示。图片来源:Wikipedia.org

另一个需要考虑的因素是文件压缩。音频文件的本机位率是每个音频通道(立体声是两个声道)的采样率和位深度的乘积。不过,文件的位率取决于其如何被压缩及编码。大多数音频文件都被压缩到一个便携设备上。通常,一个音频文件被压缩,并从一个巨大的波形音频文件(WAVE)(位率为每秒1411.4千比特),转换到一个类似MPS、Vorbis或无损音频解码器(FLAC)的较小的文件格式 (最大位率为320 kbps)。软件编码器进行压缩,每一次都使用不同的算法来决定哪些数据可以被删除,而不需要大幅改变音频。例如,128 kbps的Vorbis文件比同等位率的MP3音质要更好,因为Vorbis编码器使用了不同的算法来压缩文件。FLAC格式以有效无损压缩及不受许可成本限制而闻名,因此,它已或多或少成为大小合适且高质量音频的代名词。苹果公司有其自身开发的格式:用于iPod的有损压缩高级音频编码(AAC)(可与MP3媲美),用于Mac的无损压缩苹果无损音频编解码器 (可与FLAC媲美),以及音频交换文件格式(AIFF),即一种与WAVE相当的未压缩文件格式。

音质低劣的问题使得许多发烧友都不喜欢任何数字或便携的产品,而另一些人则一直鼓吹对旧音频进行重新采样,并以更高的音质进行发布。Neil Young的公司Pono首次对高清晰度、无损压缩的音乐进行了收费。Pono音乐播放器播放的是24位192kHz的 FLAC文件,位率范围是1411kbps到9216 kbps。CD通常是16位44.1 kHz。如今,大部分音乐都是高分辨率录制的,但数字录制仍是新领域,“数字大师”就以CD音质进行录制。“模拟大师”可以以所需的高分辨率音频规格从磁带转换到数字,但以16位44.1 kHz录制的音质并不能达到“Pono音质”的标准。如果高分辨率能满足年轻人的愿望,那更多的内容将需要以高分辨率录制。音乐产业已经开始为那些被认为是高分辨率的东西制定标准,但音乐爱好者们会认可吗?

“”
图2:Pono市场营销片Pono规格与其他音乐格式的比较

只有当消费者认为质量的提升值得付出额外的成本时,才会有更佳质量的内容产生。更高的质量需要更多的存储空间。64g(GB)内存的iPhone可以收纳大量256kbps MP3音乐,如果用户可以在播放器上下载更多的内容,他们似乎很乐意听压缩音乐。Pono播放器也有64 GB的内存,但平均为192 kHz 24位FLAC(Pono音质)的文件,约195兆字节(MB)左右。相对而言,44.1 kHz 16位的FLAC仅为6.7 MB。“Pono音质”音频作为无损CD音质文件占据了近30个空间。当然,数据存储造价越发便宜,且占据面积越来越小,所以对音频文件大小的担忧都只是暂时的。但就目前而言,这种在感知改善方面的小小提升需要占用昂贵的空间,对于大多数音乐播放器或智能手机来说则不实用。

像Pono这样的播放器还拥有专门的硬件,并声称“任何文件都将有更佳音质”。但这却大大提高了播放器的成本。Pono播放器目前售价为$399,且额外配置一副优质耳机费用$300,一副耳机放大器则$200,这样才可以从Pono商店($20)听到高清质量的专辑。但时间已经证明,发烧友对于高质量的音响系统愿意支付更多的费用。但如果他们花费了额外的费用,却听不出音质有何差别,则要另当别论。

高音质是否优于CD?

对于高清视频,在大屏幕上显示时,分辨率差异变得尤为明显,而高清音频并非如此。每样本位数越多,量化误差则越小。24位音频的优势主要凸显在音频工程师的工作中。在录制过程中,他们可以使用24位音频来对抗噪音,从而使音乐创作有更多的 “空间”。虽然听众几乎不会注意位深的增加,高采样率的优势也几乎没有凸显。应用一些工程原理,尼奎斯特定理认为,为准确采样信号,样本频率必须是源信号的两倍多。人类听力的极限是20 kHz,所以44.1 kHz是人类听力极限值的2倍。因此,理论上而言,它可以捕捉到人类能听到的最高的音调。这就是为何标准变成了CD音质,且更高的采样率只能捕捉听不清的频率。

出于各种原因,音频工程师可以使用更高的采样率。音调调整和速度调整便是案例。不过,他们通常会在控制过程中去除听不清的声音。因此,对于最终的听众而言,位率和采样率对声音带来的改进作用都是微小的。在仪器和那些听不清的频率之间,通过更高的位率降低背景噪音所获得额外 “空间”的成本是多少? Neil Young的高分辨率专辑额外收费$10。

这里的讨论当然不限于Pono播放器。随着存储成本越来越低,更多的人可能会转移到无损文件。问题的核心是:消费者选择了便利而不是质量。人们压缩音乐以便随身携带。消费者并未注意到,他们的压缩音乐听起来比CD音乐要糟。相比将高清音频文件推向消费者,Neil Young是否会努力说服人们在手机上使用无损压缩的CD文件,以此为音乐界提供更高的服务?许多消费者不再购买CD,因为从手机上下载音乐更加便利。将来,更好的压缩技术加之更快的网速,音乐爱好者可以更快速地下载FLAC,有损压缩业务将退出历史舞台。消费者可以在手机上拥有更优质的音乐,且不用额外支付费用。除了文件质量更佳,高质量硬件也将体现价值。据称,在便携式设备上,由于定制数据转换器,Pono的CD音质文件比CD播放器更好。抛开有关高分辨率的科学问题,这一事实让Pono在音频质量上赢得先机。在便携式设备上以CD音质播放相同数量的歌曲,使之听起来就如同立体音响系统,这是不错的体验。

说到音乐声,我们已经拥有了最好的音乐。购买高分辨率文件可能是一种浪费,因为设备本身不足以匹配更高清的文件,并且人耳分辨不出音质的差别。对于那些认为值得为高分辨率文件买单的人而言,许多播放器都是“金耳朵”。数字音频的最佳组成部分是,每个人都可以选择自己想要付费的音质,且现在,对于那些想要在口袋里装满更好保真音乐的人来说,有了更多的选择。

更多资讯,请点击Audio Applications site。该网站还有巴瑞•曼兹关于无线音频压缩的文章。

资源

1. http://www.digitaltrends.com/music/industries-unite-standard-definition-...
2. https://www.ponomusic.com/
3. http://dsd-guide.com/size-comparison-chart-various-formats-dsd-wav-flac-mp3
4. http://www.soundonsound.com/sound-advice/q-do-i-really-need-24-bit-recor...
5. https://xiph.org/~xiphmont/demo/neil-young.html

术语

模拟——根据不同的频率和振幅,音频以连续波形的形式呈现,由磁带和黑胶唱片捕获。声音的自然栖息地。

数字——音频以离散二进制样本的形式,被计算机捕获和存储。

采样率——通过模拟-数字转换器(ADC)采样或捕获每秒有多少次波形。一个样本捕获一个波的振幅(响度)。44.1 kHz是CD音质标准的采样率。

位深度——每个样本的大小。在实际操作中,每个样本所写的数据越多,样本所能捕捉到的精度就越高。类似于摄像机捕捉的像素的数量。位数越多,细节越多。CD标准是每个样本16位。

位率——每秒音频文件中写入的字节数。未压缩的位率是采样率与位深度的乘积(立体声的两倍)。未压缩的PCM(CD写入的格式)文件是每秒1411.4千比特(kbps)。对于压缩格式,位率根据需要的文件大小而不同,如:音质不佳的MP3是128 kbps,音质最佳的MP3是320 kbps。

压缩——音频文件尺寸最小化。这是通过音频编解码器完成的,它将文件转换成一种新的格式。Codec可以是无损或有损。

无损——音频文件压缩即所有原始数据都涵括在内,不需要为磁盘空间牺牲一些数据。例如,苹果的无损音频编解码器(ALAC)和免费无损音频编解码器(FLAC)。

有损——文件通过删除数据来压缩。有损codec使用算法移除人耳可以捕捉的一些数据,但是过多的压缩会使音频听起来不完整,如:MP3和Vorbis。

原文链接: http://www.mouser.com/applications/high-resolution-audio/

最新文章