流媒体|音频格式指南:MP3、M4A、AAC、FLAC 是什么?

流媒体|音频格式指南:MP3、M4A、AAC、FLAC 是什么?

文章图片

流媒体|音频格式指南:MP3、M4A、AAC、FLAC 是什么?

文章图片

流媒体|音频格式指南:MP3、M4A、AAC、FLAC 是什么?

文章图片

流媒体|音频格式指南:MP3、M4A、AAC、FLAC 是什么?

文章图片

流媒体|音频格式指南:MP3、M4A、AAC、FLAC 是什么?

文章图片


本指南将涵盖当今音频流服务使用的一些最流行的格式 , 并解释它们的区别 。
什么是音频文件格式?
数字音频文件是记录内容如何保存在计算机、媒体播放器、智能手机或其他设备上的方式 。 在最基本的层面上 , 数字音频是设备可以用来重现声波的一系列数字 。 有多种方法可以完成此操作 , 然后压缩(或不压缩)结果数据 。 我们知道 , 通过在从模数转换到 44.1kHz 的至少 16 位的过程中对声波进行采样 , 我们可以在以后再次完美地再现捕获的信号 。 这要归功于称为Nyquist-Shannon 采样定理的一些数学运算 。 我们可以实现更高的比特率和频率范围 , 但是否有人能听到差异——即使是最好的耳机——充其量也是值得商榷的 。

如果我们只是按原样保存该数据(称为脉冲编码调制或 PCM) , 则该文件会占用大量空间 。 这就是开发有损和无损音频压缩形式的原因 。 有损音频会抛出我们耳朵听不到的音频频率 , 而无损音频则会保留它们 。 有损音频格式还可以使用其他技巧来进一步压缩音频 , 我们稍后会介绍 。
因为如今大多数人通过流媒体服务访问他们的音乐 , 所以压缩的有损文件格式是分发内容的主要方式 。 随便听也没关系 , 但有些人要求最高质量 。 因此 , 现在可以使用越来越多的高质量甚至无损流媒体选项 。 但是 , 如下图所示 , 有损格式占用的空间更少 , 消耗的移动数据也更少 , 这是无法回避的事实 。
MP3
在下载音乐时 , MP3 音频文件格式曾经是至高无上的 。 事实上 , 这种格式是移动音乐解决方案的代名词 , 以至于“MP3 播放器”现在是音频播放设备的通用格式 。 但是 , 由于各种原因 , 如今它已不那么突出了 。 不过 , 它仍在继续 。 了解 MP3 文件也可以帮助我们更轻松地了解其他格式 , 所以我们将从这里开始 。
MP3 文件是有损音频文件 , 这意味着它会丢弃我们耳朵听不到的数据 。 几乎每个人的听力范围都在 2oHz 到 20kHz 之间 。 上限实际上随着年龄的增长而降低 , 但一般来说 , 这是你听到的每一种噪音的范围内的谎言 。 因为我们知道其他频率因此是多余的 , 所以 MP3 会丢弃此范围之外的所有频率 。

为了进一步节省一些空间 , MP3 文件使用了更多的技巧 。 音频工程师使用基于人耳和大脑心理声学效应的噪声整形算法来去除我们不应该听到的部分音乐 。 例如 , 大脑无法区分相邻的两个频率 。 此外 , 成年人的耳朵很难识别高频声音的方向 。 它在 16kHz 以上也开始失去灵敏度 。 另外 , 响亮的声音可以掩盖更安静的声音 。 所有这些都可以删除 , 最终听众几乎没有明显的区别 。
基本上 , MP3 文件会删除我们听不到的频率和我们可以单独听到的频率 , 但不能因为它们在特定歌曲中的组合方式 。
MP3 将轨道分成 576 个样本帧 , 并使用快速傅里叶变换 (FFT)从这些帧中获取频率数据 。 然后分析频率数据以查看是否存在任何机会来应用如上所述的基于人类听力的压缩规则 。 如果是这样 , 则将这些部分向下舍入(量化)以降低比特率 , 这有助于节省空间 。 有关如何将每个帧恢复为其完整声波表示的数据将保存到 32 位标头中 。

比特率决定了每帧允许的最大文件大小 。 压缩越激进 , 算法就越有可能删除可听得见的东西 。 此外 , 这种类型的过滤和切割并不完美 , 量化可能会留下一些人可以听到的伪影 。 这种有损心理声学压缩之后是类似于 .zip 文件的无损Huffman 编码压缩 , 以节省更多空间 。
如果这听起来太复杂 , 那么 MP3 文件会删除我们听不到的频率以及我们理论上可以单独听到的频率 , 但由于听觉掩蔽而不能在特定歌曲中听到 。 这可能会导致文件非常小 。 但是 , 如果它过于激进或比特率太低 , 质量可能会受到影响 。 因此 , MP3 对于流媒体来说不再那么流行了 。