В чем разница между MP3, FLAC и другими аудиоформатами?


Цифровой звук существует очень давно, за это время было создано множество аудиоформатов. В этой статье мы рассмотрим некоторые из наиболее распространённых, что отличает их и для чего их использовать.

Прежде чем мы поговорим о повседневных аудиоформатах, важно, чтобы вы поняли основы, а это означает понимание PCM. После этого займёмся сжатыми форматами.

Аудио PCM: с чего всё начиналось

Импульсно-кодовая модуляция была создана ещё в 1937 году и является наиболее близким приближением к аналоговому звуку. То есть аналоговый сигнал аппроксимируется через равные промежутки времени. PCM характеризуется двумя свойствами: частотой дискретизации и битовой глубиной. Частота дискретизации измеряет, как часто (раз в секунду) берётся амплитуда сигнала, а битовая глубина измеряет возможные цифровые значения. Что касается аудиоформатов, то в практическом плане это основа всего.


Настоящий звук в реальном мире непрерывен. В цифровом мире это не так. Почему-то это больше запутывает со звуком, чем с видео, поэтому давайте посмотрим на видео как на точку сравнения. То, что мы интерпретируем как «движение» или думаем о «текучем» и постоянном движении, на самом деле является серией неподвижных изображений. Точно так же амплитуда звуковых волн в цифровом формате не является «подвижной» или постоянно меняющейся. Он меняется на основе определенным критериев с заранее заданными интервалами.

Я знаю, что это ещё не до конца понятно, если вы не инженер, физик или аудиофил, так что давайте продолжим аналогию.

Предположим, что вода, текущая из открытого крана, является вашим «аналоговым» источником звука. Температуру воды мы можем сравнить с амплитудой звуковой волны; это свойство, которое необходимо измерить, чтобы вы могли наслаждаться им должным образом. Выборка — это количество раз в секунду, когда вы опускаете палец в проточную воду. Чем чаще вы окунаете в него палец, тем более «непрерывными» становятся измерения (и изменения) температуры. Если вы погружаете палец в проточную воду 44 100 раз в секунду, это почти то же самое, что держать палец под ней все время, верно? Это основная идея дискретизация (sampling).

Битовая глубина немного сложнее. Вместо того чтобы использовать свой палец, скажем, вы использовали действительно дрянной термометр. По сути, он говорил «Горячий» для всего, что выше комнатной температуры, и «Холодный» для всего, что ниже. Независимо от того, сколько раз вы погружали его в воду, он не даст вам много полезной информации. Теперь, если вместо двух вариантов, скажем, у термометра было 16 возможных значений, которые вы могли бы использовать для измерения температуры воды. Полезнее, правда? Битовая глубина работает таким же образом, поскольку более высокие значения позволяют более точно отображать динамические изменения амплитуды звука. Значение 16 в отношение звука не означает, что имеется всего 16 вариантов, в отношении звука это означает что-то вроде 16 ячеек памяти, которые могут хранить много информации.

Как упоминалось ранее, PCM, наряду с его вариантами, является основой для цифрового звука. PCM пытается смоделировать форму звуковой волны в максимальном приближении к действительности. Он особенный, он готов к подключению к цифровому сигнальному процессору, и он более или менее универсальны для воспроизведения электронными средствами. Большинство других форматов манипулируют звуком с помощью алгоритмов, поэтому их необходимо декодировать во время воспроизведения. Звук PCM считается «без потерь» (lossless), он несжатый и, следовательно, занимает много места на жёстком диске.

Форматы аудио без сжатия: WAV, AIFF

И WAV, и AIFF представляют собой форматы аудиоконтейнеров без потерь (lossless), основанные на PCM, с некоторыми незначительными изменениями в хранении данных. Аудио PCM для большинства людей поставляется в этих форматах, в зависимости от того, используете ли вы Windows или OS X, и их можно конвертировать друг в друга без ухудшения качества. Оба они также хранят звук «без потерь» данных, то есть качества. Несжатые, стереофонический (2-канальный) аудиофайл PCM, дискретизированный с частотой 44,1 кГц (или 44 100 раз в секунду) при 16 битах («качество компакт-диска»), занимает примерно 10 МБ на каждую минуту аудио. Если вы записываете дома для миксирования, это то, что вам нужно, потому что это полное качество.

Форматы без потерь: FLAC, ALAC, APE

Free Lossless Audio Codec, Apple Lossless Audio Codec и Monkey’s Audio — все форматы, которые сжимают звук почти так же, как всё сжимается в цифровом мире: с использованием алгоритмов. Разница между заархивированными файлами и файлами FLAC заключается в том, что FLAC разработан специально для аудио и поэтому имеет лучшую степень сжатия без потери данных. Как правило, вы видите примерно половину размера WAV. То есть файл FLAC для стереозвука с «качеством компакт-диска» занимает примерно 5 МБ в минуту.

Положительным моментом является то, что если вы хотите манипулировать звуком, вы можете конвертировать обратно в WAV без потери качества. Если вы меломан и слушаете много музыки с динамическим диапазоном, эти форматы для вас. Если у вас есть отличные динамики или наушники, эти форматы сумеют воспроизвести тона, которые могли бы потеряться в сжатом с потерями аудио.


Смотрите также: Что такое «lossless» аудио без потерь?

Форматы с потерями: MP3, AAC, WMA, Vorbis

Большинство форматов, которые вы видите в повседневном использовании, «с потерями» (lossy); некоторая степень качества звука приносится в жертву в обмен на значительное увеличение размера файла. Средний MP3 «CD-качества» работает со скоростью около 1 МБ в минуту. Большая разница по сравнению с PCM, не так ли? Это называется сжатием, но, в отличие от форматов без потерь, вы не сможете вернуть это качество после того, как отбросите его при конвертировании в формат с потерями. Различные форматы с потерями используют разные алгоритмы для хранения данных, поэтому они обычно различаются по размеру файла для сопоставимого качества. Форматы с потерями также используют битрейт для обозначения качества звука, который обычно выглядит как «192 кбит/с», «192 kbit/s» или «192 kbps». Более высокие числа означают, что выгружается больше данных, поэтому сохраняется больше деталей. Вот некоторые подробности для более популярных форматов.

  • MP3: MPEG 1 Audio Layer 3, наиболее распространённый сегодня аудиокодек с потерями. Несмотря на кучу проблем с патентами, он по-прежнему невероятно популярен. У кого из нас нет MP3 файлов?
  • Vorbis: бесплатный формат с потерями с открытым исходным кодом, который чаще всего используется в компьютерных играх, таких как Unreal Tournament 3.
  • AAC: Advanced Audio Coding, стандартизированный формат, который теперь используется с видео MPEG4. Он широко поддерживается из-за совместимости с DRM (например, Apple FairPlay), его улучшений по сравнению с mp3, а также из-за того, что для потоковой передачи или распространения контента в этом формате не требуется лицензия.
  • WMA: Windows Media Audio, аудиоформат Microsoft с потерями. Он был разработан и использовался, чтобы избежать проблем с лицензированием формата MP3, но из-за значительных улучшений и совместимости с DRM, а также реализации без потерь, он все ещё существует. Он был очень популярен до того, как iTunes стал чемпионом музыки с DRM.

Форматы с потерями являются повсеместными, если пользователь сознательно не выбрал lossless, то скорее всего он использует тот или иной формат с потерями для всего, что слушает и сохраняет. Форматы с потерями предназначены для экономии места на жёстком диске. Какой формат вы выберете, зависит от того, какой цифровой аудиоплеер вы используете, сколько места у вас есть, насколько вы придирчивы и множества других переменных. В настоящее время компьютеры воспроизводят что угодно, большинство аудиоплееров (кроме Apple, конечно) поддерживают несколько форматов с потерями, и все больше и больше поддерживают FLAC и APE. Apple придерживается MP3, ALAC и AAC.

Разве качество звука не субъективно?

Абсолютно так. Относительно небольшое количество пользователей слышит (или думает что слышит) разницу между MP3 со скоростью 320 кбит/с и FLAC. С другой стороны, и разница в размерах занимаемого файлами этих форматов уже тоже невелика.

При использовании форматов с потерями на высоких битрейтах или форматы без потерь, определяющим в качестве звука становится воспроизводящая аппаратура: динамики или наушники.


Добавить комментарий

Ваш адрес email не будет опубликован.

wp-puzzle.com logo