Про форматы аудио

Установки

Установка первая. Не бывает идеального формата.  Разные типы аудио требуют разных подходов.

Установка вторая. Из из плохого качества невозможно сделать хорошее.

Установка третья. Есть три подхода к сравнению качества – граница различения (тяжеловесы),  граница комфортности (бытовое аудио) и граница разборчивости.

Установка четвёртая. Споры в одной весовой категории – бесполезны, и называются “холиварами”.  Споры в разных весовых категориях бессмысленны – “тяжёлое тяжелее лёгкого”, а “лёгкое легче тяжёлого”.  Споры (особенно у тяжеловесов) могут проходить только при поддержке «слепого метода».

Краткая вводная

Битрейт – один из самых главных показателей измерения цифровых аудиозаписей. Измеряется в килобитах в секунду(для краткости: кбит/c, просто килобит, кбит, кбит в сек, kbps и т.п.).

На пальцах: он отвечает на вопрос “сколько памяти занимает одна секунда аудио”.

Тут уже идут всякие преобразования: в одном байте восемь бит, в одном килобите 1024 бит, в одной минуте 60 секунд, в одном часе 60 минут – и мы приходим к следующим эмпирическим данным:

Естественно, все мы хотим экономно использовать место на диске. Вот именно отсюда и начинается война форматов. 11 Мб в шестьдесят раз экономнее 615 Мб. Мегабайты – это цена хранения аудио-записей.

Цену хранения можно выразить и в денежных знаках, разделив стоимость накопителя на его ёмкость. Для архива аудио-записей цена хранения далеко не так критична, как для архива видео-записей.

Также цену хранения можно условно выразить и в человеко-часах, если устройство воспроизведения обладает ёмкостью, гораздо меньшей вашего общего архива аудиозаписей. Требуется время на регулярную перезакачку новых треков в устройство.

Цену хранения можно выразить и в квадратных метрах рабочей площади. 500 аудиодисков займут огромное пространство и потребуют мебельных решений, но один небольшой внешний жёсткий диск поместится в карман.

Если есть разная цена, то возникает вопрос качества: тогда мы предполагаем, что меньший битрейт имеет меньшее качество. Вот мы и подходим к главному вопросу – где граница разумного, где идеальное соотношение “цена/качество”.

Самое грубое деление аудиоформатов в порядке убывания среднего битрейта:

 

Аудио без сжатия – это чистый сигнал без преобразования, “как есть”, эквивалент WAV или Audio CD. Классические параметры: 1411 кбит/c, частота дискретизации 44100 кГц, 16-битный звук.

Кодек – это сокращение от слов (КОдер и ДЕКодер). Кодер – это программа, которая упаковывает чистый аудио-сигнал в нужный специальный формат. Декодер – это программа, которая преобразовывает специальный формат в чистый аудио-сигнал. В современном английском языке эти два термина несколько трансформировались: encode и decode, которым соответствую прямые русские аналоги закодировать и раскодировать. И не путайте шифрование и кодирование — это два очень непохожих процесса, хотя внешне тут много похожего.

Для обычного человека требуется только проигрыватель, который умеет работать с этим форматом (то есть: имеет декодер). Сам “кодер” требуется только для “изготовления” таких файлов.

Сжатие без потерь – обычно используется для коллекционного аудио-материала. В целом считается, что такой формат в точности можно преобразовать обратно в Audio CD.

Чем лучше такое сжатие:

Сами форматы такого сжатия отличаются:

Накладные расходы – несущественны для обычного человека, а степень сжатия у кодеков отличается незначительно. Основные игроки: FLAC, APE, WAVPACK, ALAC.

Сжатие с потерями – даёт гораздо большую степень сжатия за счёт отбрасывания малосущественных деталей звука. Чем до меньшего размера файла мы пытаемся сжать, тем больше деталей надо отбросить. Кроме того что детали исчезают, так ещё появляются технические артефакты.

Основные игроки на рынке: MP3, OGG, AAC, WMA. Все они обладают градациями качества – чем выше битрейт, тем ближе качество к оригиналу. На одинаковых битрейтах разные кодеки в разных условиях могут давать разные результаты.

Объяснить на пальцах что такое сжатие с потерями можно на примере сжатия графических файлов в формате JPEG.

 

sample_jpg_100sample_jpg_090sample_jpg_080sample_jpg_070sample_jpg_060sample_jpg_050sample_jpg_040sample_jpg_030sample_jpg_020sample_jpg_010

В начале – идеально и практически неотличимо (без увеличения).

В серединке – падение качества видно уже невооружённым глазом, но терпеть ещё можно.

В конце – уже деградация качества переходит границы терпения.

Фотография как бы одна и та же. Её размер в пикселях – такой же. Отличия – в качестве (от 100 до 10), ниже 10 – это уже реальный “трэш”.

Различия качества отражаются на в весе:

 

Мой выбор

Аудио без сжатия – использовать только в промежуточном хранении для рабочего аудио-материала. У меня такие материалы бывают только в микрофонных записях. После их сбора, редактирования и обработки их следует кодировать в низкие битрейты, а исходный материал — удалять. Форматы файлов WAV/PCM.

Сжатие без потерь — так как коллекционного материала мало, то отличия в степени сжатия я полагаю несущественными. FLAC – мой однозначный выбор. У него много плюсов и небольшое отставание от лидеров по сжатию.

Сжатие с потерями – использовать для всего остального. Граница разумного определяется типом материала

Музыкальные записи – формат MP3 с битрейтом от 192 до 320.

Битрейт 192 от битрейта 320 отличить теоретически возможно, но средний битрейт 192 в подавляющем числе случаев находится в зоне комфортного восприятия. Классический низкий битрейт 128 уже  уже легко может попадать за границу комфортности восприятия.

Я читал, что граница средняя различения находится в районе 220. Впрочем разный аудио-материал имеет разную границу различения. Чем шире полоса частот – тем больший битрейт требуется, чёткость границ также требует повышенного битрейта. Высокие частоты очень сильно режутся кодеком MP3 – чем ниже битрейт, тем более сильно отрезаются высокие частоты. Способны ли вы различать из наличие – вопрос спорный, так как эти негромкие высокие частоты прячутся за громкими звуками средних частот. Но зато по наличию высоких частот всегда можно отличить реальный материал, от восстановленного (называется “upconvert”).

Значительные искажения можно заметить только на низких и ультранизких битрейтах.

Диктофонные записи, радиозаписи, телевизионные записи – формат MP3 с битрейтом от 64 до 128. Подход следующий – для монофонического звука и голоса можно использовать более низкие битрейты.

Аудиокниги – здесь уже несколько сложнее.

Классический формат – папка с mp3 файлами и битрейтом 128-192. Одна книга будет занимать от 500 до 1500 мегабайт. Во-первых: это значительное место, во-вторых: получается очень много файлов. Если понижать битрейт, то легко можно преодолеть границу комфорта. Не всякая аудио-книга комфортно звучит на битрейтах 32-64, а подбирать минимальный битрейт под каждую книгу и под каждое ухо – занятие утомительное. Если объединять файлы, то затрудняется навигация в плеере.

Популярная альтернатива – AAC, он же M4B. У него есть два преимущества по сравнению с mp3. Во-первых, он качественнее передаёт звук на низких битрейтах (40-80). Во-вторых, он способен хранить оглавление внутри одного большого файла. Данный кодек имеет хорошую поддержку со стороны проигрывателей, продвигается больше Apple и iTunes.

Есть и экспериментальные направления. Например новый кодек OPUS очень хорошо сжимает голос, и аудиокнига может очень неплохо звучать на ультранизком битрейте 24, тогда как AAC на аналогичных битрейтах уже значительно «металлизируется”. Жаль, что у OPUS пока плохо с распространённостью (очень жду на платформе Android).

Битрейт ниже 24 — это уже совсем запредельный случай.  Качество его существенно ниже, какой бы это супер-пупер формат не был, хотя разборчивость можно держать на приемлемом уровне.

Как сравнивать разные битрейты

Единственно верным способом оценки идеального или сравнимого качества является “слепое” тестирование, то есть сравнение двух образцов “без наклеек”. Именно такой метод позволяет отбросить психологические предубеждения против кодеков и битрейтов.

В плеере Foobar2000 кроме встроенных средств перекодирования из практически любых форматов в практически любые форматы есть и средство для “слепого” сравнения – “ABX Comparator”.

В чём суть:

1) Берём два трека, полученного кодированием из одного оригинального файла, и загружаем в ABX.

2) Начинаем слушать, переключаясь между двумя парами треков (A+B=X+Y). А и B – два наших исходных разных трека, и X и Y – те же самые два наших трека, случайно перемешанные.

Цель – угадать, как именно они перемешаны.

3) Выбираем ответ: один из двух вариантов: (X=A, Y=B) или (X=B, Y = A)

ABX Comparator

4) Повторяем операцию как минимум раз пять, чтобы исключить случайное попадание.

 

Данный способ сравнения не подходит для сравнения разных весовых категорий – между высокими и низкими битрейтами можно наблюдать существенные различия. Однако такое средство может помочь в оценке границ комфорта.

 

Калькулятор

SpeedCalc

Все преобразования битрейтов довольно трудоёмко прикидывать “в уме”.

Эта программка позволяет делать взаимообратные преобразования параметров: битрейт/скорость, объём, длительность.

Программку положил тут http://entropii.net/files/SpeedCalc_1.0.zip

Опубликовано 23.09.2012 в 16:07 · Автор ivan · Ссылка
Рубрики: Книги, Музыка, Софт

Написать комментарий