Меню

Speex кодек как установить

Формат Speex

Speex является свободным от патентов форматом для сжатия аудио, разработанным для передачи речи, а также для использования в открытом программном обеспечении (например, в VoIP-телефонии). Он основан на алгоритме для сжатия речи CELP. Speex заявляет о своей свободе от патентных ограничений и лицензирован под модифицированной (3-пунктовой) лицензией BSD. Он может быть использован в формате-контейнере Ogg или передан напрямую через UDP / RTP.

Разработчики Speex видят проект как дополнение к проекту общего назначения «Vorbis».

Speex является форматом сжатия с потерями, это означает, что качество ухудшается в пользу меньшего размера файлов.

История

Проект Speex был начат 13 февраля 2002 года. Первые версии Speex были лицензированы под LGPL лицензией, но, как только вышла версия 1.0 бета 1, Speex начал выпускаться под лицензией Xiph (модифицированной BSD). Speex 1.0 был анонсирован 24 марта 2003 года, после года разработки.

Начиная с версии 1.2rc2 исходные коды проекта были разделены на кодек Speex и библиотеку SpeexDSP.

Последняя версия 1.2rc3 библиотеки SpeexDSP датируется 3 января 2015 года.

На данный момент формат является устаревшим. На его замену пришел более современный и прогрессивный Opus. Всем пользователям рекомендуется переключиться на Opus, так как он лучше во всех аспектах.

Описание

В отличии от многих других голосовых кодеков, Speex был создан не для сотовой связи, а для VoIP-телефонии и сжатия файлов. Целью проекта было желание сделать кодек, который будет оптимизирован для высококачественной передачи речи при низком битрейте. Чтобы достичь это, кодек использует различные битрейты, а также поддерживает различную частоту дискретизации:

Так как Speex затачивался изначально под VoIP-телефонию, вместо сотовой телефонии, от кодека в первую очередь требовалась устойчивость к потерям пакетов, а не к их искажениям. Все это привело к выбору Линейного предсказания с мультикодовым управлением (CELP) как техники для кодирования. Одной из главных причин, по которой была выбрана CELP, являлась то, что эта техника уже хорошо зарекомендовала себя, как на низких битрейтах (что очевидно по DoD CELP на 4.8 kbit/s), так и на высоких (G.728 на 16 kbit/s). Можно выделить следующие основные характеристики кодека:

Источник

Передача звука по радиоканалу с использованием кодека Speex

Описание применяемого кодека

Speex это свободный кодек для сжатия речевого сигнала, который может использоваться в приложениях «голос-через-интернет» (VoIP). С высокой вероятностью он не имеет никаких патентных ограничений и лицензирован под последней версией лицензии BSD (без третьей статьи). Сжатые кодеком Speex данные можно хранить либо в формате хранения звуковых данных Ogg, либо передавать напрямую с помощью пакетов UDP/RTP.

Разработчики противопоставляют свою разработку другим открытым кодекам, например, кодеку Vorbis, утверждая, что именно кодек Speex лучше всего подходит для передачи голоса по сети с ненадёжной доставкой пакетов данных. При этом авторы разработки специально подчёркивают, что кодек подходит для использования в сетях с ненадёжной передачей пакетов, то есть либо пакет пришёл, либо нет. При этом возможность искажения содержимого пакета должна быть исключена, поэтому Speex не подходит для передачи голоса, например, в радио- и сотовой связи.

Читайте также:  Как установить chrome в xubuntu

Speex относится к классу так называемых Code Excited Linear Prediction (CELP)-кодеков, то есть кодеков, построенных на основе так называемого Линейного Предсказательного кодирования ЛПК. ЛПК использует для аппроксимации отрезка речевого сигнала цифровой фильтр только с обратными связями (т. н. «авторегрессионный фильтр»). Коэффициенты этого фильтра «подгоняются» под отрезок сигнала с помощью процедуры Левинсона (в западной литературе — Левинсона-Дурбина). CELP-модификация ЛПК предусматривает наличие т. н. «кодовой книги», которая содержит предопределённые наборы возбуждающих ЛПК-фильтр единичных импульсов.

Речевой сигнал в кодеке Speex разбивается на неперекрывающиеся отрезки длительностью 20 мс (160 отсчётов при 8 КГц). При этом, для оценки возбуждающего набора вышеуказанный отрезок разбивается на четыре подотрезка длительностью 5 мс соответственно. На каждом из подотрезков отыскиваются возбуждающие наборы импульсов как текущего подотрезка (из кодовой книги), так и двух предыдущих подотрезков. В отличие от других кодеков, с целью избежать патентных ограничений, Speex не использует алгебраическое кодирование, а только векторное. Возбуждения двух предыдущих подотрезков складываются с переменными весами, в отличие от ряда других кодеков, где используются переменные положения по времени.

По заявлению разработчиков, Speex оптимизирован для получения высококачественного речевого сигнала при низких скоростях. Кодек Speex также позволяет использовать переменную степень сжатия сигнала и поддерживает сигналы с различной шириной полосы: сверхширокополосный (англ. ultra-wideband, частота дискретизации 32 КГц), широкополосный (англ. wideband, 16 КГц) и узкополосный (англ. narrowband, 8 КГц). Направленность на системы «голос-через-интернет» (VoIP) предопределяет, что Speex должен быть устойчив к потерям пакетов данных, но не к повреждению их, так как UDP/IP-протокол, в отличие от TCP/IP, не гарантирует доставку пакетов потребителю. Но, при этом, вероятность повреждения данных в UDP/IP-пакете в проводных системах связи крайне мала. Следует отметить, что можно использовать для передачи данных, сжатых кодеком Speex и TCP/IP-пакеты. В последнем случае, вероятность порчи данных становится мизерной. Эта особенность определяет отсутствие в формате данных кодека Speex каких-либо средств защиты от ошибок.

Основные характеристики кодека:

Принципиальная схема устройства

Данная схема является универсальным решением для построения приемника и передатчика. В случае построения приемника исключается входные цепи, а для передатчика исключаются выходные цепи. Возможно использование данного устройства в виде приемопередатчика. Частота дискретизации речевых сигналов 10 кГц, тактовая частота ядра микроконтроллера составляет 72 МГц, модуль приемопередатчика работает на частоте 868 МГц.

По выше приведенной принципиальной схеме была спроектирована печатная плата в Sprint-Layout:

Источник

ИТ База знаний

Полезно

— Онлайн генератор устойчивых паролей

— Онлайн калькулятор подсетей

— Руководство администратора FreePBX на русском языке

— Руководство администратора Cisco UCM/CME на русском языке

Читайте также:  Как правильно установить направляющие для компьютерного стола

— Руководство администратора по Linux/Unix

Навигация

Серверные решения

Телефония

FreePBX и Asterisk

Настройка программных телефонов

Корпоративные сети

Протоколы и стандарты

Популярное и похожее

Рассказываем про FXO и FXS

DHCP: Опция 150 и 66

SIP против PRI – сравнение и преимущества

Протокол H.323

10 причин: почему IP – телефония это круто

Про Session Description Protocol

Сигнализация H.323

Atcom R4S

Еженедельный дайджест

VoIP кодеки – подробное описание и характеристики

Под телефонными (VoIP) кодеками понимаются различные математические модели используемые для цифрового кодирования и компрессирования (сжатия) аудио информации. Многие из современных кодеков используют особенности восприятия человеческим мозгом неполной информации: алгоритмы голосового сжатия пользуются этими особенностями, вследствие чего не полностью услышанная информация полностью интерпретируется головным мозгом. Основным смыслом таких кодеков является сохранение баланса между эффективностью передачи данных и их качеством.

Изначально, термин кодек происходил от сочетания слов КОДирование/ДЕКодирование, то есть устройств, которые преобразовывали аналог в цифровую форму. В современном мире телекоммуникаций, слово кодек скорее берет начало от сочетания КОмпрессия/ДЕКомпрессия.

Перед тем как начать подробный рассказ про различные кодеки, мы составили таблицу со краткой сравнительной характеристикой современных кодеков:

Кодек Скорость передачи, Кб/сек. Лицензирование
G.711 64 Кб/сек. Нет
G.726 16, 24, 32 или 40 Кб/ сек. Нет
G.729А 8 Кб/ сек. Да
GSM 13 Кб/ сек. Нет
iLBC 13.3 Кб/ сек. (30 мс фрейма);
15.2 Кб/ сек. (20 мс фрейма)
Нет
Speex Диапазон от 2.15 до 22.4 Кб/ сек. Нет
G.722 64 Кб/сек. Нет

Кодек G.711 это самый базовый кодек ТфОП (PSTN). В рамках данного кодека используется импульсно-кодовая модуляция PCM. Всего в мире используется 2 метода компандирования (усиления сигнала) G.711: µ – закон в Северной Америке и A – закон в остальной части мира. Данный кодек передает 8 – битное слово 8 000 раз в секунду. Если умножить 8 на 8 000, то получим 64 000 бит – то есть 64 Кб/с, скорость потока, создаваемого G.711.

Многие люди скажут, что G.711 это кодек, в котором отсутствует компрессирование (сжатие), но это не совсем так: сам по себе процесс компандирования является одной из форм компрессирования. Все мировые кодеки «выросли» на базе G.711.

Важная особенность G.711 в том, что он минимально загружает процессор машины, на которой он запущен.

Этот кодек использовался некоторое время, став заменой для G.721, который на тот момент устарел, и является одним из первых кодеков с алгоритмом компрессии. Он так же известен как кодек с адаптивной импульсно-кодовой модуляции (Adaptive Differential Pulse-Code Modulation, ADPCM) и может использовать несколько скоростей потока передачи. Наиболее распространенные скорости передачи это 16, 24 и 32 Кб/сек.

Кодек G.726 почти идентичен G.711 – единственным отличием является то, что он использует половину полосы пропускания. Это достигается путем того, что вместо отправки полного результата квантования, он отправляет только разницу между двумя последними измерениями. В 1990 году от кодека практически отказались, так как он не мог работать с факсимильными сигналами и модемами. Но в наше время, из – за своей экономии полосы пропускания и ресурсов центрального процессора у него есть все шансы вновь стать популярные кодеком в современных сетях.

G.729A

Учитывая то, какую малую полосу пропускания использует G.729A, всего 8 Кб/сек., он обеспечивает превосходное качество связи. Это достигается за счет использования сопряженной структуры с управляемым алгебраическим кодом и линейным предсказанием (Conjugate-Structure Algebraic-Code-Excited Linear Prediction, CS-ACELP). По причине патента, использование данного кодека является коммерческим; однако это не мешает кодеку G.729A быть популярным в различных корпоративных сетях и телефонных системах.

Для достижения такой высокой степени сжатия, G.729A активно задействует мощности процессора (CPU).

Кодек для глобального стандарта цифровой мобильной сотовой связи (Global System for Mobile Communications, GSM) не обременен лицензированием, как его аналог G.729A, но предлагает высокое качество и умеренную нагрузку на процессор при использовании 13 Кб/сек. полосы пропускания. Эксперты считают, что качество GSM несколько ниже чем G.729A.

Кодек iLBC (Internet Low Bitrate Codec) сочетает в себе низкое использование полосы пропускания и высокого качества. Данный кодек идеально подходит для поддержания высокого качества связи в сетях с потерями пакетов.

iLBC не так популярен как кодеки стандартов ITU и поэтому, может быть не совместим с популярными IP – телефонами и IP – АТС. Инженерный совет Интернета (IETF) выпустил RFC 3951 и 3952 в поддержку кодека iLBC.

Internet Low Bitrate кодек использует сложные алгоритмы для достижения высокого показателя сжатия, поэтому, весьма ощутимо загружает процессор.

В настоящий момент iLBC используется бесплатно, но владелец этого кодека, Global IP Sound (GIPS), обязует уведомлять пользователей о намерении коммерческого использования этого кодека. Кодек iLBC работает на скорости в 13.3 Кб/сек. с фреймами в 30 мс, и на скорости 15.2 кб/сек. с фреймами в 20 мс.

Кодек Speex относится к семейству кодеков переменной скорости (variable-bitrate, VBR), что означает возможность кодека динамически менять скорость передачи битов в зависимости от статуса производительности сети передачи. Этот кодек предлагается в широкополосных и узкополосных модификациях, в зависимости от требования к качеству.

Speex полностью бесплатный и распространяется под программной лицензией университета Беркли (Berkeley Software Distribution license, BSD). Кодек работает на диапазонах от 2.15 до 22.4 Кб/сек. в рамках переменного битрейта.

Было полезно?

Почему?

😪 Мы тщательно прорабатываем каждый фидбек и отвечаем по итогам анализа. Напишите, пожалуйста, как мы сможем улучшить эту статью.

😍 Полезные IT – статьи от экспертов раз в неделю у вас в почте. Укажите свою дату рождения и мы не забудем поздравить вас.

Источник