|
Материал сайта www.cnews.ru
В текущей версии продукт работает на базе PC - в дальнейшем предполагается портирование решения на DSP и RISC платформы. Технология распознавания речи может быть использована в различных домашних, бизнес и офисных приложениях, где требуется автоматическое распознавание речи системой, таких как голосовой набор номера для устройств громкой связи, ввод PIN-кода для входа в систему, авторизация кредитной карты, работа с голосовым меню и т.д.
Система распознавания речи может быть настроена на работу в одном из двух режимов: распознавание фраз с фиксированным числом команд (произнесение отдельных команд, режим PIN-кода) и распознавание фраз с произвольным числом команд (слитное произнесение команд, режим связной речи). Данное решение работает в условиях аддитивного нестационарного шума. Требуемое соотношение сигнал/шум до 0 дБ в режиме PIN-кода и до +15 дБ в режиме связной речи.
Технические характеристики:
- Язык: Любой
- Задержка распознавания: 0,2 сек
- Шумовые условия: аддитивный нестационарный шум
- Параметры акустического канала: полоса пропускания не хуже 300 - 3500 Гц
- Адаптация к акустической среде производится по фрагментам шума суммарной длиной не менее 3 с.
- Для режима PIN-кода
- словарь - 50 команд вероятность правильного распознавания - 95 ….99% при SNR = 0…6 dB
- Требуемые акустические условия: аддитивный широкополосный статичный шум с SNR (отношение сигнала к шуму) >= 15Дб
- В режиме распознавания связной (конкатенированной) речи :
- Словарь - 12 слов /цифр
- Вероятность правильного распознавания цепочки слов - 98…99%
- Специфика: адаптация к произвольным шумам.
Автоматическая система распознавания речи от Spiritдоступна в форме приложения для PC под MS Windows или ассемблерного кода. По запросу клиентов решение может быть портировано на любую DSP или RISC платформу.
|