Подписаться на ленту новостей через RSS канал


25 October 2020

Open Source распознавание речи SOVA

Open Source распознавание речи SOVA

О чем же статья:

1. Рассказываем, как использовали распознавание и синтез речи других компаний при работе с чат-ботами и голосовыми помощниками и почему решили создавать свой ASR и выкладывать его в Open Source.

2. Раскрываем главные ингредиенты рецепта современной системы распознавания речи.

3. Приводим примеры интересных разработок, которые мы сами изучали, «щупали» и сравнивали на старте нашего проекта.

4. Отвечаем на вопросы: «Какие существуют метрики для оценки качества распознавания? И что нужно учитывать при разработке и подготовке датасетов?»

5. Описываем процесс сбора и разметки данных и узнаем ответ на главный вопрос: «Сколько нужно данных?». Спойлер: очень много, чем больше, тем лучше)

6. Знакомим с алгоритмами работы технологии распознавания речи NLab Speech и нашего бесплатного распознавания речи SOVA ASR.

7. И посвящаем вас в свои планы на будущее.

В качестве бонуса в статье найдете примеры аудио тестовых датасетов и алгоритмы решения всех сложностей, с которыми нам пришлось столкнуться в процессе разработки. Обещаем, будет интересно, полезно и познавательно!

Прочитать статью https://bit.ly/3oo0DUs