Блог - Портал по разметке данных

Одноголосный синтез речи на основе нейронных сетей

На видео разбирают простую задачу: есть набор из текстов и соответствующих аудио.Читать далее

Мы в «Наносемантике» имеем большой опыт в разработке голосовых помощников, поэтому решилиЧитать далее

Общедоступный многоязычный корпус для перевода речи. Он охватывает восемь языковых направлений, от английскогоЧитать далее

Это схема высокого уровня различных компонентов, используемых в системе TTS. Входными даннымиЧитать далее

TTS — это компьютерное моделирование человеческой речи из текстового представления с использованиемЧитать далее

Набор содержит 200 000 часов данных распознавания речи, записанных с помощью различногоЧитать далее

На этом видео спикер рассказывает о том, как можно решать более сложныеЧитать далее

Автоматическое распознавание речи, или ASR, — это использование технологии машинного обучения илиЧитать далее

Бесплатный набор данных, состоящий из 21 024 собранных на основе краудсорсинга записейЧитать далее

На этом видео спикер рассказывает о том, как хранятся аудиофайлы и чтоЧитать далее

Идентификация говорящего Это процесс добавления помеченных областей к аудиопотокам и определения временныхЧитать далее

Каждая запись в наборе данных состоит из уникального файла MP3 и соответствующегоЧитать далее