Набор данных для перевода речи

Общедоступный многоязычный корпус для перевода речи. Он охватывает восемь языковых направлений, от английского до немецкого, испанского, французского, итальянского, голландского, португальского, ...
Далее

Набор данных русской речи по мобильному телефону

Набор содержит 200 000 часов данных распознавания речи, записанных с помощью различного профессионального оборудования, охватывающих самые разные сцены. В записи ...
Далее

Набор записей звуков людей (смех, кашель и пр.)

Бесплатный набор данных, состоящий из 21 024 собранных на основе краудсорсинга записей смеха, вздохов, кашля, откашливания, чихания и фырканья от ...
Далее

Многоязычный набор голосовых данных с открытым исходным кодом

Каждая запись в наборе данных состоит из уникального файла MP3 и соответствующего текстового файла. Многие из 20 217 записанных часов ...
Далее

Набор аудио, извлечённых из видео

Набор аудиоданных, содержащий более 100 000 высказываний 1251 знаменитости, извлеченных из видео, загруженных на YouTube.  Получить более подробную информацию о ...
Далее

Набор данных из музыки, речи и шума

Этот набор данных подходит для моделей обучения обнаружению голосовой активности (VAD) и различению музыки и речи. Набор данных состоит из музыки ...
Далее

Датасет с размеченными речевыми данными на русском языке

Набор данных в основном состоит из записанных аудиофайлов, аннотированных вручную на краудсорсинговой платформе. Общая продолжительность аудио составляет около 1240 часов ...
Далее

Записи английской речи

Данные собраны из примерно 1000 часов чтения английской речи с частотой 16 кГц. Данные получены из прочитанных аудиокниг из проекта LibriVox ...
Далее