![](https://marker.im/wp-content/uploads/2022/05/4ae339c0325a7545d6518b6d1ae98545-300x278.jpg)
Набор данных для перевода речи
Общедоступный многоязычный корпус для перевода речи. Он охватывает восемь языковых направлений, от английского до немецкого, испанского, французского, итальянского, голландского, португальского, ...
Далее
Далее
![](https://marker.im/wp-content/uploads/2022/05/dims-1536x1024-1-300x278.jpeg)
Набор данных русской речи по мобильному телефону
Набор содержит 200 000 часов данных распознавания речи, записанных с помощью различного профессионального оборудования, охватывающих самые разные сцены. В записи ...
Далее
Далее
![](https://marker.im/wp-content/uploads/2022/05/14702410-39ad-5cad-8021-6cd33b6b28ee-300x278.png)
Набор записей звуков людей (смех, кашель и пр.)
Бесплатный набор данных, состоящий из 21 024 собранных на основе краудсорсинга записей смеха, вздохов, кашля, откашливания, чихания и фырканья от ...
Далее
Далее
![](https://marker.im/wp-content/uploads/2022/05/Скриншот-19-05-2022-142458-300x278.jpg)
Многоязычный набор голосовых данных с открытым исходным кодом
Каждая запись в наборе данных состоит из уникального файла MP3 и соответствующего текстового файла. Многие из 20 217 записанных часов ...
Далее
Далее
![](https://marker.im/wp-content/uploads/2022/02/mzl.tdmadtze-300x278.jpg)
Набор аудио, извлечённых из видео
Набор аудиоданных, содержащий более 100 000 высказываний 1251 знаменитости, извлеченных из видео, загруженных на YouTube. Получить более подробную информацию о ...
Далее
Далее
![](https://marker.im/wp-content/uploads/2022/01/muzzic-300x278.png)
Набор данных из музыки, речи и шума
Этот набор данных подходит для моделей обучения обнаружению голосовой активности (VAD) и различению музыки и речи. Набор данных состоит из музыки ...
Далее
Далее
![](https://marker.im/wp-content/uploads/2022/01/123-300x278.jpg)
Датасет с размеченными речевыми данными на русском языке
Набор данных в основном состоит из записанных аудиофайлов, аннотированных вручную на краудсорсинговой платформе. Общая продолжительность аудио составляет около 1240 часов ...
Далее
Далее
![](https://marker.im/wp-content/uploads/2021/12/Audiobooks-1-300x278.jpg)
Записи английской речи
Данные собраны из примерно 1000 часов чтения английской речи с частотой 16 кГц. Данные получены из прочитанных аудиокниг из проекта LibriVox ...
Далее
Далее