Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the all-in-one-seo-pack domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /var/www/html/wp-includes/functions.php on line 6121 Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the logo-carousel-free domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /var/www/html/wp-includes/functions.php on line 6121 Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the ninja-forms domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /var/www/html/wp-includes/functions.php on line 6121 Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the wp-yandex-metrika domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /var/www/html/wp-includes/functions.php on line 6121 Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the antispam-bee domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /var/www/html/wp-includes/functions.php on line 6121 Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the luckywp-glossary domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /var/www/html/wp-includes/functions.php on line 6121 Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the rise-builder domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /var/www/html/wp-includes/functions.php on line 6121 Warning: Cannot modify header information - headers already sent by (output started at /var/www/html/wp-includes/functions.php:6121) in /var/www/html/wp-content/plugins/advanced-iframe/advanced-iframe.php on line 390 Warning: Cannot modify header information - headers already sent by (output started at /var/www/html/wp-includes/functions.php:6121) in /var/www/html/wp-content/plugins/all-in-one-seo-pack/app/Common/Meta/Robots.php on line 87 Warning: Cannot modify header information - headers already sent by (output started at /var/www/html/wp-includes/functions.php:6121) in /var/www/html/wp-includes/feed-rss2.php on line 8 Аудио-д - Портал по разметке данных https://marker.im Информация о датасетах и программах разметки Thu, 30 Jun 2022 17:35:36 +0000 ru-RU hourly 1 https://wordpress.org/?v=6.8.3 Набор данных для перевода речи https://marker.im/2022/06/24/%d0%bd%d0%b0%d0%b1%d0%be%d1%80-%d0%b4%d0%b0%d0%bd%d0%bd%d1%8b%d1%85-%d0%b4%d0%bb%d1%8f-%d0%bf%d0%b5%d1%80%d0%b5%d0%b2%d0%be%d0%b4%d0%b0-%d1%80%d0%b5%d1%87%d0%b8/ https://marker.im/2022/06/24/%d0%bd%d0%b0%d0%b1%d0%be%d1%80-%d0%b4%d0%b0%d0%bd%d0%bd%d1%8b%d1%85-%d0%b4%d0%bb%d1%8f-%d0%bf%d0%b5%d1%80%d0%b5%d0%b2%d0%be%d0%b4%d0%b0-%d1%80%d0%b5%d1%87%d0%b8/#respond Fri, 24 Jun 2022 09:00:00 +0000 https://marker.im/?p=1206 Общедоступный многоязычный корпус для перевода речи. Он охватывает восемь языковых направлений, от английскогоЧитать далее

The post Набор данных для перевода речи first appeared on Портал по разметке данных.

]]>

Общедоступный многоязычный корпус для перевода речи. Он охватывает восемь языковых направлений, от английского до немецкого, испанского, французского, итальянского, голландского, португальского, румынского и русского. Корпус состоит из аудиозаписей, транскрипций и переводов выступлений TED на английском языке, а также включает в себя предопределенные разделы для обучения, проверки и тестирования.

Получить более подробную информацию о проекте, а также скачать набор данных можно по ссылке.

The post Набор данных для перевода речи first appeared on Портал по разметке данных.

]]>
https://marker.im/2022/06/24/%d0%bd%d0%b0%d0%b1%d0%be%d1%80-%d0%b4%d0%b0%d0%bd%d0%bd%d1%8b%d1%85-%d0%b4%d0%bb%d1%8f-%d0%bf%d0%b5%d1%80%d0%b5%d0%b2%d0%be%d0%b4%d0%b0-%d1%80%d0%b5%d1%87%d0%b8/feed/ 0
Набор данных русской речи по мобильному телефону https://marker.im/2022/06/17/%d0%bd%d0%b0%d0%b1%d0%be%d1%80-%d0%b4%d0%b0%d0%bd%d0%bd%d1%8b%d1%85-%d1%80%d1%83%d1%81%d1%81%d0%ba%d0%be%d0%b9-%d1%80%d0%b5%d1%87%d0%b8-%d0%bf%d0%be-%d0%bc%d0%be%d0%b1%d0%b8%d0%bb%d1%8c%d0%bd%d0%be/ https://marker.im/2022/06/17/%d0%bd%d0%b0%d0%b1%d0%be%d1%80-%d0%b4%d0%b0%d0%bd%d0%bd%d1%8b%d1%85-%d1%80%d1%83%d1%81%d1%81%d0%ba%d0%be%d0%b9-%d1%80%d0%b5%d1%87%d0%b8-%d0%bf%d0%be-%d0%bc%d0%be%d0%b1%d0%b8%d0%bb%d1%8c%d0%bd%d0%be/#respond Fri, 17 Jun 2022 09:00:00 +0000 https://marker.im/?p=1191 Набор содержит 200 000 часов данных распознавания речи, записанных с помощью различногоЧитать далее

The post Набор данных русской речи по мобильному телефону first appeared on Портал по разметке данных.

]]>

Набор содержит 200 000 часов данных распознавания речи, записанных с помощью различного профессионального оборудования, охватывающих самые разные сцены. В записи с аутентичным акцентом участвовало 1960 носителей русского языка. Записанный сценарий разработан лингвистами и охватывает широкий спектр тем, включая общие, интерактивные, автомобильные и домашние. Текст вычитывается вручную с высокой точностью.

Получить более подробную информацию о проекте, а также скачать набор данных можно по ссылке.

The post Набор данных русской речи по мобильному телефону first appeared on Портал по разметке данных.

]]>
https://marker.im/2022/06/17/%d0%bd%d0%b0%d0%b1%d0%be%d1%80-%d0%b4%d0%b0%d0%bd%d0%bd%d1%8b%d1%85-%d1%80%d1%83%d1%81%d1%81%d0%ba%d0%be%d0%b9-%d1%80%d0%b5%d1%87%d0%b8-%d0%bf%d0%be-%d0%bc%d0%be%d0%b1%d0%b8%d0%bb%d1%8c%d0%bd%d0%be/feed/ 0
Набор записей звуков людей (смех, кашель и пр.) https://marker.im/2022/06/10/%d0%bd%d0%b0%d0%b1%d0%be%d1%80-%d0%b7%d0%b0%d0%bf%d0%b8%d1%81%d0%b5%d0%b9-%d0%b7%d0%b2%d1%83%d0%ba%d0%be%d0%b2-%d0%bb%d1%8e%d0%b4%d0%b5%d0%b9-%d1%81%d0%bc%d0%b5%d1%85-%d0%ba%d0%b0%d1%88%d0%b5%d0%bb/ https://marker.im/2022/06/10/%d0%bd%d0%b0%d0%b1%d0%be%d1%80-%d0%b7%d0%b0%d0%bf%d0%b8%d1%81%d0%b5%d0%b9-%d0%b7%d0%b2%d1%83%d0%ba%d0%be%d0%b2-%d0%bb%d1%8e%d0%b4%d0%b5%d0%b9-%d1%81%d0%bc%d0%b5%d1%85-%d0%ba%d0%b0%d1%88%d0%b5%d0%bb/#respond Fri, 10 Jun 2022 09:00:00 +0000 https://marker.im/?p=1177 Бесплатный набор данных, состоящий из 21 024 собранных на основе краудсорсинга записейЧитать далее

The post Набор записей звуков людей (смех, кашель и пр.) first appeared on Портал по разметке данных.

]]>

Бесплатный набор данных, состоящий из 21 024 собранных на основе краудсорсинга записей смеха, вздохов, кашля, откашливания, чихания и фырканья от 3365 уникальных субъектов. Набор данных также содержит метаданные, такие как возраст говорящего, пол, родной язык, страна и состояние здоровья.

Получить более подробную информацию о проекте, а также скачать набор данных можно по ссылке.

The post Набор записей звуков людей (смех, кашель и пр.) first appeared on Портал по разметке данных.

]]>
https://marker.im/2022/06/10/%d0%bd%d0%b0%d0%b1%d0%be%d1%80-%d0%b7%d0%b0%d0%bf%d0%b8%d1%81%d0%b5%d0%b9-%d0%b7%d0%b2%d1%83%d0%ba%d0%be%d0%b2-%d0%bb%d1%8e%d0%b4%d0%b5%d0%b9-%d1%81%d0%bc%d0%b5%d1%85-%d0%ba%d0%b0%d1%88%d0%b5%d0%bb/feed/ 0
Многоязычный набор голосовых данных с открытым исходным кодом https://marker.im/2022/06/03/%d0%bc%d0%bd%d0%be%d0%b3%d0%be%d1%8f%d0%b7%d1%8b%d1%87%d0%bd%d1%8b%d0%b9-%d0%bd%d0%b0%d0%b1%d0%be%d1%80-%d0%b3%d0%be%d0%bb%d0%be%d1%81%d0%be%d0%b2%d1%8b%d1%85-%d0%b4%d0%b0%d0%bd%d0%bd%d1%8b%d1%85/ https://marker.im/2022/06/03/%d0%bc%d0%bd%d0%be%d0%b3%d0%be%d1%8f%d0%b7%d1%8b%d1%87%d0%bd%d1%8b%d0%b9-%d0%bd%d0%b0%d0%b1%d0%be%d1%80-%d0%b3%d0%be%d0%bb%d0%be%d1%81%d0%be%d0%b2%d1%8b%d1%85-%d0%b4%d0%b0%d0%bd%d0%bd%d1%8b%d1%85/#respond Fri, 03 Jun 2022 09:00:00 +0000 https://marker.im/?p=1170 Каждая запись в наборе данных состоит из уникального файла MP3 и соответствующегоЧитать далее

The post Многоязычный набор голосовых данных с открытым исходным кодом first appeared on Портал по разметке данных.

]]>

Каждая запись в наборе данных состоит из уникального файла MP3 и соответствующего текстового файла. Многие из 20 217 записанных часов в наборе данных также включают демографические метаданные, такие как возраст, пол и акцент, которые могут помочь в обучении точности механизмов распознавания речи. Набор данных в настоящее время состоит из 14 973 проверенных часов на 93 языках, но разработчики постоянно добавляют новые голоса и языки.

Получить более подробную информацию о проекте, а также скачать набор данных можно по ссылке.

The post Многоязычный набор голосовых данных с открытым исходным кодом first appeared on Портал по разметке данных.

]]>
https://marker.im/2022/06/03/%d0%bc%d0%bd%d0%be%d0%b3%d0%be%d1%8f%d0%b7%d1%8b%d1%87%d0%bd%d1%8b%d0%b9-%d0%bd%d0%b0%d0%b1%d0%be%d1%80-%d0%b3%d0%be%d0%bb%d0%be%d1%81%d0%be%d0%b2%d1%8b%d1%85-%d0%b4%d0%b0%d0%bd%d0%bd%d1%8b%d1%85/feed/ 0
Набор аудио, извлечённых из видео https://marker.im/2022/03/18/%d0%bd%d0%b0%d0%b1%d0%be%d1%80-%d0%b0%d1%83%d0%b4%d0%b8%d0%be-%d0%b8%d0%b7%d0%b2%d0%bb%d0%b5%d1%87%d1%91%d0%bd%d0%bd%d1%8b%d1%85-%d0%b8%d0%b7-%d0%b2%d0%b8%d0%b4%d0%b5%d0%be/ https://marker.im/2022/03/18/%d0%bd%d0%b0%d0%b1%d0%be%d1%80-%d0%b0%d1%83%d0%b4%d0%b8%d0%be-%d0%b8%d0%b7%d0%b2%d0%bb%d0%b5%d1%87%d1%91%d0%bd%d0%bd%d1%8b%d1%85-%d0%b8%d0%b7-%d0%b2%d0%b8%d0%b4%d0%b5%d0%be/#respond Fri, 18 Mar 2022 09:00:00 +0000 https://marker.im/?p=947 Набор аудиоданных, содержащий более 100 000 высказываний 1251 знаменитости, извлеченных из видео,Читать далее

The post Набор аудио, извлечённых из видео first appeared on Портал по разметке данных.

]]>

Набор аудиоданных, содержащий более 100 000 высказываний 1251 знаменитости, извлеченных из видео, загруженных на YouTube. 

Получить более подробную информацию о проекте, а также скачать набор данных можно по ссылке.

The post Набор аудио, извлечённых из видео first appeared on Портал по разметке данных.

]]>
https://marker.im/2022/03/18/%d0%bd%d0%b0%d0%b1%d0%be%d1%80-%d0%b0%d1%83%d0%b4%d0%b8%d0%be-%d0%b8%d0%b7%d0%b2%d0%bb%d0%b5%d1%87%d1%91%d0%bd%d0%bd%d1%8b%d1%85-%d0%b8%d0%b7-%d0%b2%d0%b8%d0%b4%d0%b5%d0%be/feed/ 0
Набор данных из музыки, речи и шума https://marker.im/2022/02/18/%d0%bd%d0%b0%d0%b1%d0%be%d1%80-%d0%b4%d0%b0%d0%bd%d0%bd%d1%8b%d1%85-%d0%b8%d0%b7-%d0%bc%d1%83%d0%b7%d1%8b%d0%ba%d0%b8-%d1%80%d0%b5%d1%87%d0%b8-%d0%b8-%d1%88%d1%83%d0%bc%d0%b0/ https://marker.im/2022/02/18/%d0%bd%d0%b0%d0%b1%d0%be%d1%80-%d0%b4%d0%b0%d0%bd%d0%bd%d1%8b%d1%85-%d0%b8%d0%b7-%d0%bc%d1%83%d0%b7%d1%8b%d0%ba%d0%b8-%d1%80%d0%b5%d1%87%d0%b8-%d0%b8-%d1%88%d1%83%d0%bc%d0%b0/#respond Fri, 18 Feb 2022 09:00:00 +0000 https://marker.im/?p=788 Этот набор данных подходит для моделей обучения обнаружению голосовой активности (VAD) иЧитать далее

The post Набор данных из музыки, речи и шума first appeared on Портал по разметке данных.

]]>

Этот набор данных подходит для моделей обучения обнаружению голосовой активности (VAD) и различению музыки и речи. Набор данных состоит из музыки нескольких жанров, речи двенадцати языков и широкого спектра технических и нетехнических шумов.

Получить более подробную информацию о проекте, а также скачать набор данных можно по ссылке.

The post Набор данных из музыки, речи и шума first appeared on Портал по разметке данных.

]]>
https://marker.im/2022/02/18/%d0%bd%d0%b0%d0%b1%d0%be%d1%80-%d0%b4%d0%b0%d0%bd%d0%bd%d1%8b%d1%85-%d0%b8%d0%b7-%d0%bc%d1%83%d0%b7%d1%8b%d0%ba%d0%b8-%d1%80%d0%b5%d1%87%d0%b8-%d0%b8-%d1%88%d1%83%d0%bc%d0%b0/feed/ 0
Датасет с размеченными речевыми данными на русском языке https://marker.im/2022/01/28/%d0%b4%d0%b0%d1%82%d0%b0%d1%81%d0%b5%d1%82-%d1%81-%d1%80%d0%b0%d0%b7%d0%bc%d0%b5%d1%87%d0%b5%d0%bd%d0%bd%d1%8b%d0%bc%d0%b8-%d1%80%d0%b5%d1%87%d0%b5%d0%b2%d1%8b%d0%bc%d0%b8-%d0%b4%d0%b0%d0%bd%d0%bd/ https://marker.im/2022/01/28/%d0%b4%d0%b0%d1%82%d0%b0%d1%81%d0%b5%d1%82-%d1%81-%d1%80%d0%b0%d0%b7%d0%bc%d0%b5%d1%87%d0%b5%d0%bd%d0%bd%d1%8b%d0%bc%d0%b8-%d1%80%d0%b5%d1%87%d0%b5%d0%b2%d1%8b%d0%bc%d0%b8-%d0%b4%d0%b0%d0%bd%d0%bd/#respond Fri, 28 Jan 2022 09:00:00 +0000 https://marker.im/?p=656 Набор данных в основном состоит из записанных аудиофайлов, аннотированных вручную на краудсорсинговойЧитать далее

The post Датасет с размеченными речевыми данными на русском языке first appeared on Портал по разметке данных.

]]>

Набор данных в основном состоит из записанных аудиофайлов, аннотированных вручную на краудсорсинговой платформе. Общая продолжительность аудио составляет около 1240 часов.

Получить более подробную информацию о проекте, а также скачать набор данных можно по ссылке.

The post Датасет с размеченными речевыми данными на русском языке first appeared on Портал по разметке данных.

]]>
https://marker.im/2022/01/28/%d0%b4%d0%b0%d1%82%d0%b0%d1%81%d0%b5%d1%82-%d1%81-%d1%80%d0%b0%d0%b7%d0%bc%d0%b5%d1%87%d0%b5%d0%bd%d0%bd%d1%8b%d0%bc%d0%b8-%d1%80%d0%b5%d1%87%d0%b5%d0%b2%d1%8b%d0%bc%d0%b8-%d0%b4%d0%b0%d0%bd%d0%bd/feed/ 0
Записи английской речи https://marker.im/2022/01/21/%d0%b7%d0%b0%d0%bf%d0%b8%d1%81%d0%b8-%d0%b0%d0%bd%d0%b3%d0%bb%d0%b8%d0%b9%d1%81%d0%ba%d0%be%d0%b9-%d1%80%d0%b5%d1%87%d0%b8/ https://marker.im/2022/01/21/%d0%b7%d0%b0%d0%bf%d0%b8%d1%81%d0%b8-%d0%b0%d0%bd%d0%b3%d0%bb%d0%b8%d0%b9%d1%81%d0%ba%d0%be%d0%b9-%d1%80%d0%b5%d1%87%d0%b8/#respond Fri, 21 Jan 2022 09:00:00 +0000 https://marker.im/?p=644 Данные собраны из примерно 1000 часов чтения английской речи с частотой 16Читать далее

The post Записи английской речи first appeared on Портал по разметке данных.

]]>

Данные собраны из примерно 1000 часов чтения английской речи с частотой 16 кГц. Данные получены из прочитанных аудиокниг из проекта LibriVox и были тщательно сегментированы и выровнены.

Получить более подробную информацию о проекте, а также скачать набор данных можно по ссылке.

The post Записи английской речи first appeared on Портал по разметке данных.

]]>
https://marker.im/2022/01/21/%d0%b7%d0%b0%d0%bf%d0%b8%d1%81%d0%b8-%d0%b0%d0%bd%d0%b3%d0%bb%d0%b8%d0%b9%d1%81%d0%ba%d0%be%d0%b9-%d1%80%d0%b5%d1%87%d0%b8/feed/ 0