![](https://marker.im/wp-content/uploads/2022/04/portfolio-aasa-nce-2018-f-300x278.jpg)
Набор данных для ответов на вопросы базы знаний
Качественный датасет состоит из 1500 русских вопросов разной сложности, их английских машинных переводов, SPARQL-запросов к Викиданным, справочных ответов, а также ...
Далее
Далее
![](https://marker.im/wp-content/uploads/2022/04/scale_1200-300x278.jpg)
Набор данных для обнаружения спама
Набор содержит 4601 электронное письмо, помеченное как спам и не спам. Получить более подробную информацию о проекте, а также скачать ...
Далее
Далее
![](https://marker.im/wp-content/uploads/2022/04/1629991316_43-vintic-name-p-devushka-dumaet-instagram-72-300x278.jpg)
Набор данных для анализа настроения клиентов авиакомпании
Набор содержит более 15 000 твитов об авиакомпаниях. Данные Twitter были извлечены с февраля 2015 года, и участников попросили сначала классифицировать ...
Далее
Далее
![](https://marker.im/wp-content/uploads/2022/04/2678965-300x278.png)
Набор данных из групп новостей
Набор данных состоит примерно из 20 000 документов, разделенных равномерно по 20 различным группам новостей. Коллекция стала популярным набором данных ...
Далее
Далее
![](https://marker.im/wp-content/uploads/2022/02/f-2048x1000_c-300x278.png)
Набор текстовых данных для языкового моделирования для русского языка
Впервые для русского языка с нуля был разработан бенчмарк из девяти заданий, собранных и организованных по аналогии с методикой SuperGLUE. По ...
Далее
Далее
![](https://marker.im/wp-content/uploads/2022/01/iStock-177127146-300x278.jpg)
Набор данных для ответов на вопросы «да/нет»
Эти вопросы возникают естественным образом — они генерируются без подсказок и без каких-либо ограничений. Каждый пример представляет собой триплет (вопрос, ...
Далее
Далее
![](https://marker.im/wp-content/uploads/2021/12/ff8f4619-1a98-418d-9595-c794d0bee656-300x278.jpg)
Набор данных обзоров фильмов
Это набор данных для двоичной классификации тональности. Состоит из 25 000 крайне полярных обзоров фильмов для обучения и 25 000 для ...
Далее
Далее
![](https://marker.im/wp-content/uploads/2021/12/4-a1-300x278.jpg)
Набор статей и различных публикаций
Данный набор состоит из 2,7 миллионов новостных статей и эссе из 27 американских изданий. Включает дату, заголовок, публикацию, текст статьи, название ...
Далее
Далее