Skip to content
Портал по разметке данных

Портал по разметке данных

Информация о датасетах и программах разметки

  • Датасеты
    • Аудио
    • Изображения
    • Тексты
    • Видео
  • Разметка
    • Аудио
    • Изображения
    • Текст
    • Видео
    • Другое
  • Маркеры
    • NLab Marker
  • Кейсы
  • Блог
  • Словарь терминов

Рубрика: Тексты-д

Набор данных для ответов на вопросы базы знаний

Качественный датасет состоит из 1500 русских вопросов разной сложности, их английских машинныхЧитать далее

Добавить комментарий

Набор данных для обнаружения спама

Набор содержит 4601 электронное письмо, помеченное как спам и не спам. ПолучитьЧитать далее

Добавить комментарий

Набор данных для анализа настроения клиентов авиакомпании

Набор содержит более 15 000 твитов об авиакомпаниях. Данные Twitter были извлечены сЧитать далее

Добавить комментарий

Набор данных из групп новостей

Набор данных состоит примерно из 20 000 документов, разделенных равномерно по 20Читать далее

Добавить комментарий

Набор текстовых данных для языкового моделирования для русского языка

Впервые для русского языка с нуля был разработан бенчмарк из девяти заданий,Читать далее

Добавить комментарий

Набор данных для ответов на вопросы «да/нет»

Эти вопросы возникают естественным образом — они генерируются без подсказок и безЧитать далее

Добавить комментарий

Набор данных обзоров фильмов

Это набор данных для двоичной классификации тональности. Состоит из 25 000 крайне полярныхЧитать далее

Добавить комментарий

Набор статей и различных публикаций

Данный набор состоит из 2,7 миллионов новостных статей и эссе из 27Читать далее

Добавить комментарий
  • Контакты
  • О нас
Copyright © 2022 | Nanosemantics
  • Facebook
  • Vkontakte
  • YouTube
DarkBiz Child Created By Rise Themes