Skip to content
Портал по разметке данных

Портал по разметке данных

Информация о датасетах и программах разметки

  • Датасеты
    • Аудио
    • Изображения
    • Тексты
    • Видео
  • Разметка
    • Аудио
    • Изображения
    • Текст
    • Видео
    • Другое
  • Маркеры
    • NLab Marker
      • Документация Маркер
  • Кейсы
  • Блог
  • Словарь терминов

Набор данных для ответов на вопросы базы знаний

Качественный датасет состоит из 1500 русских вопросов разной сложности, их английских машинныхЧитать далее

Leave a comment

Набор данных для обнаружения спама

Набор содержит 4601 электронное письмо, помеченное как спам и не спам. ПолучитьЧитать далее

Leave a comment

Набор данных для анализа настроения клиентов авиакомпании

Набор содержит более 15 000 твитов об авиакомпаниях. Данные Twitter были извлечены сЧитать далее

Leave a comment

Набор данных из групп новостей

Набор данных состоит примерно из 20 000 документов, разделенных равномерно по 20Читать далее

Leave a comment

Набор текстовых данных для языкового моделирования для русского языка

Впервые для русского языка с нуля был разработан бенчмарк из девяти заданий,Читать далее

Leave a comment

Набор данных для ответов на вопросы «да/нет»

Эти вопросы возникают естественным образом — они генерируются без подсказок и безЧитать далее

Leave a comment

Набор данных обзоров фильмов

Это набор данных для двоичной классификации тональности. Состоит из 25 000 крайне полярныхЧитать далее

Leave a comment

Набор статей и различных публикаций

Данный набор состоит из 2,7 миллионов новостных статей и эссе из 27Читать далее

Leave a comment
  • Контакты
  • О нас
Copyright © 2022 | Nanosemantics
  • Facebook
  • Vkontakte
  • YouTube
DarkBiz Child Created By Rise Themes