Портал по разметке данных

Информация о датасетах и программах разметки

Этот портал создала команда Наносемантики. Мы начали свой путь в освоении искусственного интеллекта в далёком 1997 году. С тех пор мы каждый день работаем над задачами по созданию нейросетей и подготовке датасетов, которые используем для своих целей, а также предлагаем заказчикам.

За это время мы накопили огромный опыт в этой области и хотим поделиться своими знаниями со всеми, кто интересуется и занимается разметкой данных и обучением нейросетей.

Что интересного мы можем вам предложить?

Также у нас есть понимание, как работает вся команда, которая трудится над конечным результатом – от разметчика, занимающегося подготовкой датасета, до датасаентиста, настраивающего нейросеть. 

Наша задача – рассказать про все шаги и показать, как добиться хорошего результата.

Всегда с интересом ждем обратной связи от вас и готовы вместе обсудить статьи, датасеты и методы разметки.

Наши клиенты

Последние записи на портале:

Виды разметки аудиоданных и где они используется

Идентификация говорящего Это процесс добавления помеченных областей к аудиопотокам и определения временных меток начала и окончания для разных выступающих. По ...
Далее

Многоязычный набор голосовых данных с открытым исходным кодом

Каждая запись в наборе данных состоит из уникального файла MP3 и соответствующего текстового файла. Многие из 20 217 записанных часов ...
Далее

Разметка аудио: что это такое и почему это важно?

Один из видов разметки данных — звуковая аннотация — является критически важным методом для построения хорошо работающих моделей обработки естественного ...
Далее

Сбор текстовых данных для машинного обучения

Датасаентист Сбербанка рассказывает о сборе текстовых данных и построении корпусов. Корпус, с точки зрения машинного обучения, - это большой датасет ...
Далее