Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the all-in-one-seo-pack domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /var/www/html/wp-includes/functions.php on line 6121 Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the logo-carousel-free domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /var/www/html/wp-includes/functions.php on line 6121 Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the ninja-forms domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /var/www/html/wp-includes/functions.php on line 6121 Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the wp-yandex-metrika domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /var/www/html/wp-includes/functions.php on line 6121 Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the antispam-bee domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /var/www/html/wp-includes/functions.php on line 6121 Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the luckywp-glossary domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /var/www/html/wp-includes/functions.php on line 6121 Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the rise-builder domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /var/www/html/wp-includes/functions.php on line 6121 Warning: Cannot modify header information - headers already sent by (output started at /var/www/html/wp-includes/functions.php:6121) in /var/www/html/wp-content/plugins/advanced-iframe/advanced-iframe.php on line 390 Реплики для чат-бота на общую тему - Портал по разметке данных

В наше время уже никого не удивишь чат-ботом, который после уточнения некоторых параметров предложит вам наиболее подходящий продукт. Обычно такие виртуальные собеседники заточены под определённый сценарий диалога, цель которого – что-то продать или предоставить вам необходимую информацию.

Задача

В 2019 году перед нами же встала немного другая задача: написать реплики для чат-бота, который общается на повседневные темы. При этом он не просто отвечает на вопросы пользователей, но и может дать совет, поддержать и интересоваться мнением человека.

Что делали?

Мы получали от заказчика выгрузку диалогов людей с чат-ботом, состоящих из 2-3 реплик с каждой стороны. Написать реплику в продолжение каждого диалога, сохранить при этом смысловую нагрузку разговора или плавно сменить тему и побудить человека к дальнейшему общению – всё это и было нашей основной задачей.

С какими сложностями столкнулись?

На первый взгляд может показаться, что задача простая. Любой человек может написать реплики про музыку, искусство и погоду. А также не требуются специальные знания в области деятельности заказчика. Всё, что нужно от разметчика, – это грамотность и немного креативности.

Как было на самом деле?

Во-первых, наш персонаж – это не просто чат-бот с однотипными ответами. Это некая виртуальная личность со своим характером, целями и интересами. У него есть свои предпочтения в каждой сфере жизни и своё мнение по любому вопросу. Поэтому важная часть в такой работе – это инструкция заказчика, которая даёт полное описание персонажа: его любимые книги и фильмы, его хобби, его характер и манера общения. Каждый разметчик должен был войти в роль персонажа, чтобы реплики были написаны в едином образе.

Во-вторых, несмотря на наличие инструкции, каждый человек имеет свой стиль изложения. Поэтому все разметчики проходили тестирование у заказчика, по результатам которого определялась его дальнейшая возможность участия в этом проекте.

В-третьих, при написании реплик необходимо было учитывать, что персонаж должен быть человечным. Соответственно, на один и тот же вопрос чат-бот каждый раз должен отвечать по-разному, а не одной-единственной заготовленной репликой. Например, на простой вопрос “Как дела?” разметчикам необходимо было придумать более двухсот вариантов ответов.

Помимо этого, необходимо было учитывать максимальное количество символов в реплике, различные пунктуационные правила заказчика. Также важно уметь грамотно сменить тему разговора, если собеседник затрагивает такие темы, как насилие, религия и политика.

Но какими бы ни были хорошими реплики, известны случаи, когда чат-боты начинали оскорблять собеседника. Нейросеть генерирует фразы, выбирая из миллиардов слов и фраз, что позволяет персонажу “придумывать” ответы самостоятельно. Поэтому важно понимать необходимость ручного тестирования чат-бота.

Что в итоге?

За год мы написали более 500 000 реплик. На этом этапе чат-бот многое знает, умеет поддержать диалог с собеседниками. Но общение на свободную тему не имеет границ, поэтому улучшать чат-бот можно бесконечно.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *