Базы знаний и (Embedding)
Last updated
Last updated
В этом разделе вы можете подключить базы знаний, которые ранее загружали на платформу. Для этого используйте кнопку "Добавить" и выберите нужную базу. После выбора база будет доступна вашему боту для работы.
Вы можете включить режим отладки, чтобы протестировать, как бот взаимодействует с базой знаний. В этом режиме бот не будет работать с реальными клиентами, а позволит вам проверить корректность выдачи информации.
Эти параметры доступны только на максимальном тарифе.
По умолчанию база знаний разбивается на блоки, что помогает находить нужную информацию. Вы можете настроить количество блоков, которое будет брать бот из найденных по смыслу блоков. Это важно для оптимизации расхода токенов и повышения точности ответов.
Эти параметры доступны только на максимальном тарифе.
Если вы используете ассистентов от OpenAI, вы можете загрузить PDF-файл со знаниями. Обратите внимание, что документы, прикрепленные на стороне OpenAi, должны быть также прикреплены здесь для корректной работы.
Эти параметры доступны только на максимальном тарифе.
Вы можете использовать файн-тюнинг для улучшения модели. Для этого создайте таблицу в Google Документах с вопросами и ответами (не менее 100 пар) и предоставьте открытую ссылку. После обучения модель получит уникальный номер и будет адаптирована под ваши данные. Учтите, что процесс обучения может занять от 30 минут до нескольких часов.
Эти параметры доступны только на максимальном тарифе.
Важные замечания
- Галочку "Включить файн-тюнинг" следует использовать только при изменении данных в документе.
- Обучение доступно только для моделей OpenAI.
- Базы знаний embedding могут использоваться с любыми моделями, независимо от их типа.
В этом разделе мы рассмотрим, как использовать интернет-источники для обогащения знаний вашего бота. Основной инструмент, который вам понадобится, — это функция поиска по сайту в Яндексе.
Убедитесь, что у вашего бота активирована функция поиска в Яндексе по конкретному сайту. Это позволит боту находить информацию на заданных интернет-страницах. Перед добавлением страницы убедитесь, что она проиндексирована Яндексом. Для этого введите запрос в Яндексе и проверьте, появляется ли нужная страница в результатах поиска. Если страница индексируется, она может быть использована в качестве источника знаний.
Вы можете указать конкретную страницу сайта. В этом случае Яндекс, скорее всего, выдаст именно её, так как это конкретный раздел сайта. Также можно указать адрес всего сайта. В этом случае бот будет использовать первую страницу, которую Яндекс считает наиболее релевантной по заданному ключевому слову.
Когда вы указываете адрес сайта или страницы, бот использует Яндекс для поиска по ключевым словам в рамках указанного ресурса. Яндекс предоставляет наиболее релевантный результат, и бот использует информацию с этой страницы в качестве основы для своих знаний.
Графовая память — это новая функция, находящаяся в стадии активной разработки и тестирования. Она позволяет боту не только запоминать информацию, но и устанавливать связи между различными информационными блоками. Например, бот может запомнить, кто из ваших контактов является родственником, другом или коллегой, и использовать эти связи для выполнения более сложных задач.
Графовая память может быть полезна в различных сценариях, таких как организация мероприятий или управление контактами. Она позволяет боту анализировать связи между данными и предлагать решения, основанные на этих связях.
По умолчанию бот знает только время начала диалога, но иногда этого недостаточно. Включение временных меток в каждом сообщении позволяет боту более точно отслеживать ход диалога, особенно если он длится более 24 часов. Это также позволяет продолжать диалог через несколько дней, сохраняя контекст.
Однако стоит учитывать, что сохранение контекста увеличивает расход токенов, что может повлиять на стоимость диалогов. Если экономия важнее, вы можете ограничить количество сохраняемых сообщений или отключить эту функцию.
Эта метка при включении позволяет боту получать информацию о текущем времени, дате и некоторых системных параметрах, таких как имя пользователя и канал коммуникации (например, Telegram).
Изначально временные метки были разработаны для того, чтобы бот мог отслеживать, сколько времени прошло с начала диалога. Это особенно полезно, если диалог начался, например, два часа назад, и бот предложил что-то с временным ограничением. Если пользователь ответит позже, бот сможет учесть прошедшее время и скорректировать свои действия.