Обучение ИИ векторному методу

Искусственный интеллект стал надёжным помощником в решении множества повседневных и профессиональных задач — от написания текстов до анализа данных. Наибольшую популярность обрели Генеративные модели ИИ благодаря своей способности создавать новые данные, опираясь на информацию, использованную в процессе их обучения. Объясняя простым языком, они могут создавать тексты, изображения, музыку или другие типы контента, имитируя стиль и структуру исходных данных, при этом формируя уникальные и оригинальные варианты ответа, не являющиеся дословным повторением исходного материала.

Одна из проблем, с которой часто сталкиваются пользователи, которые используют Генеративную модель ИИ – получение ложной или искаженной информации. Искусственный интеллект может "уверенно" отвечать неправильно, если не ограничен контекстом или не знает, где искать достоверный источник. Данное явление называют "галлюцинацией ИИ".

Такое поведение недопустимо, если мы работаем с технической, юридической документацией или другими материалами, где чрезвычайно важна точность ответа.

Решением становится метод подбора — подход, при котором ИИ не "выдумывает" ответ, а выбирает наиболее релевантный фрагмент из заранее подготовленной базы знаний.

В данной инструкции мы подробно рассмотрим процесс обучения ИИ методу подбора.

hashtag Что такое метод подбора?

Метод подбора — это способ, с помощью которого искусственный интеллект находит наиболее подходящий объект из множества возможных, основываясь на определённой логике или метрике сходства. Такой подход позволяет извлекать наиболее релевантные данные из подготовленного набора, минимизируя риск ошибки.

hashtag Для обучения нам понадобятся следующие платформы и сервисы:

NocoDB
n8n
Pinecone
OpenAI

hashtag Формирование базы данных

В первую очередь нам необходимо подготовить данные для загрузки в ИИ и сформировать базу данных в формате вопрос-ответ. Сделать это можно на платформе NocoDB, однако быстрее и проще будет создать подходящий список в Google Sheets.

Открываем Google Sheets и создаем таблицу

В созданной таблице создаем две колонки – question (вопрос) и answer (ответ).

Перерабатываем материал в вопрос-ответы

Берём интересующий материал и формируем вопросы и ответы.

Чем больше будет синонимичных вопросов, тем более точно ИИ будет подбирать ответ. Рекомендуется минимум 10 вопросов на каждый ответ. Один вопрос — одна строка.

Рекомендуемая длина листа в Google Sheets — не более 150 строк, чтобы потом не возникло проблем при импорте в NocoDB.

Скачиваем листы в формате CSV

После формирования базы вопросов и ответов скачиваем каждый лист в формате CSV.

Создаём базу в NocoDB и таблицу

Открываем NocoDB, нажимаем Create Base, задаём имя и снова Create Base.

Создаём новую таблицу (Create Table), переименовываем колонку Title в нужное имя (Edit field) и меняем тип поля на Long text.

Добавляем дополнительные колонки

Добавляем ещё 4 колонки (к уже переименованной Title), итого должно получиться 5 колонок:

question — Field type: Long text
answer — Field type: Long text
embedded — Field type: Checkbox
to_embed — Field type: Checkbox (значение Default value должно быть включено)
to_delete — Field type: Checkbox

Импортируем CSV в NocoDB

Нажимаем на три вертикальных точки → Upload → Upload CSV.
Перетягиваем CSV или загружаем из файловой системы.
Важно: названия колонок в CSV и таблице NocoDB должны совпадать. Либо вручную сопоставьте столбцы.
Нажмите Import.

После успешного импорта вы увидите таблицу с загруженными строками.

hashtag Создание индексов в Pinecone

Pinecone — облачная векторная база данных. При передаче текста в ИИ он преобразуется в вектор (массив чисел), отражающий смысл текста. Для эффективного поиска похожих векторов используют индекс — структуру, оптимизированную для быстрого поиска.

Создаём индекс в Pinecone

Откройте Pinecone и нажмите Create index.

Настройки индекса

Введите название индекса и поставьте галочку на Custom settings.

Конфигурация: Dimension

В разделе Configuration установите Dimension = 3072.

Создание индекса

Нажмите Create index и после создания скопируйте ссылку на индекс — она потребуется далее.

hashtag Обучение ИИ по базе знаний (загрузка эмбеддингов в Pinecone через n8n)

Создаём Workflow в n8n

В n8n создаём новый Workflow.
Цепочка узлов будет выглядеть так (схема в оригинале):

Краткое описание узлов:

Schedule Trigger — триггер по расписанию.
NocoDB — получает строки (вопросы/ответы) из таблицы.
HTTP Request — запрос к OpenAI для генерации эмбеддингов.
Embeddings — формирует массив векторов.
50 Vectors — формирует пакет из 50 векторов для загрузки.
Upsert — загружает векторы в Pinecone.
Mark as Embedded — помечает записи в NocoDB как обработанные.

Schedule Trigger

Устанавливаем интервал запуска цепочки (если нужно автоматизировать пополнение векторов).

NocoDB (получение данных)

В узле выбираем Credential (NocoDB и Pinecone должны быть настроены в n8n как Credentials).
Указываем Project Name и Table name.
В Options → Fields указываем: - I d,question,answer
В поле Filter by Formula используем фильтр:

(embedded,eq,false)~and(to_embed,eq,true)~and(question,neq,)~and(question,isnot,null)~and(answer,neq,)~and(answer,isnot,null)~and(to_delete,eq,false)

В n8n должны быть созданы Credentials для NocoDB (Name + API Token) и Pinecone (Name + API Key). Это требуется для доступа к сервисам.

HTTP Request (вызов OpenAI embeddings)

Заполняем Header Parameters: Authorization: Bearer OPENAI_KEY (замените OPENAI_KEY на ваш ключ в формате Bearer).
В Body Parameters передаём:

Name: input Value: {{ $json.question }}

Name: model Value: text-embedding-3-large

Embeddings (обработка ответа OpenAI)

Узел получает эмбеддинги от OpenAI и передаёт их дальше.

50 Vectors (формирование пакета для Pinecone)

В узле Code используем такой код:

const vectors = $input.all()
.map(i => i.json)
.map((vector,index) => {
  return {
    values: vector.data[0].embedding,
    id: "Id-" + vector.Id.toString(),
    metadata: {
      question: vector.question,
      answer: vector.answer
    }
  }
})

const mark_as_embedded = vectors.map(vector => ({Id: Number(vector.id.split('-')[1]), embedded: true}))

return [{vectors,mark_as_embedded}];

Код подготовит массив векторов для загрузки в Pinecone и массив для пометки записей в NocoDB как embedded.

Upsert (загрузка в Pinecone)

URL: https://<cсылка_на_pinecone>/vectors/upsert
Method: POST
Authentication: Predefined (Credential Type: PineconeApi)
Header Parameters: accept: application/json
Body Parameters: vectors = {{ $json.vectors }}

Mark as Embedded (пометка записей в NocoDB)

URL: https://<Адрес_nocodb>/api/v2/tables/<айди_таблицы>/records
Method: PATCH
Authentication: Predefined (Credential Type: NocoDB API Token)
Header: accept: application/json
В Body (тип: Expression) указываем:

{{ JSON.stringify($('50 Vectors').first().json.mark_as_embedded) }}

Сохраняем Workflow и запускаем вручную или по триггеру. После успешного выполнения в колонке embedded появятся галочки — данные загружены в Pinecone.

hashtag Настройка сценария в Smartbot

Войдите в личный кабинет Smartbot и перейдите в раздел "Сценарии".
Нажмите "Создать сценарий", задайте имя и создайте сценарий.

Схематически сценарий состоит из 7 блоков:

Нет подходящего сценария
Выполнить SmartQuery
Выполнить SmartQuery
Отправить HTTP-запрос
Webhook
Выполнить SmartQuery
Отправить сообщение

Краткая расшифровка блоков:

Блок 1: Нет подходящего сценария — реагирует на любое сообщение пользователя, запускает цепочку.
Блок 2: Выполнить SmartQuery — техническая связка (промежуточный блок).
Блок 3: Выполнить SmartQuery — готовит URL и тело запроса.

Пример переменных и тела (в блоке 3):

%string_temp% = %n8n_url% + "/webhook/test_new_request"

%body% = {
    "question": %message_text%,
    "user_id": %user_id%
}

%response_data% = {}
%response_data_status% = 0

%string_temp% — итоговый URL.
%body% — передаём вопрос и ID пользователя.
%n8n_url% — ссылка на ваш n8n сервер.

Важно: URL должен совпадать с Path вебхука в n8n.

Блок 4: Отправить HTTP-запрос — POST %string_temp% с телом {{ %body% | to_json }} и заголовком content-type: application/json.

Блок 5: Webhook — принимает ответ от n8n. Для работы создайте API-токен в Smartbot и выберите его в настройках Webhook.

Блок 6: Выполнить SmartQuery — извлекаем ответ из Webhook и сохраняем в переменную %bot_message%:

%bot_message% = %public_api_data%['answer']

Блок 7: Отправить сообщение — выводим %bot_message% пользователю.


---

## [hashtag](https://docs.nocodecloud.ru/ai/vectorized-learning\#otpravka-otveta-iz-pinecone-v-smartbot) Отправка ответа из Pinecone в Smartbot (поиск и возврат ответа)

В этом разделе разобран рабочий процесс в n8n, который:
- принимает запрос от Smartbot (вопрос пользователя),  
- генерирует эмбеддинг вопроса (OpenAI),  
- ищет наиболее подходящий ответ в Pinecone,  
- отправляет результат обратно в Smartbot.

Создаём Workflow в n8n со следующими узлами (схема в оригинале):

![](https://docs.nocodecloud.ru/~gitbook/image?url=https%3A%2F%2F3293471040-files.gitbook.io%2F%7E%2Ffiles%2Fv0%2Fb%2Fgitbook-x-prod.appspot.com%2Fo%2Fspaces%252FpmSoFQGl5UWE6cvo4nGS%252Fuploads%252FV14I1m5sEq5JmgsB1QZJ%252Fimage.png%3Falt%3Dmedia%26token%3D8318f8b2-5f02-4987-aed2-06fb89a8a229&width=768&dpr=4&quality=100&sign=743e006a&sv=2)

Краткое описание узлов:
- Webhook — принимает запрос от Smartbot (вопрос и user_id).  
- Get vectorized — отправляет вопрос в OpenAI и получает эмбеддинг.  
- Get the nearest reply — отправляет эмбеддинг в Pinecone для поиска ближайших векторов.  
- If — проверяет наличие совпадений.  
- Code (успех) — формирует тело ответа из Pinecone.  
- HTTP Request (успех) — отправляет ответ в Smartbot.  
- Code (неудача) / HTTP Request (неудача) — формируют и отправляют ответ при отсутствии совпадений.

### Параметры ключевых узлов

#### Webhook
- Method: POST  
- Path: (часть URL для вызова) — должен совпадать с тем, что указан в Smartbot  
- Respond: Immediately

![](https://docs.nocodecloud.ru/~gitbook/image?url=https%3A%2F%2F3293471040-files.gitbook.io%2F%7E%2Ffiles%2Fv0%2Fb%2Fgitbook-x-prod.appspot.com%2Fo%2Fspaces%252FpmSoFQGl5UWE6cvo4nGS%252Fuploads%252FfbEjD9uwrmwewdRaFnrJ%252Fimage.png%3Falt%3Dmedia%26token%3D4ee4e256-912e-4c4b-8947-a812e24ecc0d&width=768&dpr=4&quality=100&sign=dc16e7ae&sv=2)

#### Get vectorized (OpenAI embeddings)
- Method: POST  
- URL: https://api.openai.com/v1/embeddings  
- Authentication: Predefined (Credential Type: OpenAi)  
- Model: text-embedding-3-large  

Body parameters:
- input: {{ $json.question }}  
- model: text-embedding-3-large

![](https://docs.nocodecloud.ru/~gitbook/image?url=https%3A%2F%2F3293471040-files.gitbook.io%2F%7E%2Ffiles%2Fv0%2Fb%2Fgitbook-x-prod.appspot.com%2Fo%2Fspaces%252FpmSoFQGl5UWE6cvo4nGS%252Fuploads%252FgA3FQvh54cSQ0TkmlueV%252Fimage.png%3Falt%3Dmedia%26token%3Dfdd534fb-d92d-46c0-a081-fe5367d91bfe&width=768&dpr=4&quality=100&sign=b4d73604&sv=2)

#### Get the nearest reply (Pinecone query)
- Method: POST  
- URL: https://<ваш_pinecone>/query  
- Authentication: Predefined (PineconeApi)  
- Header: accept: application/json

Body parameters:
- vector: {{ $json.data[0].embedding }}  
- topK: 10  
- includeMetadata: {{ true }}

![](https://docs.nocodecloud.ru/~gitbook/image?url=https%3A%2F%2F3293471040-files.gitbook.io%2F%7E%2Ffiles%2Fv0%2Fb%2Fgitbook-x-prod.appspot.com%2Fo%2Fspaces%252FpmSoFQGl5UWE6cvo4nGS%252Fuploads%252FyM2nYMeCG99LrmYsspSW%252Fimage.png%3Falt%3Dmedia%26token%3Db9d9229a-18a4-4fb4-b7fc-79140ff36dba&width=768&dpr=4&quality=100&sign=d7b0f2df&sv=2)

#### If (проверка совпадений)
- Условие:

```text
{{ $('Get the nearest reply').first().json.matches }}

Проверка: is not empty

Code (успех) — формирование тела ответа

Пример кода для формирования тела ответа в случае совпадения:

var data = {
  "answer": $('Get the nearest reply').first().json.matches[0].metadata.answer,
  "score": $('Get the nearest reply').item.json.matches[0].score
}

var body = {
  "access_token": "d_RzF82z4TXML5_ZnMcrdJS2Y_K8kQNZNzkJZ-ORgI24v1STJEt55EgFXGEaILR6",
  "v": "0.0.1",
  "channel_id": "7779600502",
  "block_id": "6808dbe10aa22020da97a62f",
  "peer_id": $('Webhook').first().json.body.user_id,
  "data": data
}

return {
  body
}

Внимание: access_token, channel_id и block_id — примеры из инструкции. Используйте ваши реальные значения.

HTTP Request (успех) — отправка ответа в Smartbot

Method: POST
URL: https://api.smartbotpro.ru/blocks/execute
Authentication: None
Body Content Type: JSON
Body Parameters: {{ JSON.stringify($json.body) }}

Code1 (совпадений не найдено)

Пример тела для случая отсутствия совпадений:

var data = {
  "answer": 'Ответ не найден',
  "score": 0.00
}

var body = {
  "access_token": "d_RzF82z4TXML5_ZnMcrdJS2Y_K8kQNZNzkJZ-ORgI24v1STJEt55EgFXGEaILR6",
  "v": "0.0.1",
  "channel_id": "7779600502",
  "block_id": "6808dbe10aa22020da97a62f",
  "peer_id": $('Webhook').first().json.body.user_id,
  "data": data
}

return {
  body
}

HTTP Request1 (не найден ответ)

Method: POST
URL: https://api.smartbotpro.ru/blocks/execute
Authentication: None
Body Content Type: JSON
Body Parameters: {{ JSON.stringify($json.body) }}

Если нужно, могу:

Сгенерировать готовые JSON/пример конфигурации для узлов n8n (Webhook, HTTP Request, Upsert в Pinecone и т.п.).
Помочь адаптировать сценарий под ваши реальные access_token / channel_id / block_id (без публикации чувствительных данных — подскажу, где заменить).

Хотите, чтобы я подготовил экспорт n8n workflow (в виде JSON) под вашу конфигурацию?

PreviousТриггеры в n8n

Good night

hashtaghashtag Что такое метод подбора?

hashtaghashtag Для обучения нам понадобятся следующие платформы и сервисы:

hashtaghashtag Формирование базы данных

hashtagОткрываем Google Sheets и создаем таблицу

hashtagПерерабатываем материал в вопрос-ответы

hashtagСкачиваем листы в формате CSV

hashtagСоздаём базу в NocoDB и таблицу

hashtagДобавляем дополнительные колонки

hashtagИмпортируем CSV в NocoDB

hashtaghashtag Создание индексов в Pinecone

hashtagСоздаём индекс в Pinecone

hashtagНастройки индекса

hashtagКонфигурация: Dimension

hashtagСоздание индекса

hashtaghashtag Обучение ИИ по базе знаний (загрузка эмбеддингов в Pinecone через n8n)

hashtagСоздаём Workflow в n8n

hashtagSchedule Trigger

hashtagNocoDB (получение данных)

hashtagHTTP Request (вызов OpenAI embeddings)

hashtagEmbeddings (обработка ответа OpenAI)

hashtag50 Vectors (формирование пакета для Pinecone)

hashtagUpsert (загрузка в Pinecone)

hashtagMark as Embedded (пометка записей в NocoDB)

hashtaghashtag Настройка сценария в Smartbot

hashtag Что такое метод подбора?

hashtag Для обучения нам понадобятся следующие платформы и сервисы:

hashtag Формирование базы данных

Открываем Google Sheets и создаем таблицу

Перерабатываем материал в вопрос-ответы

Скачиваем листы в формате CSV

Создаём базу в NocoDB и таблицу

Добавляем дополнительные колонки

Импортируем CSV в NocoDB

hashtag Создание индексов в Pinecone

Создаём индекс в Pinecone

Настройки индекса

Конфигурация: Dimension

Создание индекса

hashtag Обучение ИИ по базе знаний (загрузка эмбеддингов в Pinecone через n8n)

Создаём Workflow в n8n

Schedule Trigger

NocoDB (получение данных)

HTTP Request (вызов OpenAI embeddings)

Embeddings (обработка ответа OpenAI)

50 Vectors (формирование пакета для Pinecone)

Upsert (загрузка в Pinecone)

Mark as Embedded (пометка записей в NocoDB)

hashtag Настройка сценария в Smartbot