Создание завершения чата (потоковая передача)

POST

/v1/chat/completions

Потоковая конечная точка чата, совместимая с OpenAI Chat Completions API
Выбор модели ИИ через параметр model
Установите stream: true в теле запроса для потоковой передачи SSE
Официальная документация: Chat Completions

Authorizations

bearer

Type

HTTP (bearer)

Request Body

application/json

object

Используемая модель. См. таблицу совместимости моделей с Chat API.

object[]

Required

Список сообщений в диалоге на данный момент.

Температура выборки от 0 до 2. Более высокие значения (напр. 0.8) делают вывод более случайным; более низкие (напр. 0.2) — более сфокусированным. Обычно рекомендуется менять либо это, либо top_p, но не оба.

Ядерная выборка вместо temperature. Модель учитывает токены с верхней массой вероятности top_p (напр. 0.1 = верхние 10%). Обычно рекомендуется менять либо это, либо temperature, но не оба.

По умолчанию 1. Сколько вариантов завершения чата генерировать для каждого входного сообщения.

Для потоковой передачи установите true. Частичные дельты сообщений отправляются через SSE; поток завершается с data: [DONE].

По умолчанию null. До 4 последовательностей, при которых API прекращает генерацию токенов.

По умолчанию inf. Максимум токенов в завершении.

Суммарная длина входных и выходных токенов ограничена контекстом модели.

Число от -2.0 до 2.0. Положительные значения штрафуют новые токены за появление в тексте, повышая вероятность новых тем. Подробнее о штрафах

По умолчанию 0. Число от -2.0 до 2.0. Положительные значения штрафуют токены по частоте в тексте, снижая повторения.

Изменяет вероятность появления указанных токенов в завершении.
JSON-объект: ID токена → смещение от -100 до 100. Применяется к logit до выборки; эффект зависит от модели.

Уникальный идентификатор конечного пользователя. Помогает OpenAI отслеживать злоупотребления. Подробнее

Формат вывода. { "type": "json_object" } включает JSON-режим. При JSON-режиме нужно также указать модели генерировать JSON в system/user сообщениях.

Бета. При указании система старается детерминированно сэмплировать; следите за изменениями через system_fingerprint в ответе.

Список инструментов, которые может вызывать модель. Сейчас поддерживаются только функции.

Какую функцию вызывать: none — не вызывать; auto — модель выбирает; принудительно — {"type": "function", "function": {"name": "my_function"}}. По умолчанию none без функций, иначе auto.

object

Дополнительные параметры

Официальный формат OpenAI

Режим чата

Единый стандартный формат API

Унифицированный стандартный формат

Режим Chat

Формат OpenAI

Единый стандартный API

Формат, совместимый с OpenAI

Официальный формат Replicate

Совместимый формат OpenAI

Создание завершения чата (потоковая передача)

Authorizations

Request Body

Responses

Playground

Samples

Создание завершения чата (потоковая передача)​

Authorizations​

Request Body​

Responses​

Playground​

Samples​

Создание завершения чата (потоковая передача)

Authorizations

Request Body

Responses

Playground

Samples