Skip to content

Создание завершения чата (потоковая передача)

POST
/v1/chat/completions
  • Потоковая конечная точка чата, совместимая с OpenAI Chat Completions API
  • Выбор модели ИИ через параметр model
  • Установите stream: true в теле запроса для потоковой передачи SSE
  • Официальная документация: Chat Completions

Authorizations

bearer
Type
HTTP (bearer)

Request Body

application/json
object

Используемая модель. См. таблицу совместимости моделей с Chat API.

object[]
Required

Список сообщений в диалоге на данный момент.

Температура выборки от 0 до 2. Более высокие значения (напр. 0.8) делают вывод более случайным; более низкие (напр. 0.2) — более сфокусированным. Обычно рекомендуется менять либо это, либо top_p, но не оба.

Ядерная выборка вместо temperature. Модель учитывает токены с верхней массой вероятности top_p (напр. 0.1 = верхние 10%). Обычно рекомендуется менять либо это, либо temperature, но не оба.

По умолчанию 1. Сколько вариантов завершения чата генерировать для каждого входного сообщения.

Для потоковой передачи установите true. Частичные дельты сообщений отправляются через SSE; поток завершается с data: [DONE].

По умолчанию null. До 4 последовательностей, при которых API прекращает генерацию токенов.

По умолчанию inf. Максимум токенов в завершении.

Суммарная длина входных и выходных токенов ограничена контекстом модели.

Число от -2.0 до 2.0. Положительные значения штрафуют новые токены за появление в тексте, повышая вероятность новых тем. Подробнее о штрафах

По умолчанию 0. Число от -2.0 до 2.0. Положительные значения штрафуют токены по частоте в тексте, снижая повторения.

Изменяет вероятность появления указанных токенов в завершении.
JSON-объект: ID токена → смещение от -100 до 100. Применяется к logit до выборки; эффект зависит от модели.

Уникальный идентификатор конечного пользователя. Помогает OpenAI отслеживать злоупотребления. Подробнее

Формат вывода. { "type": "json_object" } включает JSON-режим. При JSON-режиме нужно также указать модели генерировать JSON в system/user сообщениях.

Бета. При указании система старается детерминированно сэмплировать; следите за изменениями через system_fingerprint в ответе.

Список инструментов, которые может вызывать модель. Сейчас поддерживаются только функции.

Какую функцию вызывать: none — не вызывать; auto — модель выбирает; принудительно — {"type": "function", "function": {"name": "my_function"}}. По умолчанию none без функций, иначе auto.

object

Дополнительные параметры

Responses

application/json
object
object[]
Required
object
Required

Playground

Authorization
Body

Samples