チャット補完の作成（非ストリーミング）

POST

/v1/chat/completions

OpenAI Chat Completions API と互換の非ストリーミングチャットエンドポイント
model パラメータで異なる AI モデルを選択
デフォルトは stream: false で、完全な補完を一度に返す
公式ドキュメント：Chat Completions

Authorizations

bearer

Type

HTTP (bearer)

Request Body

application/json

object

使用するモデル名。Chat API で利用可能なモデルはモデルエンドポイント互換表を参照してください。

object[]

Required

これまでの会話に含まれるメッセージのリスト。

0〜2 のサンプリング温度。高い値（例：0.8）は出力をよりランダムに、低い値（例：0.2）はより集中的にします。通常は top_p またはこちらのどちらか一方のみ変更することを推奨します。

温度の代替となる核サンプリング。top_p の確率質量を持つトークンのみを考慮します（例：0.1 = 上位 10%）。通常は temperature またはこちらのどちらか一方のみ変更することを推奨します。

デフォルト 1。各入力メッセージに対して生成するチャット補完の選択肢数。

本エンドポイントのデフォルトは false。省略するか false に設定すると、完全な補完を一度に受け取れます。

デフォルト null。API がこれ以上トークンを生成しない最大 4 つのシーケンス。

デフォルト inf。補完で生成する最大トークン数。

入出力トークンの合計長はモデルのコンテキスト長に制限されます。

-2.0〜2.0 の数値。これまでのテキストに出現したかどうかで新トークンをペナルティし、新しい話題の可能性を高めます。頻度・存在ペナルティの詳細

デフォルト 0。-2.0〜2.0 の数値。テキスト内の出現頻度に基づき新トークンをペナルティし、繰り返しを減らします。

指定トークンが補完に現れる確率を変更します。
トークン ID を -100〜100 のバイアス値にマッピングする JSON オブジェクト。サンプリング前に logit に適用され、効果はモデルにより異なります。

エンドユーザーの一意識別子。OpenAI の監視・不正利用検知に役立ちます。詳細

出力形式を指定するオブジェクト。{ "type": "json_object" } で JSON モードを有効化。JSON モード使用時はシステムまたはユーザーメッセージで JSON 生成を指示する必要があります。

ベータ機能。指定すると同一シード・パラメータで繰り返しリクエストした際にできるだけ決定的にサンプリングします。system_fingerprint でバックエンド変更を監視してください。

モデルが呼び出せるツールのリスト。現在は関数のみツールとしてサポートされています。

呼び出す関数を制御。none = 関数呼び出しなし、auto = モデルが選択、{"type": "function", "function": {"name": "my_function"}} で強制。関数がない場合は none、ある場合は auto がデフォルト。

OpenAI 公式フォーマット

チャットモード

統一標準 API フォーマット

統一標準インターフェース形式

Chat モード

OpenAI互換フォーマット

統一標準 API

OpenAI 互換形式

Replicate 公式形式

OpenAI 互換形式

チャット補完の作成（非ストリーミング）

Authorizations

Request Body

Responses

Playground

Samples

チャット補完の作成（非ストリーミング）​

Authorizations​

Request Body​

Responses​

Playground​

Samples​

チャット補完の作成（非ストリーミング）

Authorizations

Request Body

Responses

Playground

Samples