チャット画像認識の作成（ストリーミング）

POST

/v1/chat/completions

OpenAI Chat Completions API と互換の画像認識チャットエンドポイント（マルチモーダルメッセージ）
messages 内の image_url で画像を渡すと、モデルが画像の説明または回答を返します
リクエストボディで stream: true を設定すると SSE ストリーミング出力になります
公式ドキュメント：Chat Completions

Authorizations

bearer

Type

HTTP (bearer)

Request Body

application/json

object

使用するモデルの ID。画像認識では gpt-4o などのビジョンモデルがよく使われます。

object[]

Required

会話メッセージのリスト。画像認識では user メッセージの content はマルチモーダル配列（text + image_url）です。
system メッセージはプレーン文字列の content も使用できます（OpenAI と同様）。

0〜2 のサンプリング温度。高い値（例：0.8）は出力をよりランダムに、低い値（例：0.2）はより集中的にします。通常は top_p かこちらのどちらか一方のみ変更することを推奨します。

温度の代替となる核サンプリング。モデルは top_p 確率質量のトークンを考慮します（例：0.1 は上位 10%）。通常は temperature かこちらのどちらか一方のみ変更することを推奨します。

デフォルト 1。各入力メッセージに対して生成するチャット補完の選択数。

画像認識では true に設定してください。SSE でトークンが送信され、data: [DONE] で終了します。

デフォルト null。API がこれ以上トークンを生成しない最大 4 シーケンス。

デフォルト inf。補完で生成する最大トークン数。

入力トークンと生成トークンの合計長はモデルのコンテキスト長に制限されます。

-2.0 から 2.0 の数値。正の値はこれまでのテキストに出現したかどうかで新トークンをペナルティし、新しい話題に触れる可能性を高めます。

デフォルト 0。-2.0 から 2.0 の数値。正の値は出現頻度に基づき新トークンをペナルティし、同じ行の繰り返しを減らします。

指定トークンが補完に現れる確率を変更します。-100 から 100 のバイアス値にトークン ID をマッピングする JSON オブジェクトを受け付けます。

エンドユーザーを表す一意の識別子。OpenAI の監視・不正検知に役立ちます。詳細。

モデルが出力すべき形式を指定するオブジェクト。{ "type": "json_object" } で JSON モードを有効にします。

ベータ機能。指定すると決定的サンプリングを試みます。レスポンスの system_fingerprint でバックエンド変更を監視してください。

モデルが呼び出せるツールのリスト。現在は関数のみツールとしてサポートされています。

モデルが呼び出す関数（あれば）を制御します。none / auto / 関数名の指定。

OpenAI 公式フォーマット

チャットモード

統一標準 API フォーマット

統一標準インターフェース形式

Chat モード

OpenAI互換フォーマット

統一標準 API

OpenAI 互換形式

Replicate 公式形式

OpenAI 互換形式

チャット画像認識の作成（ストリーミング）

Authorizations

Request Body

Responses

Playground

Samples

チャット画像認識の作成（ストリーミング）​

Authorizations​

Request Body​

Responses​

Playground​

Samples​

チャット画像認識の作成（ストリーミング）

Authorizations

Request Body

Responses

Playground

Samples