Skip to content

チャット画像認識の作成(ストリーミング)

POST
/v1/chat/completions
  • OpenAI Chat Completions API と互換の画像認識チャットエンドポイント(マルチモーダルメッセージ)
  • messages 内の image_url で画像を渡すと、モデルが画像の説明または回答を返します
  • リクエストボディで stream: true を設定すると SSE ストリーミング出力になります
  • 公式ドキュメント:Chat Completions

Authorizations

bearer
Type
HTTP (bearer)

Request Body

application/json
object

使用するモデルの ID。画像認識では gpt-4o などのビジョンモデルがよく使われます。

object[]
Required

会話メッセージのリスト。画像認識では user メッセージの content はマルチモーダル配列(text + image_url)です。
system メッセージはプレーン文字列の content も使用できます(OpenAI と同様)。

0〜2 のサンプリング温度。高い値(例:0.8)は出力をよりランダムに、低い値(例:0.2)はより集中的にします。通常は top_p かこちらのどちらか一方のみ変更することを推奨します。

温度の代替となる核サンプリング。モデルは top_p 確率質量のトークンを考慮します(例:0.1 は上位 10%)。通常は temperature かこちらのどちらか一方のみ変更することを推奨します。

デフォルト 1。各入力メッセージに対して生成するチャット補完の選択数。

画像認識では true に設定してください。SSE でトークンが送信され、data: [DONE] で終了します。

デフォルト null。API がこれ以上トークンを生成しない最大 4 シーケンス。

デフォルト inf。補完で生成する最大トークン数。

入力トークンと生成トークンの合計長はモデルのコンテキスト長に制限されます。

-2.0 から 2.0 の数値。正の値はこれまでのテキストに出現したかどうかで新トークンをペナルティし、新しい話題に触れる可能性を高めます。

デフォルト 0。-2.0 から 2.0 の数値。正の値は出現頻度に基づき新トークンをペナルティし、同じ行の繰り返しを減らします。

指定トークンが補完に現れる確率を変更します。-100 から 100 のバイアス値にトークン ID をマッピングする JSON オブジェクトを受け付けます。

エンドユーザーを表す一意の識別子。OpenAI の監視・不正検知に役立ちます。詳細

モデルが出力すべき形式を指定するオブジェクト。{ "type": "json_object" } で JSON モードを有効にします。

ベータ機能。指定すると決定的サンプリングを試みます。レスポンスの system_fingerprint でバックエンド変更を監視してください。

モデルが呼び出せるツールのリスト。現在は関数のみツールとしてサポートされています。

モデルが呼び出す関数(あれば)を制御します。none / auto / 関数名の指定。

Responses

application/json
object
object[]
Required
object
Required

Playground

Authorization
Body

Samples