チャット画像認識の作成(非ストリーミング)
- OpenAI Chat Completions API と互換の画像認識チャットエンドポイント(マルチモーダルメッセージ)
messages内のimage_urlで画像を渡すと、モデルが画像の説明または回答を返します- デフォルトは
stream: falseで、完全な補完を一度に返す - 公式ドキュメント:Chat Completions
Authorizations
Request Body
使用するモデルの ID。画像認識では gpt-4o などのビジョンモデルがよく使われます。
会話メッセージのリスト。画像認識では user メッセージの content はマルチモーダル配列(text + image_url)です。
system メッセージはプレーン文字列の content も使用できます(OpenAI と同様)。
0〜2 のサンプリング温度。高い値(例:0.8)は出力をよりランダムに、低い値(例:0.2)はより集中的にします。通常は top_p かこちらのどちらか一方のみ変更することを推奨します。
温度の代替となる核サンプリング。モデルは top_p 確率質量のトークンを考慮します(例:0.1 は上位 10%)。通常は temperature かこちらのどちらか一方のみ変更することを推奨します。
デフォルト 1。各入力メッセージに対して生成するチャット補完の選択数。
デフォルトは false。非ストリーミングの画像認識では未設定または false で、完全な JSON 応答を一度に受け取ります。
デフォルト null。API がこれ以上トークンを生成しない最大 4 シーケンス。
デフォルト inf。補完で生成する最大トークン数。
入力トークンと生成トークンの合計長はモデルのコンテキスト長に制限されます。
-2.0 から 2.0 の数値。正の値はこれまでのテキストに出現したかどうかで新トークンをペナルティし、新しい話題に触れる可能性を高めます。
デフォルト 0。-2.0 から 2.0 の数値。正の値は出現頻度に基づき新トークンをペナルティし、同じ行の繰り返しを減らします。
指定トークンが補完に現れる確率を変更します。-100 から 100 のバイアス値にトークン ID をマッピングする JSON オブジェクトを受け付けます。
エンドユーザーを表す一意の識別子。OpenAI の監視・不正検知に役立ちます。詳細。
モデルが出力すべき形式を指定するオブジェクト。{ "type": "json_object" } で JSON モードを有効にします。
ベータ機能。指定すると決定的サンプリングを試みます。レスポンスの system_fingerprint でバックエンド変更を監視してください。
モデルが呼び出せるツールのリスト。現在は関数のみツールとしてサポートされています。
モデルが呼び出す関数(あれば)を制御します。none / auto / 関数名の指定。