拡張思考チャットの作成

POST

/v1/messages

Anthropic Messages API の 拡張思考（Extended Thinking）エンドポイント
thinking.type: enabled と budget_tokens で思考トークン予算を有効化・制御
ストリーミング出力には stream: true を設定
公式ドキュメント: Extended Thinking

Authorizations

bearer

Type

HTTP (bearer)

Request Body

application/json

object

使用するモデルの ID。チャット API で利用可能なモデルはモデルエンドポイント互換性表を参照してください。

アシスタントの振る舞いを設定するシステムプロンプト。

object[]

Required

これまでの会話を構成するメッセージのリスト。Python コード例。

0 から 2 の間のサンプリング温度。高い値（例: 0.8）は出力をよりランダムに、低い値（例: 0.2）はより集中的で決定的にします。通常は top_p またはこちらのどちらか一方のみ変更することを推奨します。

温度に代わる核サンプリング。モデルは top_p の確率質量内のトークンを考慮します。0.1 は上位 10% の確率質量のみを意味します。通常は temperature またはこちらのどちらか一方のみ変更することを推奨します。

デフォルト 1
各入力メッセージに対して生成するチャット補完の選択肢数。

拡張思考エンドポイントでは true に設定し、思考と応答内容を SSE でストリーミング返却します。

デフォルト null。API がこれ以上トークンを生成しない最大 4 シーケンス。

デフォルト inf
チャット補完で生成する最大トークン数。

入力と生成トークンの合計長はモデルのコンテキスト長に制限されます。トークン数計算の Python コード例。

-2.0 から 2.0 の数値。正の値はこれまでの出現に基づき新トークンをペナルティし、新しい話題の可能性を高めます。頻度・存在ペナルティの詳細

デフォルト 0。-2.0 から 2.0 の数値。正の値は出現頻度に基づき新トークンをペナルティし、繰り返しを減らします。頻度・存在ペナルティの詳細。

補完に特定トークンが現れる確率を変更します。
トークン ID をバイアス値（-100 ～ 100）にマッピングする JSON オブジェクトを受け付けます。サンプリング前に logit に加算され、効果はモデルにより異なります。

エンドユーザーを表す一意の識別子。OpenAI の監視・不正検知に役立ちます。詳細

モデルが出力すべき形式を指定するオブジェクト。{ "type": "json_object" } で JSON モードを有効化できます。JSON モード使用時はシステムまたはユーザーメッセージで JSON 生成を指示してください。

ベータ機能。指定すると同一シード・パラメータで繰り返しリクエストした際に同じ結果を返すよう決定的サンプリングを試みます。保証はされません。system_fingerprint でバックエンド変更を監視してください。

モデルが呼び出せるツールのリスト。現在は関数のみサポート。モデルが JSON 入力を生成できる関数を提供します。

モデルが呼び出す関数（あれば）を制御。none は関数呼び出しなし、auto はメッセージと関数の選択、{"type": "function", "function": {"name": "my_function"}} で強制。関数がなければ none、あれば auto がデフォルト。

object

拡張思考の設定。type が enabled のとき有効。

OpenAI 公式フォーマット

チャットモード

統一標準 API フォーマット

統一標準インターフェース形式

Chat モード

OpenAI互換フォーマット

統一標準 API

OpenAI 互換形式

Replicate 公式形式

OpenAI 互換形式

拡張思考チャットの作成

Authorizations

Request Body

Responses

Playground

Samples

拡張思考チャットの作成​

Authorizations​

Request Body​

Responses​

Playground​

Samples​

拡張思考チャットの作成

Authorizations

Request Body

Responses

Playground

Samples