Crear chat con pensamiento extendido

POST

/v1/messages

Punto de conexión Extended Thinking (pensamiento extendido) de Anthropic Messages API
Active y controle el presupuesto de tokens de pensamiento con thinking.type: enabled y budget_tokens
Establezca stream: true para salida en streaming
Documentación oficial: Extended Thinking

Authorizations

bearer

Type

HTTP (bearer)

Request Body

application/json

object

ID del modelo a usar. Consulte la tabla de compatibilidad de endpoints para modelos compatibles con la API Chat.

Indicación del sistema para definir el comportamiento del asistente.

object[]

Required

Lista de mensajes de la conversación. Ejemplo de código Python.

Temperatura de muestreo entre 0 y 2. Valores más altos (p. ej. 0,8) hacen la salida más aleatoria; más bajos (p. ej. 0,2) más enfocada. Recomendamos cambiar esto o top_p, no ambos.

Muestreo nucleus alternativo a temperature. 0,1 significa solo el 10 % superior de masa de probabilidad. Recomendamos cambiar esto o temperature, no ambos.

Predeterminado 1
Cuántas opciones de finalización de chat generar por mensaje de entrada.

Establezca true en este endpoint para transmitir pensamiento y respuesta por SSE.

Predeterminado null. Hasta 4 secuencias donde la API deja de generar tokens.

Predeterminado inf
Número máximo de tokens a generar en la finalización.

La longitud total de tokens de entrada y generados está limitada por el contexto del modelo.

Número entre -2,0 y 2,0. Valores positivos penalizan tokens nuevos según si ya aparecieron. Más información

Predeterminado 0. Número entre -2,0 y 2,0. Valores positivos reducen repeticiones según frecuencia.

Modifica la probabilidad de que aparezcan tokens especificados. Acepta un objeto JSON que mapea IDs de token a sesgos de -100 a 100.

Identificador único del usuario final. Más información

Objeto que especifica el formato de salida del modelo. { "type": "json_object" } activa el modo JSON.

Función beta. Si se especifica, el sistema intenta muestreo determinista para solicitudes repetidas con la misma semilla.

Lista de herramientas que el modelo puede invocar. Actualmente solo se admiten funciones.

Controla qué función (si hay) invoca el modelo. none: sin invocación; auto: elige entre mensaje y función.

object

Configuración de pensamiento extendido; aplica cuando type es enabled.

Formato oficial de OpenAI

Modo chat

Formato API estándar unificado

Formato estándar unificado

Modo Chat

Formato OpenAI

API estándar unificado

Formato compatible con OpenAI

Formato oficial Replicate

Formato compatible con OpenAI

Crear chat con pensamiento extendido

Authorizations

Request Body

Responses

Playground

Samples

Crear chat con pensamiento extendido​

Authorizations​

Request Body​

Responses​

Playground​

Samples​

Crear chat con pensamiento extendido

Authorizations

Request Body

Responses

Playground

Samples