Skip to content

Crear chat con pensamiento extendido

POST
/v1/messages
  • Punto de conexión Extended Thinking (pensamiento extendido) de Anthropic Messages API
  • Active y controle el presupuesto de tokens de pensamiento con thinking.type: enabled y budget_tokens
  • Establezca stream: true para salida en streaming
  • Documentación oficial: Extended Thinking

Authorizations

bearer
Type
HTTP (bearer)

Request Body

application/json
object

ID del modelo a usar. Consulte la tabla de compatibilidad de endpoints para modelos compatibles con la API Chat.

Indicación del sistema para definir el comportamiento del asistente.

object[]
Required

Lista de mensajes de la conversación. Ejemplo de código Python.

Temperatura de muestreo entre 0 y 2. Valores más altos (p. ej. 0,8) hacen la salida más aleatoria; más bajos (p. ej. 0,2) más enfocada. Recomendamos cambiar esto o top_p, no ambos.

Muestreo nucleus alternativo a temperature. 0,1 significa solo el 10 % superior de masa de probabilidad. Recomendamos cambiar esto o temperature, no ambos.

Predeterminado 1
Cuántas opciones de finalización de chat generar por mensaje de entrada.

Establezca true en este endpoint para transmitir pensamiento y respuesta por SSE.

Predeterminado null. Hasta 4 secuencias donde la API deja de generar tokens.

Predeterminado inf
Número máximo de tokens a generar en la finalización.

La longitud total de tokens de entrada y generados está limitada por el contexto del modelo.

Número entre -2,0 y 2,0. Valores positivos penalizan tokens nuevos según si ya aparecieron. Más información

Predeterminado 0. Número entre -2,0 y 2,0. Valores positivos reducen repeticiones según frecuencia.

Modifica la probabilidad de que aparezcan tokens especificados. Acepta un objeto JSON que mapea IDs de token a sesgos de -100 a 100.

Identificador único del usuario final. Más información

Objeto que especifica el formato de salida del modelo. { "type": "json_object" } activa el modo JSON.

Función beta. Si se especifica, el sistema intenta muestreo determinista para solicitudes repetidas con la misma semilla.

Lista de herramientas que el modelo puede invocar. Actualmente solo se admiten funciones.

Controla qué función (si hay) invoca el modelo. none: sin invocación; auto: elige entre mensaje y función.

object

Configuración de pensamiento extendido; aplica cuando type es enabled.

Responses

application/json
object
object[]
Required
object
Required

Playground

Authorization
Body

Samples