Créer un chat avec pensée étendue

POST

/v1/messages

Point de terminaison Extended Thinking (pensée étendue) de l'API Anthropic Messages
Activez et contrôlez le budget de jetons de réflexion via thinking.type: enabled et budget_tokens
Définissez stream: true pour une sortie en flux
Documentation officielle : Extended Thinking

Authorizations

bearer

Type

HTTP (bearer)

Request Body

application/json

object

ID du modèle à utiliser. Consultez le tableau de compatibilité des points de terminaison pour les modèles compatibles avec l'API Chat.

Invite système pour définir le comportement de l'assistant.

object[]

Required

Liste des messages de la conversation. Exemple de code Python.

Température d'échantillonnage entre 0 et 2. Des valeurs plus élevées (ex. 0,8) rendent la sortie plus aléatoire ; des valeurs plus basses (ex. 0,2) la rendent plus ciblée. Nous recommandons de modifier ceci ou top_p, mais pas les deux.

Échantillonnage nucleus alternatif à la température. 0,1 signifie seulement les 10 % supérieurs de masse de probabilité. Nous recommandons de modifier ceci ou temperature, mais pas les deux.

Par défaut 1
Nombre de choix de complétion de chat à générer pour chaque message d'entrée.

Définissez true pour ce point de terminaison afin de diffuser la réflexion et la réponse via SSE.

Par défaut null. Jusqu'à 4 séquences où l'API arrête de générer des jetons.

Par défaut inf
Nombre maximal de jetons à générer dans la complétion.

La longueur totale des jetons d'entrée et générés est limitée par le contexte du modèle.

Nombre entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons selon leur apparition dans le texte. En savoir plus

Par défaut 0. Nombre entre -2,0 et 2,0. Les valeurs positives réduisent les répétitions selon la fréquence d'apparition.

Modifie la probabilité d'apparition de jetons spécifiés. Accepte un objet JSON mappant les ID de jetons à des biais de -100 à 100.

Identifiant unique de l'utilisateur final. En savoir plus

Objet spécifiant le format de sortie du modèle. { "type": "json_object" } active le mode JSON.

Fonction bêta. Si spécifié, le système tente un échantillonnage déterministe pour des requêtes répétées avec la même graine.

Liste d'outils que le modèle peut appeler. Seules les fonctions sont prises en charge actuellement.

Contrôle quelle fonction (le cas échéant) le modèle appelle. none : pas d'appel ; auto : choix entre message et fonction.

object

Configuration de la pensée étendue ; s'applique lorsque type est enabled.

Format officiel OpenAI

Mode chat

Format API standard unifié

Format standard unifié

Mode Chat

Format OpenAI

API standard unifié

Format compatible OpenAI

Format officiel Replicate

Format compatible OpenAI

Créer un chat avec pensée étendue

Authorizations

Request Body

Responses

Playground

Samples

Créer un chat avec pensée étendue​

Authorizations​

Request Body​

Responses​

Playground​

Samples​

Créer un chat avec pensée étendue

Authorizations

Request Body

Responses

Playground

Samples