Créer un chat avec pensée étendue
- Point de terminaison Extended Thinking (pensée étendue) de l'API Anthropic Messages
- Activez et contrôlez le budget de jetons de réflexion via
thinking.type: enabledetbudget_tokens - Définissez
stream: truepour une sortie en flux - Documentation officielle : Extended Thinking
Authorizations
Request Body
ID du modèle à utiliser. Consultez le tableau de compatibilité des points de terminaison pour les modèles compatibles avec l'API Chat.
Invite système pour définir le comportement de l'assistant.
Liste des messages de la conversation. Exemple de code Python.
Température d'échantillonnage entre 0 et 2. Des valeurs plus élevées (ex. 0,8) rendent la sortie plus aléatoire ; des valeurs plus basses (ex. 0,2) la rendent plus ciblée. Nous recommandons de modifier ceci ou top_p, mais pas les deux.
Échantillonnage nucleus alternatif à la température. 0,1 signifie seulement les 10 % supérieurs de masse de probabilité. Nous recommandons de modifier ceci ou temperature, mais pas les deux.
Par défaut 1
Nombre de choix de complétion de chat à générer pour chaque message d'entrée.
Définissez true pour ce point de terminaison afin de diffuser la réflexion et la réponse via SSE.
Par défaut null. Jusqu'à 4 séquences où l'API arrête de générer des jetons.
Par défaut inf
Nombre maximal de jetons à générer dans la complétion.
La longueur totale des jetons d'entrée et générés est limitée par le contexte du modèle.
Nombre entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons selon leur apparition dans le texte. En savoir plus
Par défaut 0. Nombre entre -2,0 et 2,0. Les valeurs positives réduisent les répétitions selon la fréquence d'apparition.
Modifie la probabilité d'apparition de jetons spécifiés. Accepte un objet JSON mappant les ID de jetons à des biais de -100 à 100.
Identifiant unique de l'utilisateur final. En savoir plus
Objet spécifiant le format de sortie du modèle. { "type": "json_object" } active le mode JSON.
Fonction bêta. Si spécifié, le système tente un échantillonnage déterministe pour des requêtes répétées avec la même graine.
Liste d'outils que le modèle peut appeler. Seules les fonctions sont prises en charge actuellement.
Contrôle quelle fonction (le cas échéant) le modèle appelle. none : pas d'appel ; auto : choix entre message et fonction.
Configuration de la pensée étendue ; s'applique lorsque type est enabled.