Strukturierte Ausgaben erstellen
- Anthropic Messages API Structured Outputs (strukturierte Ausgaben) Endpunkt
- Verwenden Sie
output_formatmitjson_schema, damit das Modell JSON gemäß Schema zurückgibt - Anfrage-Header
anthropic-beta: structured-outputs-2025-11-13aktiviert diese Funktion - Offizielle Dokumentation: Structured Outputs
Authorizations
Request Body
ID des zu verwendenden Modells. Siehe Kompatibilitätstabelle der Modell-Endpunkte für mit der Chat-API nutzbare Modelle.
Liste der Nachrichten des bisherigen Gesprächs. Python-Codebeispiel.
Abtasttemperatur zwischen 0 und 2. Höhere Werte (z. B. 0,8) machen die Ausgabe zufälliger; niedrigere (z. B. 0,2) fokussierter und deterministischer. Wir empfehlen, entweder dies oder top_p zu ändern, nicht beides.
Nucleus-Sampling als Alternative zur Temperatur: Das Modell berücksichtigt Tokens, deren kumulative Wahrscheinlichkeitsmasse innerhalb von top_p liegt. 0,1 bedeutet nur die oberen 10 % der Wahrscheinlichkeitsmasse. Wir empfehlen, entweder dies oder temperature zu ändern, nicht beides.
Standard 1
Wie viele Chat-Vervollständigungsoptionen pro Eingabenachricht generiert werden.
Standard false. Wenn gesetzt, werden partielle Nachrichtendeltas per SSE wie bei ChatGPT gesendet, bis der Stream mit data: [DONE] endet. Python-Codebeispiel.
Standard null. Bis zu 4 Sequenzen, bei denen die API keine weiteren Tokens generiert.
Standard inf
Maximale Anzahl zu generierender Tokens in der Chat-Vervollständigung.
Die Gesamtlänge von Eingabe- und generierten Tokens ist durch die Kontextlänge des Modells begrenzt. Python-Beispiel zum Zählen von Tokens.
Zahl zwischen -2,0 und 2,0. Positive Werte bestrafen neue Tokens nach bisherigem Vorkommen im Text und erhöhen die Wahrscheinlichkeit neuer Themen. Mehr zu Strafen
Standard 0. Zahl zwischen -2,0 und 2,0. Positive Werte bestrafen neue Tokens nach Häufigkeit im Text und reduzieren Wiederholungen. Mehr zu Frequenz- und Präsenzstrafen.
Ändert die Wahrscheinlichkeit, dass angegebene Tokens in der Vervollständigung erscheinen.
Akzeptiert ein JSON-Objekt, das Token-IDs (vom Tokenizer) auf Bias-Werte von -100 bis 100 abbildet. Bias wird vor dem Sampling zu Logits addiert; Wirkung variiert je Modell. Werte zwischen -1 und 1 verringern oder erhöhen die Auswahlwahrscheinlichkeit; -100 oder 100 sollten das Token deaktivieren oder ausschließlich wählen.
Eindeutige Kennung Ihres Endbenutzers. Hilft OpenAI bei Überwachung und Missbrauchserkennung. Mehr erfahren
Objekt, das das vom Modell zu liefernde Format angibt. { "type": "json_object" } aktiviert den JSON-Modus. Wichtig: Im JSON-Modus müssen Sie das Modell auch per System- oder User-Nachricht anweisen, JSON zu erzeugen; sonst kann es bis zum Tokenlimit Leerzeichen streamen. Bei finish_reason="length" kann der Inhalt bei Überschreitung von max_tokens oder Kontextlänge abgeschnitten werden.
Beta-Funktion. Wenn angegeben, versucht das System deterministisches Sampling, damit wiederholte Anfragen mit gleichem Seed und Parametern dasselbe Ergebnis liefern. Nicht garantiert; nutzen Sie system_fingerprint zur Überwachung von Backend-Änderungen.
Liste der Tools, die das Modell aufrufen kann. Derzeit werden nur Funktionen unterstützt. Stellen Sie Funktionen bereit, für die das Modell JSON-Eingaben erzeugen kann.
Steuert, welche Funktion (falls vorhanden) das Modell aufruft. none bedeutet keinen Funktionsaufruf, nur Nachricht. auto lässt zwischen Nachricht und Funktion wählen. Funktion erzwingen mit {"type": "function", "function": {"name": "my_function"}}. Standard none ohne Funktionen; auto bei vorhandenen Funktionen.
Konfiguration strukturierter Ausgabe; wenn type json_schema ist, schränkt schema das zurückgegebene JSON ein.