확장 사고 채팅 생성
- Anthropic Messages API 확장 사고(Extended Thinking) 엔드포인트
thinking.type: enabled및budget_tokens로 사고 토큰 예산 활성화 및 제어- 스트리밍 출력에는
stream: true설정 - 공식 문서: Extended Thinking
Authorizations
Request Body
사용할 모델 ID. 채팅 API와 함께 사용할 수 있는 모델은 모델 엔드포인트 호환성 표를 참조하세요.
어시스턴트 동작을 설정하는 시스템 프롬프트.
지금까지의 대화를 구성하는 메시지 목록. Python 코드 예시.
0과 2 사이의 샘플링 온도. 높은 값(예: 0.8)은 출력을 더 무작위로, 낮은 값(예: 0.2)은 더 집중적이고 결정적으로 만듭니다. 일반적으로 top_p 또는 이 값 중 하나만 변경하는 것을 권장합니다.
온도 대신 사용하는 핵 샘플링. top_p 확률 질량 내 토큰을 고려합니다. 0.1은 상위 10% 확률 질량만 의미합니다. 일반적으로 temperature 또는 이 값 중 하나만 변경하는 것을 권장합니다.
기본값 1
각 입력 메시지에 대해 생성할 채팅 완료 선택 수.
확장 사고 엔드포인트에서는 true로 설정하여 사고 및 응답 내용을 SSE로 스트리밍합니다.
기본값 null. API가 더 이상 토큰을 생성하지 않는 최대 4개 시퀀스.
기본값 inf
채팅 완료에서 생성할 최대 토큰 수.
입력 및 생성 토큰의 총 길이는 모델 컨텍스트 길이로 제한됩니다. 토큰 계산 Python 코드 예시.
-2.0과 2.0 사이의 숫자. 양수는 지금까지 텍스트에 나타났는지에 따라 새 토큰에 페널티를 부여합니다. 빈도 및 존재 페널티 자세히
기본값 0. -2.0에서 2.0 사이. 양수는 출현 빈도에 따라 새 토큰에 페널티를 부여하여 반복을 줄입니다.
완료에 특정 토큰이 나타날 가능성을 수정합니다.
토큰 ID를 편향 값(-100~100)에 매핑하는 JSON 객체를 받습니다.
최종 사용자를 나타내는 고유 식별자. 자세히
모델이 출력해야 하는 형식을 지정하는 객체. { "type": "json_object" }로 JSON 모드를 활성화할 수 있습니다.
베타 기능. 지정 시 동일 시드와 매개변수로 반복 요청 시 동일 결과를 반환하도록 시도합니다.
모델이 호출할 수 있는 도구 목록. 현재 함수만 지원됩니다.
모델이 호출할 함수(있는 경우)를 제어합니다. none은 함수 호출 없음, auto는 메시지와 함수 중 선택.
확장 사고 구성. type이 enabled일 때 적용.