확장 사고 채팅 생성

POST

/v1/messages

Anthropic Messages API 확장 사고(Extended Thinking) 엔드포인트
thinking.type: enabled 및 budget_tokens로 사고 토큰 예산 활성화 및 제어
스트리밍 출력에는 stream: true 설정
공식 문서: Extended Thinking

Authorizations

bearer

Type

HTTP (bearer)

Request Body

application/json

object

사용할 모델 ID. 채팅 API와 함께 사용할 수 있는 모델은 모델 엔드포인트 호환성 표를 참조하세요.

어시스턴트 동작을 설정하는 시스템 프롬프트.

object[]

Required

지금까지의 대화를 구성하는 메시지 목록. Python 코드 예시.

0과 2 사이의 샘플링 온도. 높은 값(예: 0.8)은 출력을 더 무작위로, 낮은 값(예: 0.2)은 더 집중적이고 결정적으로 만듭니다. 일반적으로 top_p 또는 이 값 중 하나만 변경하는 것을 권장합니다.

온도 대신 사용하는 핵 샘플링. top_p 확률 질량 내 토큰을 고려합니다. 0.1은 상위 10% 확률 질량만 의미합니다. 일반적으로 temperature 또는 이 값 중 하나만 변경하는 것을 권장합니다.

기본값 1
각 입력 메시지에 대해 생성할 채팅 완료 선택 수.

확장 사고 엔드포인트에서는 true로 설정하여 사고 및 응답 내용을 SSE로 스트리밍합니다.

기본값 null. API가 더 이상 토큰을 생성하지 않는 최대 4개 시퀀스.

기본값 inf
채팅 완료에서 생성할 최대 토큰 수.

입력 및 생성 토큰의 총 길이는 모델 컨텍스트 길이로 제한됩니다. 토큰 계산 Python 코드 예시.

-2.0과 2.0 사이의 숫자. 양수는 지금까지 텍스트에 나타났는지에 따라 새 토큰에 페널티를 부여합니다. 빈도 및 존재 페널티 자세히

기본값 0. -2.0에서 2.0 사이. 양수는 출현 빈도에 따라 새 토큰에 페널티를 부여하여 반복을 줄입니다.

완료에 특정 토큰이 나타날 가능성을 수정합니다.
토큰 ID를 편향 값(-100~100)에 매핑하는 JSON 객체를 받습니다.

최종 사용자를 나타내는 고유 식별자. 자세히

모델이 출력해야 하는 형식을 지정하는 객체. { "type": "json_object" }로 JSON 모드를 활성화할 수 있습니다.

베타 기능. 지정 시 동일 시드와 매개변수로 반복 요청 시 동일 결과를 반환하도록 시도합니다.

모델이 호출할 수 있는 도구 목록. 현재 함수만 지원됩니다.

모델이 호출할 함수(있는 경우)를 제어합니다. none은 함수 호출 없음, auto는 메시지와 함수 중 선택.

object

확장 사고 구성. type이 enabled일 때 적용.

OpenAI 공식 형식

채팅 모드

통합 표준 API 형식

통일된 표준 형식

Chat 모드

OpenAI 호환 형식

통합 표준 API

OpenAI 호환 형식

Replicate 공식 형식

OpenAI 호환 형식

확장 사고 채팅 생성

Authorizations

Request Body

Responses

Playground

Samples

확장 사고 채팅 생성​

Authorizations​

Request Body​

Responses​

Playground​

Samples​

확장 사고 채팅 생성

Authorizations

Request Body

Responses

Playground

Samples