채팅 완료 생성 (스트리밍)
- Anthropic Messages API **스트리밍** 대화 엔드포인트(네이티브 형식)
- `model`로 Claude 모델을 선택하고 요청 본문에서 `stream: true`로 SSE 스트리밍 활성화
- `messages`는 대화 메시지 목록이며, 선택적 `system`으로 시스템 프롬프트 설정
- 공식 문서: [Messages](https://docs.anthropic.com/en/api/messages)
Authorizations
Request Body
사용할 모델 ID. 채팅 API와 함께 사용할 수 있는 모델은 모델 엔드포인트 호환성 표를 참조하세요.
지금까지의 대화를 구성하는 메시지 목록. Python 코드 예시.
0과 2 사이의 샘플링 온도. 높은 값(예: 0.8)은 출력을 더 무작위로, 낮은 값(예: 0.2)은 더 집중적이고 결정적으로 만듭니다. 일반적으로 top_p 또는 이 값 중 하나만 변경하는 것을 권장합니다.
온도 대신 사용하는 핵 샘플링. top_p 확률 질량 내 토큰을 고려합니다. 0.1은 상위 10% 확률 질량만 의미합니다. 일반적으로 temperature 또는 이 값 중 하나만 변경하는 것을 권장합니다.
기본값 1
각 입력 메시지에 대해 생성할 채팅 완료 선택 수.
스트리밍 API에서는 true로 설정. SSE로 부분 메시지 델타를 전송하며 data: [DONE]에서 스트림이 종료됩니다.
기본값 null. API가 더 이상 토큰을 생성하지 않는 최대 4개 시퀀스.
기본값 inf
채팅 완료에서 생성할 최대 토큰 수.
입력 및 생성 토큰의 총 길이는 모델 컨텍스트 길이로 제한됩니다. 토큰 계산 Python 코드 예시.
-2.0과 2.0 사이의 숫자. 양수는 지금까지 텍스트에 나타났는지에 따라 새 토큰에 페널티를 부여합니다. 빈도 및 존재 페널티 자세히
기본값 0. -2.0에서 2.0 사이. 양수는 출현 빈도에 따라 새 토큰에 페널티를 부여하여 반복을 줄입니다.
완료에 특정 토큰이 나타날 가능성을 수정합니다.
토큰 ID를 편향 값(-100~100)에 매핑하는 JSON 객체를 받습니다.
최종 사용자를 나타내는 고유 식별자. 자세히
모델이 출력해야 하는 형식을 지정하는 객체. { "type": "json_object" }로 JSON 모드를 활성화할 수 있습니다.
베타 기능. 지정 시 동일 시드와 매개변수로 반복 요청 시 동일 결과를 반환하도록 시도합니다.
모델이 호출할 수 있는 도구 목록. 현재 함수만 지원됩니다.
모델이 호출할 함수(있는 경우)를 제어합니다. none은 함수 호출 없음, auto는 메시지와 함수 중 선택.