채팅 완료 생성 (스트리밍)

POST

/v1/messages

    - Anthropic Messages API **스트리밍** 대화 엔드포인트(네이티브 형식)
    - `model`로 Claude 모델을 선택하고 요청 본문에서 `stream: true`로 SSE 스트리밍 활성화
    - `messages`는 대화 메시지 목록이며, 선택적 `system`으로 시스템 프롬프트 설정
    - 공식 문서: [Messages](https://docs.anthropic.com/en/api/messages)

Authorizations

bearer

Type

HTTP (bearer)

Request Body

application/json

object

사용할 모델 ID. 채팅 API와 함께 사용할 수 있는 모델은 모델 엔드포인트 호환성 표를 참조하세요.

object[]

Required

지금까지의 대화를 구성하는 메시지 목록. Python 코드 예시.

0과 2 사이의 샘플링 온도. 높은 값(예: 0.8)은 출력을 더 무작위로, 낮은 값(예: 0.2)은 더 집중적이고 결정적으로 만듭니다. 일반적으로 top_p 또는 이 값 중 하나만 변경하는 것을 권장합니다.

온도 대신 사용하는 핵 샘플링. top_p 확률 질량 내 토큰을 고려합니다. 0.1은 상위 10% 확률 질량만 의미합니다. 일반적으로 temperature 또는 이 값 중 하나만 변경하는 것을 권장합니다.

기본값 1
각 입력 메시지에 대해 생성할 채팅 완료 선택 수.

스트리밍 API에서는 true로 설정. SSE로 부분 메시지 델타를 전송하며 data: [DONE]에서 스트림이 종료됩니다.

기본값 null. API가 더 이상 토큰을 생성하지 않는 최대 4개 시퀀스.

기본값 inf
채팅 완료에서 생성할 최대 토큰 수.

입력 및 생성 토큰의 총 길이는 모델 컨텍스트 길이로 제한됩니다. 토큰 계산 Python 코드 예시.

-2.0과 2.0 사이의 숫자. 양수는 지금까지 텍스트에 나타났는지에 따라 새 토큰에 페널티를 부여합니다. 빈도 및 존재 페널티 자세히

기본값 0. -2.0에서 2.0 사이. 양수는 출현 빈도에 따라 새 토큰에 페널티를 부여하여 반복을 줄입니다.

완료에 특정 토큰이 나타날 가능성을 수정합니다.
토큰 ID를 편향 값(-100~100)에 매핑하는 JSON 객체를 받습니다.

최종 사용자를 나타내는 고유 식별자. 자세히

모델이 출력해야 하는 형식을 지정하는 객체. { "type": "json_object" }로 JSON 모드를 활성화할 수 있습니다.

베타 기능. 지정 시 동일 시드와 매개변수로 반복 요청 시 동일 결과를 반환하도록 시도합니다.

모델이 호출할 수 있는 도구 목록. 현재 함수만 지원됩니다.

모델이 호출할 함수(있는 경우)를 제어합니다. none은 함수 호출 없음, auto는 메시지와 함수 중 선택.

OpenAI 공식 형식

채팅 모드

통합 표준 API 형식

통일된 표준 형식

Chat 모드

OpenAI 호환 형식

통합 표준 API

OpenAI 호환 형식

Replicate 공식 형식

OpenAI 호환 형식

채팅 완료 생성 (스트리밍)

Authorizations

Request Body

Responses

Playground

Samples

채팅 완료 생성 (스트리밍)​

Authorizations​

Request Body​

Responses​

Playground​

Samples​

채팅 완료 생성 (스트리밍)

Authorizations

Request Body

Responses

Playground

Samples