创建聊天识图（非流式）

POST

/v1/chat/completions

兼容 OpenAI Chat Completions API 的识图对话接口（多模态消息）
在 messages 中通过 image_url 传入图片，模型返回对图像的描述或回答
默认 stream: false，一次性返回完整补全
官方文档：Chat Completions

Authorizations

bearer

Type

HTTP (bearer)

Request Body

application/json

object

要使用的模型的 ID。识图场景常用 gpt-4o 等视觉模型。

object[]

Required

对话消息列表。识图时 user 消息的 content 为多模态数组（text + image_url）。
system 消息也可使用纯字符串 content（与 OpenAI 一致）。

使用什么采样温度，介于 0 和 2 之间。较高的值（如 0.8）将使输出更加随机，而较低的值（如 0.2）将使输出更加集中和确定。我们通常建议改变这个或top_p但不是两者。

一种替代温度采样的方法，称为核采样，其中模型考虑具有 top_p 概率质量的标记的结果。所以 0.1 意味着只考虑构成前 10% 概率质量的标记。我们通常建议改变这个或temperature但不是两者。

默认为 1
为每个输入消息生成多少个聊天补全选择。

默认为 false。识图非流式接口无需设置或设为 false，一次性返回完整 JSON 响应。

默认为 null 最多 4 个序列,API 将停止进一步生成标记。

默认为 inf
在聊天补全中生成的最大标记数。

输入标记和生成标记的总长度受模型的上下文长度限制。

-2.0 和 2.0 之间的数字。正值会根据到目前为止是否出现在文本中来惩罚新标记，从而增加模型谈论新主题的可能性。

默认为 0 -2.0 到 2.0 之间的数字。正值根据文本目前的存在频率惩罚新标记,降低模型重复相同行的可能性。

修改指定标记出现在补全中的可能性。接受 JSON 对象，将 token ID 映射到 -100 到 100 的偏差值。

代表您的最终用户的唯一标识符，可以帮助 OpenAI 监控和检测滥用行为。了解更多。

指定模型必须输出的格式的对象。将 { "type": "json_object" } 启用 JSON 模式。

此功能处于测试阶段。指定后系统将尽量确定性采样；应参考 system_fingerprint 监控后端变更。

模型可以调用的一组工具列表。目前,只支持作为工具的函数。

控制模型调用哪个函数(如果有的话)。none / auto / 指定 function 名称。

OpenAI官方格式

聊天模式

统一标准接口格式

统一标准接口格式

聊天模式

OpenAI兼容格式

统一标准接口格式

OpenAI兼容格式

Replicate 官方格式

OpenAI兼容格式

创建聊天识图（非流式）

Authorizations

Request Body

Responses

Playground

Samples

创建聊天识图 （非流式）​

Authorizations​

Request Body​

Responses​

Playground​

Samples​

创建聊天识图（非流式）

Authorizations

Request Body

Responses

Playground

Samples