创建聊天识图 (非流式)
- 兼容 OpenAI Chat Completions API 的识图对话接口(多模态消息)
- 在
messages中通过image_url传入图片,模型返回对图像的描述或回答 - 默认
stream: false,一次性返回完整补全 - 官方文档:Chat Completions
Authorizations
Request Body
要使用的模型的 ID。识图场景常用 gpt-4o 等视觉模型。
对话消息列表。识图时 user 消息的 content 为多模态数组(text + image_url)。
system 消息也可使用纯字符串 content(与 OpenAI 一致)。
使用什么采样温度,介于 0 和 2 之间。较高的值(如 0.8)将使输出更加随机,而较低的值(如 0.2)将使输出更加集中和确定。 我们通常建议改变这个或top_p但不是两者。
一种替代温度采样的方法,称为核采样,其中模型考虑具有 top_p 概率质量的标记的结果。所以 0.1 意味着只考虑构成前 10% 概率质量的标记。 我们通常建议改变这个或temperature但不是两者。
默认为 1
为每个输入消息生成多少个聊天补全选择。
默认为 false。识图非流式接口无需设置或设为 false,一次性返回完整 JSON 响应。
默认为 null 最多 4 个序列,API 将停止进一步生成标记。
默认为 inf
在聊天补全中生成的最大标记数。
输入标记和生成标记的总长度受模型的上下文长度限制。
-2.0 和 2.0 之间的数字。正值会根据到目前为止是否出现在文本中来惩罚新标记,从而增加模型谈论新主题的可能性。
默认为 0 -2.0 到 2.0 之间的数字。正值根据文本目前的存在频率惩罚新标记,降低模型重复相同行的可能性。
修改指定标记出现在补全中的可能性。接受 JSON 对象,将 token ID 映射到 -100 到 100 的偏差值。
代表您的最终用户的唯一标识符,可以帮助 OpenAI 监控和检测滥用行为。了解更多。
指定模型必须输出的格式的对象。将 { "type": "json_object" } 启用 JSON 模式。
此功能处于测试阶段。指定后系统将尽量确定性采样;应参考 system_fingerprint 监控后端变更。
模型可以调用的一组工具列表。目前,只支持作为工具的函数。
控制模型调用哪个函数(如果有的话)。none / auto / 指定 function 名称。