文本生成(Chat)
Header Parameters
使用 Bearer Token 认证。 格式: Authorization: Bearer sk-xxxxxx
Request Body
application/json
模型名称,示例输入: gpt-5.3-chat deepseek-v3.2 qwen-flash qwen-flash-character qwen-plus qwen-plus-latest qwen-plus-character qwen-plus-character-ja qwen3-max qwen3-max-preview qwen3-coder-plus qwen3-coder-flash qwen3-coder-next qwen3-vl-32b-instruct qwen3-vl-32b-thinking qwen3-vl-30b-a3b-instruct qwen3-vl-30b-a3b-thinking qwen3-235b-a22b qwen3.5-plus qwen3.5-flash qwen3.5-27b qwen3.5-35b-a3b qwen3.5-122b-a10b qwen3.5-397b-a17b qwen3.6-plus qwen3.6-flash qwen3.6-35b-a3b
传递给大模型的上下文,按对话顺序排列。数组中的每个元素为一个消息对象。
是否以流式输出方式回复,默认false;false:模型生成全部内容后一次性返回; true:边生成边输出,每生成一部分内容即返回一个数据块(chunk)。需实时逐个读取这些块以拼接完整回复。
流式输出的配置项,仅在 stream 为 true 时生效。
出数据的模态,仅适用于 Qwen-Omni 模型。默认值为["text"]
采样温度,控制模型生成文本的多样性。
temperature越高,生成的文本更多样,反之,生成的文本更确定。
取值范围: [0, 2)
指定生成过程中用于采样的候选 Token 数量。值越大,输出越随机;值越小,输出越确定。若设为 null 或大于 100,则禁用 top_k 策略,仅 top_p 策略生效。取值必须为大于或等于 0 的整数。
核采样的概率阈值,控制模型生成文本的多样性。
输出音频的音色与格式,仅适用于 Qwen-Omni 模型,且modalities参数需为["text","audio"]
控制模型生成文本时的内容重复度。
返回内容的格式
用于限制模型输出的最大 Token 数。
是否将输入图像的像素上限提升至 16384 Token 对应的像素值。
生成响应的数量,取值范围是1-4。
使用混合思考(回复前既可思考也可不思考)模型时,是否开启思考模式。
思考过程的最大 Token 数。
是否开启代码解释器功能。
随机数种子。
是否返回输出 Token 的对数概率
指定在每一步生成时,返回模型最大概率的候选 Token 个数。
用于指定停止词。
包含一个或多个工具对象的数组,供模型在 Function Calling 中调用。
工具选择策略。若需对某类问题强制指定工具调用方式(例如始终使用某工具或禁用所有工具),可设置此参数。
可选值:
auto
大模型自主选择工具策略。
none
若不希望进行工具调用,可设定tool_choice参数为none;
{"type": "function", "function": {"name": "the_function_to_call"}}
若希望强制调用某个工具,可设定tool_choice参数为{"type": "function", "function": {"name": "the_function_to_call"}},其中the_function_to_call是指定的工具函数名称。
是否开启并行工具调用。
是否开启联网搜索。
联网搜索的策略。
Response Body
application/json
curl -X POST "https://api.aa.com.cn/api/v1/chat/completions" \ -H "Authorization: string" \ -H "Content-Type: application/json" \ -d '{ "model": "string", "messages": [ { "role": "system", "content": "string" } ] }'{
"id": "string",
"choices": [
{
"finish_reason": "string",
"index": 0,
"logprobs": {
"content": [
{
"token": "string",
"bytes": [
"string"
],
"logprob": 0,
"top_logprobs": [
{
"token": "string",
"bytes": [
"string"
],
"logprob": "string"
}
]
}
]
}
}
],
"created": 0,
"model": "string",
"object": "string",
"service_tier": "string",
"system_fingerprint": "string",
"usage": {
"completion_tokens": 0,
"prompt_tokens": 0,
"total_tokens": 0,
"completion_tokens_details": {
"audio_tokens": 0,
"reasoning_tokens": 0,
"text_tokens": 0,
"01KMSGQTATRB722TFAD8XP77SD": null
}
}
}