典名词元典名词元首页
API 文档
AI 模型接口文本

文本生成(Chat)

POST
/api/v1/chat/completions

Header Parameters

Authorization*string

使用 Bearer Token 认证。 格式: Authorization: Bearer sk-xxxxxx

Request Body

application/json

model*string

模型名称,示例输入: gpt-5.3-chat deepseek-v3.2 qwen-flash qwen-flash-character qwen-plus qwen-plus-latest qwen-plus-character qwen-plus-character-ja qwen3-max qwen3-max-preview qwen3-coder-plus qwen3-coder-flash qwen3-coder-next qwen3-vl-32b-instruct qwen3-vl-32b-thinking qwen3-vl-30b-a3b-instruct qwen3-vl-30b-a3b-thinking qwen3-235b-a22b qwen3.5-plus qwen3.5-flash qwen3.5-27b qwen3.5-35b-a3b qwen3.5-122b-a10b qwen3.5-397b-a17b qwen3.6-plus qwen3.6-flash qwen3.6-35b-a3b

messages*

传递给大模型的上下文,按对话顺序排列。数组中的每个元素为一个消息对象。

stream?boolean

是否以流式输出方式回复,默认false;false:模型生成全部内容后一次性返回; true:边生成边输出,每生成一部分内容即返回一个数据块(chunk)。需实时逐个读取这些块以拼接完整回复。

stream_options?

流式输出的配置项,仅在 stream 为 true 时生效。

modalities?array<string>

出数据的模态,仅适用于 Qwen-Omni 模型。默认值为["text"]

temperature?number

采样温度,控制模型生成文本的多样性。

temperature越高,生成的文本更多样,反之,生成的文本更确定。

取值范围: [0, 2)

top_k?integer

指定生成过程中用于采样的候选 Token 数量。值越大,输出越随机;值越小,输出越确定。若设为 null 或大于 100,则禁用 top_k 策略,仅 top_p 策略生效。取值必须为大于或等于 0 的整数。

top_p?number

核采样的概率阈值,控制模型生成文本的多样性。

audio?

输出音频的音色与格式,仅适用于 Qwen-Omni 模型,且modalities参数需为["text","audio"]

presence_penalty?number

控制模型生成文本时的内容重复度。

response_format?

返回内容的格式

max_tokens?integer

用于限制模型输出的最大 Token 数。

vl_high_resolution_images?boolean

是否将输入图像的像素上限提升至 16384 Token 对应的像素值。

n?integer

生成响应的数量,取值范围是1-4。

enable_thinking?boolean

使用混合思考(回复前既可思考也可不思考)模型时,是否开启思考模式。

thinking_budget?integer

思考过程的最大 Token 数。

enable_code_interpreter?boolean

是否开启代码解释器功能。

seed?integer

随机数种子。

logprobs?boolean

是否返回输出 Token 的对数概率

top_logprobs?integer

指定在每一步生成时,返回模型最大概率的候选 Token 个数。

stop?string|

用于指定停止词。

tools?

包含一个或多个工具对象的数组,供模型在 Function Calling 中调用。

tool_choice?string|

工具选择策略。若需对某类问题强制指定工具调用方式(例如始终使用某工具或禁用所有工具),可设置此参数。

可选值:

auto

大模型自主选择工具策略。

none

若不希望进行工具调用,可设定tool_choice参数为none;

{"type": "function", "function": {"name": "the_function_to_call"}}

若希望强制调用某个工具,可设定tool_choice参数为{"type": "function", "function": {"name": "the_function_to_call"}},其中the_function_to_call是指定的工具函数名称。

parallel_tool_calls?boolean

是否开启并行工具调用。

enable_search?boolean

是否开启联网搜索。

search_options?

联网搜索的策略。

Response Body

application/json

curl -X POST "https://api.aa.com.cn/api/v1/chat/completions" \  -H "Authorization: string" \  -H "Content-Type: application/json" \  -d '{    "model": "string",    "messages": [      {        "role": "system",        "content": "string"      }    ]  }'
{
  "id": "string",
  "choices": [
    {
      "finish_reason": "string",
      "index": 0,
      "logprobs": {
        "content": [
          {
            "token": "string",
            "bytes": [
              "string"
            ],
            "logprob": 0,
            "top_logprobs": [
              {
                "token": "string",
                "bytes": [
                  "string"
                ],
                "logprob": "string"
              }
            ]
          }
        ]
      }
    }
  ],
  "created": 0,
  "model": "string",
  "object": "string",
  "service_tier": "string",
  "system_fingerprint": "string",
  "usage": {
    "completion_tokens": 0,
    "prompt_tokens": 0,
    "total_tokens": 0,
    "completion_tokens_details": {
      "audio_tokens": 0,
      "reasoning_tokens": 0,
      "text_tokens": 0,
      "01KMSGQTATRB722TFAD8XP77SD": null
    }
  }
}