文本生成(Chat)

Header Parameters

Authorization*string

使用 Bearer Token 认证。格式: Authorization: Bearer sk-xxxxxx

模型名称，示例输入： gpt-5.3-chat deepseek-v3.2 qwen-flash qwen-flash-character qwen-plus qwen-plus-latest qwen-plus-character qwen-plus-character-ja qwen3-max qwen3-max-preview qwen3-coder-plus qwen3-coder-flash qwen3-coder-next qwen3-vl-32b-instruct qwen3-vl-32b-thinking qwen3-vl-30b-a3b-instruct qwen3-vl-30b-a3b-thinking qwen3-235b-a22b qwen3.5-plus qwen3.5-flash qwen3.5-27b qwen3.5-35b-a3b qwen3.5-122b-a10b qwen3.5-397b-a17b qwen3.6-plus qwen3.6-flash qwen3.6-35b-a3b

messages*

传递给大模型的上下文，按对话顺序排列。数组中的每个元素为一个消息对象。

stream?boolean

是否以流式输出方式回复，默认false；false：模型生成全部内容后一次性返回； true：边生成边输出，每生成一部分内容即返回一个数据块（chunk）。需实时逐个读取这些块以拼接完整回复。

stream_options?

流式输出的配置项，仅在 stream 为 true 时生效。

modalities?array<string>

出数据的模态，仅适用于 Qwen-Omni 模型。默认值为["text"]

temperature?number

采样温度，控制模型生成文本的多样性。

temperature越高，生成的文本更多样，反之，生成的文本更确定。

取值范围： [0, 2)

top_k?integer

指定生成过程中用于采样的候选 Token 数量。值越大，输出越随机；值越小，输出越确定。若设为 null 或大于 100，则禁用 top_k 策略，仅 top_p 策略生效。取值必须为大于或等于 0 的整数。

top_p?number

核采样的概率阈值，控制模型生成文本的多样性。

audio?

输出音频的音色与格式，仅适用于 Qwen-Omni 模型，且modalities参数需为["text","audio"]

presence_penalty?number

控制模型生成文本时的内容重复度。

response_format?

返回内容的格式

max_tokens?integer

用于限制模型输出的最大 Token 数。

vl_high_resolution_images?boolean

是否将输入图像的像素上限提升至 16384 Token 对应的像素值。

n?integer

生成响应的数量，取值范围是1-4。

enable_thinking?boolean

使用混合思考（回复前既可思考也可不思考）模型时，是否开启思考模式。

thinking_budget?integer

思考过程的最大 Token 数。

enable_code_interpreter?boolean

是否开启代码解释器功能。

seed?integer

随机数种子。

logprobs?boolean

是否返回输出 Token 的对数概率

top_logprobs?integer

指定在每一步生成时，返回模型最大概率的候选 Token 个数。

stop?string|

用于指定停止词。

tools?

包含一个或多个工具对象的数组，供模型在 Function Calling 中调用。

tool_choice?string|

工具选择策略。若需对某类问题强制指定工具调用方式（例如始终使用某工具或禁用所有工具），可设置此参数。

可选值：

auto

大模型自主选择工具策略。

none

若不希望进行工具调用，可设定tool_choice参数为none；

{"type": "function", "function": {"name": "the_function_to_call"}}

若希望强制调用某个工具，可设定tool_choice参数为{"type": "function", "function": {"name": "the_function_to_call"}}，其中the_function_to_call是指定的工具函数名称。

parallel_tool_calls?boolean

是否开启并行工具调用。

enable_search?boolean

是否开启联网搜索。

search_options?

联网搜索的策略。

Response Body

application/json

curl -X POST "https://api.aa.com.cn/api/v1/chat/completions" \
  -H "Authorization: string" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "string",
    "messages": [
      {
        "role": "system",
        "content": "string"
      }
    ]
  }'

curl -X POST "https://api.aa.com.cn/api/v1/chat/completions" \  -H "Authorization: string" \  -H "Content-Type: application/json" \  -d '{    "model": "string",    "messages": [      {        "role": "system",        "content": "string"      }    ]  }'

{
  "id": "string",
  "choices": [
    {
      "finish_reason": "string",
      "index": 0,
      "logprobs": {
        "content": [
          {
            "token": "string",
            "bytes": [
              "string"
            ],
            "logprob": 0,
            "top_logprobs": [
              {
                "token": "string",
                "bytes": [
                  "string"
                ],
                "logprob": "string"
              }
            ]
          }
        ]
      }
    }
  ],
  "created": 0,
  "model": "string",
  "object": "string",
  "service_tier": "string",
  "system_fingerprint": "string",
  "usage": {
    "completion_tokens": 0,
    "prompt_tokens": 0,
    "total_tokens": 0,
    "completion_tokens_details": {
      "audio_tokens": 0,
      "reasoning_tokens": 0,
      "text_tokens": 0,
      "01KMSGQTATRB722TFAD8XP77SD": null
    }
  }
}

Header Parameters

Request Body

Response Body

200application/json

application/json