典名词元典名词元首页
API 文档
AI 模型接口文本

文本生成(Responses)

POST
/api/v1/responses

Header Parameters

Authorization*string

使用 Bearer Token 认证。 格式: Authorization: Bearer sk-xxxxxx

Request Body

application/json

model*string

模型名称, 示例输入: gpt-5.3-chat gpt-5.3-codex

top_p?number

核采样的概率阈值,控制模型生成文本的多样性。

top_p越高,生成的文本更多样。反之,生成的文本更确定。

取值范围:(0,1.0]

temperature与top_p均可以控制生成文本的多样性,建议只设置其中一个值。

enable_thinking?boolean

是否开启思考模式。开启后,模型会在回复前进行思考,思考内容将通过 reasoning 类型的输出项返回。开启思考模式时,建议开启内置工具,以在处理复杂任务时获得最佳的模型效果。

可选值:

true:开启

false:不开启

tools?

模型在生成响应时可调用的工具数组。支持内置工具和自定义 function 工具,可混合使用。

为了获得最佳回复效果,建议同时开启 code_interpreter、web_search 和 web_extractor 工具。

web_search

联网搜索工具,允许模型搜索互联网上的最新信息。相关文档:联网搜索

属性

type string (必选)

固定为web_search。

使用示例:[{"type": "web_search"}]

web_extractor

网页抽取工具,允许模型访问并提取网页内容。当前必须配合web_search工具一起使用。qwen3-max、qwen3-max-2026-01-23需要同时开启思考模式。相关文档:网页抓取

属性

code_interpreter

代码解释器工具,允许模型执行代码并返回结果,支持数据分析。qwen3-max、qwen3-max-2026-01-23需要同时开启思考模式。相关文档:代码解释器

属性

web_search_image

根据文本描述搜索图片。相关文档:文搜图

属性

type string (必选)

固定为web_search_image。

使用示例:[{"type": "web_search_image"}]

image_search

根据图片搜索相似或相关图片,输入中需要包含图片的URL。相关文档:图搜图

属性

type string (必选)

固定为image_search。

使用示例:[{"type": "image_search"}]

file_search

在已上传或关联的知识库中搜索。相关文档:知识检索

属性

type string (必选)

固定为file_search。

vector_store_ids array (必选)

要检索的知识库 ID。当前仅支持传入一个知识库 ID。

使用示例:[{"type": "file_search", "vector_store_ids": ["your_knowledge_base_id"]}]

MCP调用

通过 MCP(Model Context Protocol)调用外部服务,相关文档:MCP

属性

type string (必选)

固定为mcp。

server_protocol string (必选)

与 MCP 服务的通信协议,如 "sse"

server_label string (必选)

服务标签,用于标识该 MCP 服务。

server_description string (可选)

服务描述,帮助模型理解其功能与适用场景。

server_url string (必选)

MCP 服务端点的 URL。

headers object (可选)

请求头,用于携带身份验证等信息,如 Authorization。

使用示例:

mcp_tool = { "type": "mcp", "server_protocol": "sse", "server_label": "amap-maps", "server_description": "高德地图MCP Server现已覆盖15大核心接口,提供全场景覆盖的地理信息服务,包括生成专属地图、导航到目的地、打车、地理编码、逆地理编码、IP定位、天气查询、骑行路径规划、步行路径规划、驾车路径规划、公交路径规划、距离测量、关键词搜索、周边搜索、详情搜索等。", "server_url": "https://dashscope.aliyuncs.com/api/v1/mcps/amap-maps/sse", "headers": { "Authorization": "Bearer " } } 自定义工具 function

自定义函数工具,允许模型调用您定义的函数。当模型判断需要调用工具时,响应会返回 function_call 类型的输出。相关文档:Function Calling

属性

type string (必选)

必须设置为function。

name string (必选)

工具名称。仅允许字母、数字、下划线(_)和短划线(-),最长 64 个 Token。

description string (必选)

工具描述信息,帮助模型判断何时以及如何调用该工具。

parameters object (可选)

工具的参数描述,需要是一个合法的 JSON Schema。若parameters参数为空,表示该工具没有入参(如时间查询工具)。

为提高工具调用的准确性,建议传入 parameters。 使用示例:

[{ "type": "function", "name": "get_weather", "description": "获取指定城市的天气信息", "parameters": { "type": "object", "properties": { "city": { "type": "string", "description": "城市名称" } }, "required": ["city"] } }]

tool_choice?string|

控制模型如何选择和调用工具。此参数支持两种赋值格式:字符串模式和对象模式。

input*string|

模型输入,支持以下格式:

string:纯文本,如 "你好"。

array:消息数组,按对话顺序排列。

instructions?string

作为系统指令插入到上下文的起始位置。使用 previous_response_id 时,上一轮指定的 instructions 不会传入本轮上下文。

previous_response_id?string

上一个响应的唯一 ID,当前响应id有效期为7天。使用此参数可创建多轮对话,服务端会自动检索并组合该轮次的输入与输出作为上下文。当同时提供 input 消息数组和 previous_response_id 时,input 中的新消息会追加到历史上下文之后。不能与 conversation 同时使用。

conversation?string

当前响应所属的会话(参考Conversations API)。会话中的历史项会自动作为上下文传入本次请求,本次请求的输入和输出也会在响应完成后自动添加到会话中。不能与 previous_response_id 同时使用。

stream?boolean

是否开启流式输出。默认值为 false,设置为 true 时,模型响应数据将实时流式返回给客户端。

store?boolean

是否储存本次会话生成的模型响应。默认值为 true

false:不储存,对话内容不能被 previous_response_id 和后续 API 使用。

true:储存,当前模型响应可被 previous_response_id 和后续 API 使用。

temperature?boolean

采样温度,控制模型生成文本的多样性。

temperature越高,生成的文本更多样,反之,生成的文本更确定。

取值范围: [0, 2)

temperature与top_p均可以控制生成文本的多样性,建议只设置其中一个值。

reasoning?

控制模型的思考强度。模型会在回复前进行思考,思考内容将通过 reasoning 类型的输出项返回。

Response Body

application/json

curl -X POST "https://api.aa.com.cn/api/v1/responses" \  -H "Authorization: string" \  -H "Content-Type: application/json" \  -d '{    "model": "string",    "input": "string"  }'
{
  "id": "string",
  "model": "string",
  "object": "string",
  "usage": {
    "total_tokens": 0,
    "input_tokens": 0,
    "output_tokens": 0,
    "input_tokens_details": {
      "cached_tokens": 0
    },
    "output_tokens_details": {
      "reasoning_tokens": 0
    },
    "x_details": {
      "input_tokens": 0,
      "output_tokens": 0,
      "total_tokens": 0,
      "x_billing_type": "string"
    },
    "x_tools": {}
  },
  "created_at": 0,
  "status": "string",
  "output": [
    {
      "type": "string",
      "id": "string",
      "role": "string",
      "status": "string",
      "name": "string",
      "arguments": "string",
      "call_id": "string",
      "content": [
        {
          "type": "string",
          "text": "string",
          "annotations": "string"
        }
      ],
      "summary": [
        "string"
      ],
      "action": {
        "query": "string",
        "type": "string",
        "sources": "string"
      },
      "code": "string",
      "outputs": [
        "string"
      ],
      "container_id": "string",
      "goal": "string",
      "output": "string",
      "urls": [
        "string"
      ],
      "server_label": "string",
      "queries": [
        "string"
      ],
      "results": [
        {
          "file_id": "string",
          "filename": "string",
          "score": 0,
          "text": "string"
        }
      ]
    }
  ],
  "error ": {},
  "tools": [
    "string"
  ],
  "tool_choice": "string"
}