元象大模型 OpenAPI 调用指南

为方便用户使用，我们提供了原生 HTTP 和 OpenAI 兼容的 SDK 来实现模型 API 的调用，主要分为两步：

创建 APIKey ；
通过 APIKey 访问对话 API。

1. 创建APIKey

访问官网开放平台中的开发者中心，完成实名认证、充值后即可创建APIKey。

2. 开始对话

拿到 APIKey 信息后，调用本接口，开始进行对话。

2.1 请求说明

2.1.1 基本信息

接口信息	说明
请求地址	https://api.xverse.cn
接口路径	/v1/chat/completions
接口请求类型	POST
字符编码	UTF-8

2.1.2 Header参数

参数名	类型	是否必填	描述
`Content-Type`	string	Y	请求的数据格式，目前仅支持 JSON 格式，固定值：application/json
`Authorization`	string	Y	请求鉴权的 APIKey，由元象提供，Bearer 开头

2.1.3 Body参数

参数名	一级子参数	类型	必填	描述
`messages`	-	List[json]	是	聊天上下文信息，说明：（1）messages 列表中的成员不能为空，1个成员表示单轮对话，多个成员表示带有历史信息；（2） messages 列表中的最后一个 message 信息为当前请求信息，前面的 message 为历史对话信息；（3）列表必须为奇数个成员，成员中的 role 必须依次为 user、assistant；（4）对话 message 的总长度（即包含历史的所有对话长度）不能超过 6144 个 token，超过后系统会做截断处理。
	`role`	string	是	对话角色，可取值：user、assistant 。其中最后一句对话角色必须是 user
	`content`	string	是	对话内容，注意最后一轮对话信息不可超过 6144个 token，否则会截断
`model`	-	string	是	使用的模型 ID，模型列表： XVERSE-MOE-A36B XVERSE-65B-2 XVERSE-13B-2
`max_tokens`	-	int	否	生成的最大 token 数量，默认为 2048，取值范围 [0, 2048]，传 0 会取默认值
`top_k`	-	int	否	影响输出文本的多样性，取值越大，生成文本的多样性越强，默认为30，取值范围[0, 100]，传 0 会取默认值
`top_p`	-	float	否	（1）影响输出文本的多样性，取值越大，生成文本的多样性越强。（2）该参数默认为0.85，取值范围 [0, 1]，传 0 会取默认值。（3）为使效果更好，建议该参数和 temperature 只设置 1 个。（4）建议 temperature 和 top_p 不要同时更改。
`temperature`	-	float	否	（1）较高的数值会使输出更加随机，较低数值会使输出更加集中和确定。（2）该参数默认为0.5，取值范围 [0, 1]，传 0 会取默认值。（3）为使效果更好，建议该参数和 top_p 只设置 1 个。（4）建议 temperature 和 top_p 不要同时更改。
`presence_penalty`	-	float	否	（1）这个参数用于减少生成文本中的重复内容，值越大代表越严格控制重复度。（2）该参数默认值为1.1，取值范围 [1, 3]，传 0 会取默认值。
`user_id`	-	string	否	用户 ID，用户唯一标识，如果填写，需跟 APIKey 对应上。
`dialog_id`	-	string	否	对话ID，由客户端生成随机的唯一 ID，标识多通同类型的对话，为 20-36 位字符串，可包含字母和数字、中划线和下划线。
`trace_id`	-	string	否	链路 ID，由客户端生成随机的唯一 ID，标识整通对话，为 20-36 位字符串，可包含字母和数字、中划线和下划线。
`stream`	-	bool	否	是否使用流式接口，缺省值为 false
`plugin`	-	string	否	插件类型，可取值：SEARCH、MODEL。SEARCH：打开搜索；MODEL：使用模型。缺省时默认使用 SEARCH（费用参考产品定价）

2.2 请求示例

2.2.1 cURL 示例

curl --location -XPOST 'https://api.xverse.cn/v1/chat/completions' \
--header 'Authorization: Bearer ${api_key}' \
--header 'Content-Type: application/json' \
--data '{
      "messages":[
            {
                  "role":"user",
                  "content": "你是谁？"
            },
            {
                  "role":"assistant",
                  "content": "我是智能对话助手。"
            },
            {
                  "role":"user",
                  "content": "静夜思的作者是谁？"
            }
      ],
      "model":"XVERSE-MOE-A36B",
      "plugin":"MODEL",
}'

2.2.2 python 示例

我们默认您已经在计算机上安装了 Python3.6 及以上版本，并且可以使用 pip 来拉取三方开源库。

1）导入处理 SSE 的标准三方库：

pip install sseclient-py

2）新建文件，执行以下代码：

import requests
from sseclient import SSEClient
import json

def process_sse(response):
    # 使用SSEClient处理流式数据
    client = SSEClient(response)

    # 初始化一个空字符串用于拼接内容
    concatenated_data = ""

    # 遍历SSE事件
    for event in client.events():
            data_json = event.data
            # 解析SSE事件的data字段，这里data是一个JSON字符串
            data_dict = json.loads(data_json)

            choices = data_dict.get('choices', [])

            for ch in choices:
                content_data = ch.get('delta', {})
                finish_reason = ch.get('finish_reason', '')
                content = content_data.get('content', '')

                # 还在进行中
                if finish_reason == '':
                    # 拼接内容
                    print(content, end='')
                    concatenated_data += content

                # 结束循环，因为数据流结束了
                elif finish_reason == 'stop':
                    break

                # 被过滤的数据进行处理
                elif finish_reason == 'content_filter':
                    print(content, end='')
                    concatenated_data += "「trigger sensitive」"
                    break

def process_non_sse(response):
    response_content = json.loads(response.content.decode('utf-8'))
    choices = response_content.get('choices', [])
    if len(choices) > 0:
        ch = choices[0]
        print(ch.get("message", {}).get("content", {}))

def fetch_chat_data(url, api_key, body_data):
    # 构建请求头信息
    headers = {
        'Authorization': f'Bearer {api_key}',
        'Content-Type': 'application/json',  # 设置请求体类型为 JSON
    }
    try:
        # 发送带有头信息和请求体的 POST 请求
        response = requests.post(url, stream=True, headers=headers, data=json.dumps(body_data))

        # 检查响应状态码
        response.raise_for_status()

        if body_data.get('stream'):
            process_sse(response)
        else:
            process_non_sse(response)

    except json.JSONDecodeError as e:
        print(f"Error decoding JSON: {e}")
        raise e

    except requests.exceptions.RequestException as e:
        print(f"Request failed: {e}")


if __name__ == "__main__":
    # 改为开发者中心新建的API Key
    api_key = 'xxxxxx'
    path = "/v1/chat/completions"
    domain = "https://api.xverse.cn"

    # 传入您想要对话的内容及上下文信息
    body_data = {
        "messages": [
            {
                "role": "user",
                "content": "你是谁"
            },
            {
                "role": "assistant",
                "content": "我是智能对话助手"
            },
            {
                "role": "user",
                "content": "静夜思的作者是谁？"
            }
        ],
        "model":"XVERSE-MOE-A36B",
        "stream": True,
        "plugin":"MODEL",
    }
    # 流式处理
    print("以下为流式处理：")
    fetch_chat_data(domain + path, api_key, body_data)

    # 非流式处理
    body_data['stream'] = False
    print("\n\n以下为非流式处理：")
    fetch_chat_data(domain + path, api_key, body_data)

2.2.3 OpenAI SDK示例

我们默认您已经在计算机上安装了 Python3.6 及以上版本，并且可以使用 pip 来拉取三方开源库。

1）导入处理 openAI 的标准三方库：

pip install openai

2）新建文件，执行如下代码：

import openai

client = openai.Client(
    base_url="https://api.xverse.cn/v1",
    api_key="xxxxxx", # 改为开发者中心新建的API Key
)

result = client.chat.completions.create(
    model="XVERSE-MOE-A36B",
    messages=[
        {"role": "user", "content": "静夜思的作者是谁"},
    ]
)

print(result)

2.3 响应说明

2.3.1 同步接口响应

2.3.1.1 HTTP Header 响应参数

参数名	类型	描述
`Content-Type`	string	响应的数据格式
`X-Request-Id`	string	请求的唯一标识 ID

2.3.1.2 HTTP Body 响应参数

字段名	一级子参数	二级子参数	类型	描述
`id`	-	-	string	'Chat completion' 的唯一标识
`object`			string	Object类型，始终为`chat.completion`
`created`	-	-	int	创建聊天完成时的 Unix 时间戳（秒）
`choices`	-	-	array[json]	聊天完成选项的列表，目前只返回一条
	`finish_reason`	-	string	模型停止生成 token 的原因，为以下值：（1） stop ：模型达到自然停止点/用户 stop 指令；（2） error：参数验证不通过或者服务内部错误
	`index`	-	int	choices 中对应的索引
	`message`	-	json	模型生成的聊天完成消息
		`role`	string	生成消息的角色，目前默认为 assistant（模型）
		`content`	string	消息内容
`usage`			json	完成请求的使用情况统计信息
	`completion_tokens`	-	int	生成词中的 token 数
	`prompt_tokens`	-	int	提示词中的 token 数
	`total_tokens`	-	int	会话的总 token 数
`error_info`			json	对话错误提示信息
	`code`	-	int	正常为0，否则会根据错误类型给出对应的code，如 `10001，10005` 等
	`message`	-	string	正常为空字符串，否则会根据错误类型给出对应的错误提示，如 `10001：服务内部错误`，`10005：鉴权失败` 等

2.3.1.2 HTTP 响应示例

{
      "id": "0SIJv20YYgXQckgRTAm8",
      "object": "chat.completion",
      "created": 1701332022,
      "model": "XVERSE-MOE-A36B",
      "choices": [
            {
                  "finish_reason": "stop",
                  "index": 0,
                  "message": {
                        "role": "assistant",
                        "content": "《静夜思》是唐代诗人李白创作的一首著名五言绝句。全诗如下：\n\n床前明月光，疑是地上霜。\n举头望明月，低头思故乡。\n\n这首诗表达了诗人在寂静的夜晚看到明亮的月光时，不禁想起远方的家乡和亲人的情感。"
                  }
            }
      ],
      "usage": {
            "prompt_tokens": 48,
            "completion_tokens": 103,
            "total_tokens": 151
      },
      "error_info": {
            "code": 0,
            "message": ""
      }
}

2.3.2 流式接口响应

2.3.2.1 HTTP Header 响应参数

参数名	类型	描述
`Content-Type`	string	响应的数据格式
`X-Request-Id`	string	请求的唯一标识 ID

2.3.2.2 HTTP Body 响应参数

字段名	一级子参数	二级子参数	类型	描述
`id`	-	-	string	'Chat completion' 的唯一标识
`created`	-	-	int	创建聊天完成时的 Unix 时间戳（秒）
`choices`	-	-	array[json]	聊天完成选项的列表
	`finish_reason`	-	string	模型停止生成 token 的原因，为以下值：（1） stop ：模型达到自然停止点/用户 stop 指令；（2）content_filter：内容被过滤，并停止数据发送；（3） error：参数验证不通过或者服务内部错误
	`index`	-	int	choices 中对应的索引
	`delta`	-	json	模型生成的聊天完成消息
		`role`	string	生成消息的角色，目前默认为 assistant（模型）
		`content`	string	消息内容
`object`			string	Object类型，始终为`chat.completion.chunk`
`usage`			json	完成请求的使用情况统计信息，只有最后的一次回复才有值
	`completion_tokens`	-	int	生成词中的 token 数
	`prompt_tokens`	-	int	提示词中的 token 数
	`total_tokens`	-	int	会话的总 token 数
`error_info`			json	对话错误提示信息
	`code`	-	int	正常为0，否则会根据错误类型给出对应的code，如 `-998，10005` 等
	`message`	-	string	正常为空字符串，否则会根据错误类型给出对应的错误提示，如 `-998：对话异常`，`10005：鉴权失败` 等

2.3.2.2 HTTP 流式响应示例

data: {"id":"IS0rbYH0BYBcActfCkAh","object":"chat.completion.chunk","created":1701329023,"choices":[{"finish_reason":"","index":0,"delta":{"role":"assistant","content":"《"}}],"error_info": {"code": 0,"message":""}}

data: {"id":"IS0rbYH0BYBcActfCkAh","object":"chat.completion.chunk","created":1701329023,"choices":[{"finish_reason":"","index":0,"delta":{"role":"assistant","content":"静"}}],"error_info": {"code": 0,"message":""}}

data: {"id":"IS0rbYH0BYBcActfCkAh","object":"chat.completion.chunk","created":1701329023,"choices":[{"finish_reason":"","index":0,"delta":{"role":"assistant","content":"夜"}}],"error_info": {"code": 0,"message":""}}

data: {"id":"IS0rbYH0BYBcActfCkAh","object":"chat.completion.chunk","created":1701329023,"choices":[{"finish_reason":"","index":0,"delta":{"role":"assistant","content":"思"}}],"error_info": {"code": 0,"message":""}}

data: {"id":"IS0rbYH0BYBcActfCkAh","object":"chat.completion.chunk","created":1701329023,"choices":[{"finish_reason":"","index":0,"delta":{"role":"assistant","content":"》"}}],"error_info": {"code": 0,"message":""}}

...

data: {"id":"IS0rbYH0BYBcActfCkAh","object":"chat.completion.chunk","created":1701329023,"choices":[{"finish_reason":"stop","index":0,"delta":{}}],"usage":{"prompt_tokens": 48,"completion_tokens": 22,"total_tokens": 70},"error_info": {"code": 0,"message":""}}

2.4 状态码

应答 Headers 中支持 HTTP 标准状态码，具体如下：

HTTP 状态码	描述	(错误)原因	解决方案
`200`	success	-	-
`401`	Invalid Authentication	无效的身份验证	1）确保使用正确的 APIKey；2）确保用户账号有充足权限
`402`	Status Payment Required	账户余额不足	充值，使得账户余额大于0
`429`	Rate limit reached for requests	发送请求的速度太快	调整您的请求速率
`500`	Internal Server Error	服务提供方服务器上的问题	在短暂等待后重试您的请求，如果问题仍然存在，请与我们联系

2.5 错误码

应答 error_info 中定义了具体的错误类型，如下所示：

code	描述	(错误)原因	解决方案
`0`	-	-	-
`-996~-999`	Abnormal Conversation	对话异常	请换个话题再试
`10001`	Internal Server Error	服务内部错误	在短暂等待后重试您的请求，如果问题仍然存在，请与我们联系
`10002`	Bad Request	请求入参有误	请检查您的请求入参类型
`10005~10007`	Authentication Failed	用户鉴权失败	请检查您的APIKey是否填写正确
`20409~20411`	Internal Server Error	服务内部错误	在短暂等待后重试您的请求，如果问题仍然存在，请与我们联系
`20416`	Too Many Conversations	对话数量过多	当前对话数过多，请稍后重试
`20501~20513`	Bad Request	请求入参有误	请检查您的请求入参
`20514`	Bad Request	请求入参有误	请求模型不支持system角色
`20601`	Insufficient Balance	余额不足	请充值后重试
`20602`	Request Too Frequent	发送请求的速度太快	当前请求过于频繁，请稍后再试

元象大模型 OpenAPI 调用指南

1. 创建APIKey​

2. 开始对话​

2.1 请求说明​

2.1.1 基本信息​

2.1.2 Header参数​

2.1.3 Body参数​

2.2 请求示例​

2.2.1 cURL 示例​

2.2.2 python 示例​

2.2.3 OpenAI SDK示例​

2.3 响应说明​

2.3.1 同步接口响应​

2.3.1.1 HTTP Header 响应参数​

2.3.1.2 HTTP Body 响应参数​

2.3.1.2 HTTP 响应示例​

2.3.2 流式接口响应​

2.3.2.1 HTTP Header 响应参数​

2.3.2.2 HTTP Body 响应参数​

2.3.2.2 HTTP 流式响应示例​

2.4 状态码​

2.5 错误码​