元象大模型 OpenAPI 调用指南
为方便用户使用,我们提供了原生 HTTP 和 OpenAI 兼容的 SDK 来实现模型 API 的调用,主要分为两步:
- 创建
APIKey
; - 通过
APIKey
访问对话 API。
1. 创建APIKey
访问官网开放平台中的开发者中心,完成实名认证、充值后即可创建APIKey。
2. 开始对话
拿到 APIKey 信息后,调用本接口,开始进行对话。
2.1 请求说明
2.1.1 基本信息
接口信息 | 说明 |
---|---|
请求地址 | https://api.xverse.cn |
接口路径 | /v1/chat/completions |
接口请求类型 | POST |
字符编码 | UTF-8 |
2.1.2 Header参数
参数名 | 类型 | 是否必填 | 描述 |
---|---|---|---|
Content-Type | string | Y | 请求的数据格式,目前仅支持 JSON 格式,固定值:application/json |
Authorization | string | Y | 请求鉴权的 APIKey,由元象提供,Bearer 开头 |
2.1.3 Body参数
参数名 | 一级子参数 | 类型 | 必填 | 描述 |
---|---|---|---|---|
messages | - | List[json] | 是 | 聊天上下文信息,说明: (1)messages 列表中的成员不能为空,1个成员表示单轮对话,多个成员表示带有历史信息; (2) messages 列表中的最后一个 message 信息为当前请求信息,前面的 message 为历史对话信息; (3)成员中的 role 必须依次为 user、assistant,否则会影响对话效果。 |
role | string | 是 | 对话角色,user、assistant 或 system。其中 system 角色只能出现在首句,最后一句对话角色一定是 user | |
content | string | 是 | 对话内容,说明: 所有对话内容的总 Token 数不可超过 6144,否则会截断,截断时会保留 system 角色的内容。 | |
model | - | string | 是 | 使用的模型 ID,模型列表: XVERSE-13B-2 XVERSE-65B-2 |
max_tokens | - | int | 否 | 生成的最大 token 数量,默认为 2048,取值范围 [0, 2048],传 0 会取默认值 |
top_k | - | int | 否 | 影响输出文本的多样性,取值越大,生成文本的多样性越强,默认为30,取值范围[0, 100],传 0 会取默认值 |
top_p | - | float | 否 | (1)影响输出文本的多样性,取值越大,生成文本的多样性越强。 (2)该参数默认为0.85,取值范围 [0, 1],传 0 会取默认值。 (3)为使效果更好,建议该参数和 temperature 只设置 1 个。 (4)建议 temperature 和 top_p 不要同时更改。 |
temperature | - | float | 否 | (1)较高的数值会使输出更加随机,较低数值会使输出更加集中和确定。(2)该参数默认为0.5,取值范围 [0, 1],传 0 会取默认值。 (3)为使效果更好,建议该参数和 top_p 只设置 1 个。 (4)建议 temperature 和 top_p 不要同时更改。 |
presence_penalty | - | float | 否 | (1)这个参数用于减少生成文本中的重复内容,值越大代表越严格控制重复度。 (2)该参数默认值为1.1,取值范围 [1, 3],传 0 会取默认值。 |
user_id | - | string | 否 | 用户 ID,用户唯一标识,如果填写,需跟 APIKey 对应上。 |
dialog_id | - | string | 否 | 对话ID,由客户端生成随机的唯一 ID,标识多通同类型的对话,为 20-36 位字符串,可包含字母和数字、中划线和下划线。 |
trace_id | - | string | 否 | 链路 ID,由客户端生成随机的唯一 ID,标识整通对话,为 20-36 位字符串,可包含字母和数字、中划线和下划线。 |
stream | - | bool | 否 | 是否使用流式接口,缺省值为 false |