调用本接口创建(即部署)一个模型服务。
下表仅列出该接口特有的请求参数和部分公共参数。更多信息请见公共参数。
参数 | 类型 | 是否必填 | 示例值 | 描述 |
|---|---|---|---|---|
Action | String | 是 | CreateModelService | 要执行的操作,取值:CreateModelService。 |
Version | String | 是 | 2022-01-01 | API的版本,取值:2022-01-01。 |
model_service_name | String | 否 | model_service_1 | 设置服务名称。 |
model_id | String | 否 | m-official-1 | 模型ID。
|
state_type | Integer | 否 | 1 | 服务状态类型。该参数有以下取值:
|
max_batch_size | Long | 否 | 0 | 最大批处理大小。取值范围:0~100。 |
gpu_count | Integer | 否 | 1 | GPU 实例数。 |
version_id | String | 否 | mv-official-1 | 模型版本ID。
|
cpu_request | Double | 否 | 1.2 | CPU 配额。单位:Core。 |
cpu_limit | Double | 否 | 3 | CPU 限额。单位:Core。 |
mem_limit | Integer | 否 | 500 | 内存限额。单位由 http_mem_limit_unit 参数指定。如果未指定,单位默认为 MB。 |
deploy_config | Object | 否 | 部署配置。 | |
model_name | String | 否 | 口罩检测-01-PPLCNet-ONNX | 模型名称。 |
project_name | String | 否 | 我的第一个空间 | 所属边缘智能空间名称。 |
version_name | String | 否 | v1 | 模型版本名称。 |
port | Integer | 否 | 31000 | HTTP 服务端口。取值范围:30000~40000。 |
grpc_port | Integer | 否 | 31001 | GRPC 服务端口。取值范围:30000~40000。 |
http_mem_req_unit | String | 否 | MB | 内存配额(mem_request)的单位。该参数有以下取值:
|
http_mem_limit_unit | String | 否 | GB | 内存限额(mem_limit)的单位。该参数有以下取值:
|
json_parameter | String | 否 | 模型服务的额外参数,使用 json 格式。 | |
process_id | String | 否 | mp-official-1 | 模型前后处理版本的ID。
|
cpu_count | Integer | 否 | 2 | CPU 实例数。 |
dynamic_batching | Boolean | 否 | false | 是否启用动态批处理。默认值:false。 |
max_queue_delay_microseconds | Long | 否 | 1000 | 最大批处理延迟,单位:ms。 |
process_name | String | 否 | pre_post_process_v1 | 模型前后处理版本名称。 |
compression | Boolean | 否 | false | 是否启用输入压缩模式。默认值:false。 |
service_config | Array of Object | 否 | 服务配置。 | |
open_ai_api | Object | 否 | OpenAI 标准化接口配置。 | |
shared_memory | Object | 否 | 共享内存配置。 | |
replicas | Integer | 否 | 2 | 副本数。 |
project_id | String | 是 | p-2100001281-zf9ll | 所属边缘智能空间ID。
|
下表仅列出本接口特有的返回参数。更多信息请参见返回结构。
参数 | 类型 | 示例值 | 描述 |
|---|---|---|---|
model_service_id | String | ms-2100001281-s56km | 首个节点上的模型服务ID。 |
model_service_ids | Array of String | ["ms-2100001281-s56km"] | 模型服务ID列表。 |
POST /?Action=CreateModelService&Version=2022-01-01 HTTP/1.1 Host: vei-api.volcengineapi.com Content-Type: application/json; charset=UTF-8 X-Date: 20250417T082711Z X-Content-Sha256: 287e874e******d653b44d21e Authorization: HMAC-SHA256 Credential=Adfks******wekfwe/20250417/cn-beijing/vei_api/request, SignedHeaders=host;x-content-sha256;x-date, Signature=47a7d934ff7b37c03938******cd7b8278a40a1057690c401e92246a0e41085f { "project_id": "p-2100001281-w7nm2", "model_service_name": "行人", "model_id": "m-official-16", "state_type": 1, "max_batch_size": 0, "version_id": "mv-official-25", "deploy_config": { "nodes": [{ "Name": "nodeA", "Id": "sxn012-bdvbaz" }] }, "model_name": "行人检测-02-PPYOLOE-ONNX", "project_name": "我的第一个空间", "version_name": "v1_max_batch_size_0", "port": 30001, "mem_req_unit": "MB", "mem_limit_unit": "MB", "grpc_port": 30002, "process_id": "mp-official-7", "cpu_count": 0, "process_name": "pre_post_process_v1", "compression": false, "service_config": [{ "model_id": "m-official-16", "model_name": "行人检测-02-PPYOLOE-ONNX", "cpu_count": 1, "gpu_count": 0 }], }
{ "ResponseMetadata": { "RequestId": "202504171636490490741320850E68F8", "Action": "CreateModelService", "Version": "2022-01-01", "Service": "vei_api", "Region": "cn-beijing" }, "Result": { "model_service_id": "ms-2100001281-s56km", "model_service_ids": [ "ms-2100001281-s56km" ] } }
下表为您列举了该接口与业务逻辑相关的错误码。公共错误码请参见公共错误码文档。
状态码 | 错误码 | 说明 |
|---|---|---|
400 | 90000015 | 账号未实名认证。 |
400 | 90000021 | 越权访问其他账号下的空间。 |
400 | 90000025 | 仅支持企业认证账号创建边缘大模型网关密钥。 |
400 | 30050001 | 模型服务创建失败。 |
500 | 90000009 | 服务内部错误。 |