You need to enable JavaScript to run this app.
文档中心
边缘智能

边缘智能

复制全文
下载 pdf
边缘推理
CreateModelService - 创建模型服务
复制全文
下载 pdf
CreateModelService - 创建模型服务

调用本接口创建(即部署)一个模型服务。

调试

请求参数

下表仅列出该接口特有的请求参数和部分公共参数。更多信息请见公共参数

参数
类型
是否必填
示例值
描述
Action
String

CreateModelService

要执行的操作,取值:CreateModelService。

Version
String

2022-01-01

API的版本,取值:2022-01-01。

model_service_name
String

model_service_1

设置服务名称。

model_id
String

m-official-1

模型ID。

您可以调用ListModel接口获取所有模型的ID。

state_type
Integer

1

服务状态类型。该参数有以下取值:

  • 1:无状态服务
  • 2:有状态服务
max_batch_size
Long

0

最大批处理大小。取值范围:0~100。

gpu_count
Integer

1

GPU 实例数。

version_id
String

mv-official-1

模型版本ID。

您可以调用ListModel接口获取所有模型版本的ID。

cpu_request
Double

1.2

CPU 配额。单位:Core。

cpu_limit
Double

3

CPU 限额。单位:Core。

mem_limit
Integer

500

内存限额。单位由 http_mem_limit_unit 参数指定。如果未指定,单位默认为 MB。

deploy_config
Object

部署配置。

model_name
String

口罩检测-01-PPLCNet-ONNX

模型名称。

project_name
String

我的第一个空间

所属边缘智能空间名称。

version_name
String

v1

模型版本名称。

port
Integer

31000

HTTP 服务端口。取值范围:30000~40000。

grpc_port
Integer

31001

GRPC 服务端口。取值范围:30000~40000。

http_mem_req_unit
String

MB

内存配额(mem_request)的单位。该参数有以下取值:

  • MB(默认):等同于 MiB
  • GB:等同于 GiB
http_mem_limit_unit
String

GB

内存限额(mem_limit)的单位。该参数有以下取值:

  • MB(默认):等同于 MiB
  • GB:等同于 GiB
json_parameter
String

模型服务的额外参数,使用 json 格式。

process_id
String

mp-official-1

模型前后处理版本的ID。

您可以调用ListModel接口获取所有模型前后处理版本的ID。

cpu_count
Integer

2

CPU 实例数。

dynamic_batching
Boolean

false

是否启用动态批处理。默认值:false。

max_queue_delay_microseconds
Long

1000

最大批处理延迟,单位:ms。

process_name
String

pre_post_process_v1

模型前后处理版本名称。

compression
Boolean

false

是否启用输入压缩模式。默认值:false。

service_config
Array of Object

服务配置。

open_ai_api
Object

OpenAI 标准化接口配置。

shared_memory
Object

共享内存配置。

replicas
Integer

2

副本数。

project_id
String

p-2100001281-zf9ll

所属边缘智能空间ID。

您可以调用ListProject接口获取所有边缘智能空间ID。

返回参数

下表仅列出本接口特有的返回参数。更多信息请参见返回结构

参数
类型
示例值
描述
model_service_id
String

ms-2100001281-s56km

首个节点上的模型服务ID。

model_service_ids
Array of String

["ms-2100001281-s56km"]

模型服务ID列表。

请求示例

POST /?Action=CreateModelService&Version=2022-01-01 HTTP/1.1
Host: vei-api.volcengineapi.com
Content-Type: application/json; charset=UTF-8
X-Date: 20250417T082711Z
X-Content-Sha256: 287e874e******d653b44d21e
Authorization: HMAC-SHA256 Credential=Adfks******wekfwe/20250417/cn-beijing/vei_api/request, SignedHeaders=host;x-content-sha256;x-date, Signature=47a7d934ff7b37c03938******cd7b8278a40a1057690c401e92246a0e41085f

{
	"project_id": "p-2100001281-w7nm2",
	"model_service_name": "行人",
	"model_id": "m-official-16",
	"state_type": 1,
	"max_batch_size": 0,
	"version_id": "mv-official-25",
	"deploy_config": {
		"nodes": [{
			"Name": "nodeA",
			"Id": "sxn012-bdvbaz"
		}]
	},
	"model_name": "行人检测-02-PPYOLOE-ONNX",
	"project_name": "我的第一个空间",
	"version_name": "v1_max_batch_size_0",
	"port": 30001,
	"mem_req_unit": "MB",
	"mem_limit_unit": "MB",
	"grpc_port": 30002,
	"process_id": "mp-official-7",
	"cpu_count": 0,
	"process_name": "pre_post_process_v1",
	"compression": false,
	"service_config": [{
		"model_id": "m-official-16",
		"model_name": "行人检测-02-PPYOLOE-ONNX",
		"cpu_count": 1,
		"gpu_count": 0
	}],
}

返回示例

{
  "ResponseMetadata": {
    "RequestId": "202504171636490490741320850E68F8",
    "Action": "CreateModelService",
    "Version": "2022-01-01",
    "Service": "vei_api",
    "Region": "cn-beijing"
  },
  "Result": {
    "model_service_id": "ms-2100001281-s56km",
    "model_service_ids": [
      "ms-2100001281-s56km"
    ]
  }
}

错误码

下表为您列举了该接口与业务逻辑相关的错误码。公共错误码请参见公共错误码文档。

状态码
错误码
错误信息
说明
400
90000015

The account is not authenticated by real name

账号未实名认证。

400
90000021

The account is not authorized to access project

越权访问其他账号下的空间。

400
90000025

The AI Gateway API Key is only allowed for verified enterprise account

仅支持企业认证账号创建边缘大模型网关密钥。

400
30050001

Model Service Create Error

模型服务创建失败。

500
90000009

Internal service errors

服务内部错误。

最近更新时间:2025.10.23 10:47:29
这个页面对您有帮助吗?
有用
有用
无用
无用