视频字幕翻译算子,支持从视频中提取字幕并进行多语言翻译。用户可以选择通过 OCR 识别画面内嵌字幕,或通过 ASR 提取音频字幕,再对识别出的字幕进行精修和翻译,输出多种格式的字幕文件。
算子 ID:las_video_subtitle_translate
关键参数:ASR 高精度识别字幕、翻译成日韩英三语
"caption_source": "asr_high_precision", "audio_language": "zh-CN", "output_language": ["ko-KR","ja-JP","en-US"], "caption_format": [".srt"],
输出结果示例
结果示例2:
"caption_source": "ocr_high_precision", "audio_language": "zh-CN", "output_language": ["ko-KR","ja-JP","en-US"], "caption_format": [".srt"],
输出结果示例
字幕来源 | 说明 | 适用场景 |
|---|---|---|
ocr_low_precision | OCR 低精度,从画面提取内嵌字幕 | 视频分辨率至少为360p,字幕文字占画面比例大于5%,适合快速处理 |
ocr_high_precision | OCR 高精度,从画面提取内嵌字幕 | 视频内非字幕文字内容较多,且字幕占画面比例小于5%,对字幕精度有较高要求 |
asr_low_precision | ASR 低精度,从音频提取字幕 | 无内嵌字幕或字幕不清晰、咬字清晰、说话标准的视频 |
asr_high_precision | ASR 高精度,音频提取+视频理解精修字幕 | 专业名称繁杂且重音现象严重的教育场景 |
音频识别和字幕翻译支持的语言如下:
语言代码 | 语言名称 |
|---|---|
zh-CN | 中文(简体) |
en-US | 英语(美国) |
ja-JP | 日语 |
id-ID | 印尼语 |
es-MX | 西班牙语(墨西哥) |
pt-BR | 葡萄牙语(巴西) |
de-DE | 德语 |
fr-FR | 法语 |
ko-KR | 韩语 |
fil-PH | 菲律宾语 |
ms-MY | 马来语 |
th-TH | 泰语 |
ar-SA | 阿拉伯语 |
it-IT | 意大利语 |
bn-BD | 孟加拉语 |
el-GR | 希腊语 |
nl-NL | 荷兰语 |
ru-RU | 俄语 |
tr-TR | 土耳其语 |
vi-VN | 越南语 |
pl-PL | 波兰语 |
ro-RO | 罗马尼亚语 |
ne-NP | 尼泊尔语 |
uk-UA | 乌克兰语 |
yue-CN | 粤语 |
细分项 | 性能影响说明 |
|---|---|
耗时 |
|
细分 | 详细要求 |
|---|---|
支持的输入数据模态 |
|
输入格式:视频 |
|
输入路径要求 | 通过请求参数
|
细分 | 详细要求 |
|---|---|
输出数据模态 |
|
输出格式:字幕文件 |
|
输出路径:TOS | 通过请求参数
|
计费标准
细分项 | 计费标准说明 |
|---|---|
计费项 | 基于输入视频时长统计用量进行计费,包括2个计费项:字幕识别费用、字幕翻译费用。需支付的费用为所有计费项的计费之和。 |
计费类型 | 按量计费,单位: |
单价 | 各计费项的单价以调用模型时,基于模型输入长度进行阶梯定价,处于不同输入长度的梯度范围内的单价不同。
|
计费详情
计费公式:
总费用 = 视频字幕识别费用 + 视频字幕翻译费用 = (字幕识别单价 * 输入视频时长)+(字幕翻译单价 * 输入视频时长 * 需要翻译的语言的数)
计费项 | 单价 |
|---|---|
字幕识别 | 视频字幕来源方式-OCR低精度:0.15 元/分钟 |
视频字幕来源方式-OCR高精度:0.25 元/分钟 | |
视频字幕来源方式-ASR低精度:0.015 元/分钟 | |
视频字幕来源方式-ASR高精度:1.5 元/分钟 | |
字幕翻译 | 固定单价:0.1 元/分钟/个 |
计费示例
总费用 = 0.25 元/分钟 * 5分钟 + 0.1 元/分钟/个 * 5分钟 * 2个 = 2.25 元细分项 | 注意与前提 |
|---|---|
开通 LAS |
|
费用 | 调用算子前,您需先了解使用算子时的模型调用费用,详情请参见大模型调用计费。 |
鉴权(API Key) | 调用算子前,您需要先生成算子调用的API Key,并建议将API Key配置为环境变量,便于更安全地调用算子,详情请参见获取 API Key 并配置。 |
BaseURL | 调用算子前,您需要先根据您当前使用的LAS服务所在地域,了解算子调用的BaseURL,用于配置算子调用路径参数取值。 |
调用视频字幕翻译算子提交异步任务,支持字幕提取、翻译和多格式输出。
参数 | 类型 | 是否必填 | 示例值 | 描述 |
|---|---|---|---|---|
operator_id | string | 是 | las_video_subtitle_translate | 算子 ID。 |
operator_version | string | 是 | v1 | 算子版本。 |
data | VideoCaptioningInfo | 是 | 视频字幕翻译请求参数。 | |
video_url | string | 是 | https://example.com/video.mp4 | 输入视频地址。支持 http/https、tos://bucket/key。 |
caption_source | string | 是 | ocr_high_precision | 字幕来源类型。可选值: ocr_low_precision、ocr_high_precision、asr_low_precision、asr_high_precision。 |
output_language | list of string | 是 | [en-US] | 输出语言,必须是支持的语言代码之一。 |
audio_language | string | 条件必选 | zh-CN | 音频语言,当 caption_source 为 asr_low_precision 或 asr_high_precision 时必填。必须是支持的语言代码之一。 |
caption_output_path | string | 是 | tos://bucket/output/ | 字幕输出目录。 |
caption_format | list of string | 否 | [.srt] | 字幕格式,可选 .txt、.srt、.xml、.vtt。可同时指定多种格式, 默认为.srt。 |
参数 | 类型 | 示例值 | 描述 |
|---|---|---|---|
metadata | metadata | 请求元信息。 | |
task_id | string | task-xxx | 异步模式下的任务 ID,用于作业状态查询。 |
task_status | string | PENDING | 异步模式下的任务状态。
|
business_code | string | 0 | 业务码。 |
error_msg | string | 如有异常,会返回详细错误信息。 |
curl --location "https://operator.las.cn-beijing.volces.com/api/v1/submit" --header "Content-Type: application/json" --header "Authorization: Bearer $LAS_API_KEY" --data '{ "operator_id": "las_video_subtitle_translate", "operator_version": "v1", "data": { "video_url": "https://example.com/sample_video.mp4", "caption_source": "ocr_high_precision", "output_language": ["en-US"], "caption_format": [".srt"], "caption_output_path": "tos://bucket/output/" } }'
{ "metadata": { "task_id": "task-20260323153012-abc123", "task_status": "PENDING", "business_code": "0", "error_msg": "" } }
HttpCode | 错误码 | 错误信息 | 说明 |
|---|---|---|---|
400 | Parameter.Invalid | The parameter is invalid.. | 参数不合法 |
401 | Authorization.Missing | Missing Authorization | 缺少鉴权信息时返回。 |
401 | ApiKey.InValid | The api key is invalid | API Key 不合法时返回。 |
查询视频字幕翻译任务的执行状态和结果。
参数 | 类型 | 必填 | 示例值 | 说明 |
|---|---|---|---|---|
operator_id | string | 是 | las_video_subtitle_translate | 算子 ID |
operator_version | string | 是 | v1 | 算子版本 |
task_id | string | 是 | task-xxx | 任务 ID |
参数 | 类型 | 示例值 | 描述 |
|---|---|---|---|
metadata | metadata | 请求元信息。 | |
task_id | string | task-xxx | 异步模式下的任务 ID。 |
task_status | string | COMPLETED | 异步模式下的任务状态。
|
business_code | string | 0 | 业务码。 |
error_msg | string | 如有异常,会返回详细错误信息。 | |
data | VideoCaptioningResponse | 返回的数据。 | |
video_url | string | https://example.com/video.mp4 | 输入视频地址。 |
video_duration | float | 98.4 | 输入视频总时长(秒)。 |
final_captions | list of FinalCaption | 最终字幕结果列表。 | |
tos_path | string | tos://bucket/path/en-US_caption.srt | 字幕文件 TOS 路径。 |
presigned_url | string | https://... | 预签名访问 URL,有效期为3天。 |
language | string | en-US | 字幕语言。 |
format | string | srt | 字幕格式。 |
curl --location "https://operator.las.cn-beijing.volces.com/api/v1/poll" --header "Content-Type: application/json" --header "Authorization: Bearer $LAS_API_KEY" --data '{ "operator_id": "las_video_subtitle_translate", "operator_version": "v1", "task_id": "task-20260323153012-abc123" }'
{ "metadata": { "task_id": "task-20260323153012-abc123", "task_status": "COMPLETED", "business_code": "0", "error_msg": "" }, "data": { "video_url": "https://example.com/sample_video.mp4", "video_duration": 98.4, "final_captions": [ { "tos_path": "tos://bucket/captions/20260323/account/trace/en-US_caption_xxx.srt", "presigned_url": "https://...", "language": "en-US", "format": "srt" } ] } }
HttpCode | 错误码 | 错误信息 | 说明 |
|---|---|---|---|
400 | Video.Invalid | 视频文件无效或格式不支持 | 视频文件无法被解析或格式不支持时返回。 |
400 | Video.DownloadFailed | 视频下载失败 | 视频下载失败时返回。 |
400 | Video.DurationTooShort | 视频时长不足10秒 | 视频时长小于10秒时返回。 |
400 | Video.DurationTooLong | 视频时长超过4小时限制 | 视频时长超过4小时时返回。 |
400 | Video.FrameExtractionFailed | 抽帧失败 | 使用 ASR 高精度模式时抽帧失败返回。 |
400 | Video.OcrFailed | OCR处理失败 | OCR 识别处理失败时返回。 |
400 | Video.AsrFailed | ASR处理失败 | ASR 语音识别处理失败时返回。 |
400 | Video.RefineFailed | 字幕精修失败 | ASR 高精度模式字幕精修失败时返回。 |
400 | Video.TranslateFailed | 字幕翻译失败 | 字幕翻译失败时返回。 |
400 | Video.CaptionUploadFailed | 字幕文件上传失败 | 字幕文件上传失败时返回。 |
400 | Parameter.Invalid | 不支持的视频格式/无效的语言代码等 | 参数值不合法时返回,如视频格式不支持、语言代码无效等。 |
400 | Parameter.Missing | 缺少必需参数 | 缺少必需参数时返回,如使用 ASR 模式时未提供 audio_language。 |
401 | Authorization.Missing | Missing Authorization | 缺少鉴权信息时返回。 |
401 | ApiKey.InValid | The api key is invalid | API Key 不合法时返回。 |
500 | Internal.ServerError | Internal server error | 服务内部错误时返回。 |