You need to enable JavaScript to run this app.
文档中心
AI 数据湖服务

AI 数据湖服务

复制全文
下载 pdf
视频理解
视频字幕翻译
复制全文
下载 pdf
视频字幕翻译

视频字幕翻译算子,支持从视频中提取字幕并进行多语言翻译。用户可以选择通过 OCR 识别画面内嵌字幕,或通过 ASR 提取音频字幕,再对识别出的字幕进行精修和翻译,输出多种格式的字幕文件。

算子介绍

算子 ID:las_video_subtitle_translate

适用场景

  • 视频出海:跨越不同国界的视频交流,涵盖短剧、动画、电影、电商视频等多个领域。
  • 教育行业:对专业视频进行翻译,可适配具有不同口音、不同表达习惯以及包含繁杂专业名词的视频。

核心能力

  • 双字幕来源:支持 OCR 识别画面内嵌字幕和 ASR 提取音频字幕两种方式。
  • 多种精度级别:每种字幕来源均支持低精度和高精度两档配置,满足不同场景需求。
  • 多语言翻译:支持 25 种语言的字幕翻译,包括中文、英文、日文、韩文、法文、德文、西班牙文等。
  • 多格式输出:支持同时输出多种格式的字幕文件。
  • 双语字幕识别:OCR 模式支持识别翻译型双语字幕和对话型双语字幕。

效果展示

  • 输入视频
  • 结果示例1:
    • 关键参数:ASR 高精度识别字幕、翻译成日韩英三语

      "caption_source": "asr_high_precision",
              "audio_language": "zh-CN",
              "output_language": ["ko-KR","ja-JP","en-US"],
              "caption_format": [".srt"],
      
    • 输出结果示例

      asr-high.zip
      未知大小

  • 结果示例2:

    • 关键参数:OCR 高精度识别字幕、翻译成日韩英三语
      "caption_source": "ocr_high_precision",
              "audio_language": "zh-CN",
              "output_language": ["ko-KR","ja-JP","en-US"],
              "caption_format": [".srt"],
      
  • 输出结果示例

    ocr-high.zip
    未知大小

优势

  • 全面性:提供多元化的字幕生成方式,针对视频画面中无字幕的场景,也可根据音频生成对应的字幕。
  • 准确性:具备更高的字幕提取准确性,在专业名称繁杂且重音现象严重的教育场景中表现尤为突出;具备更高的翻译准确性,为带有口音的视频提供更精准的翻译。
  • 高性价比:拥有多种模式可供选择,能够针对不同场景提供最具性价比的方案。

字幕来源说明

字幕来源

说明

适用场景

ocr_low_precision

OCR 低精度,从画面提取内嵌字幕

视频分辨率至少为360p,字幕文字占画面比例大于5%,适合快速处理

ocr_high_precision

OCR 高精度,从画面提取内嵌字幕

视频内非字幕文字内容较多,且字幕占画面比例小于5%,对字幕精度有较高要求

asr_low_precision

ASR 低精度,从音频提取字幕

无内嵌字幕或字幕不清晰、咬字清晰、说话标准的视频

asr_high_precision

ASR 高精度,音频提取+视频理解精修字幕

专业名称繁杂且重音现象严重的教育场景

支持的语言

音频识别和字幕翻译支持的语言如下:

语言代码

语言名称

zh-CN

中文(简体)

en-US

英语(美国)

ja-JP

日语

id-ID

印尼语

es-MX

西班牙语(墨西哥)

pt-BR

葡萄牙语(巴西)

de-DE

德语

fr-FR

法语

ko-KR

韩语

fil-PH

菲律宾语

ms-MY

马来语

th-TH

泰语

ar-SA

阿拉伯语

it-IT

意大利语

bn-BD

孟加拉语

el-GR

希腊语

nl-NL

荷兰语

ru-RU

俄语

tr-TR

土耳其语

vi-VN

越南语

pl-PL

波兰语

ro-RO

罗马尼亚语

ne-NP

尼泊尔语

uk-UA

乌克兰语

yue-CN

粤语

算子性能

细分项
性能影响说明

耗时

  • 总耗时主要受视频时长、字幕来源类型、输出语言数量、字幕格式数量影响。
  • OCR 模式耗时与视频时长和模式精度成正比。
  • ASR 高精度模式耗时较长,因涉及视频理解精修字幕。
  • 翻译耗时与字幕条数和输出语言数量成正比。

输入与输出要求

输入要求

细分

详细要求

支持的输入数据模态

  • 视频

输入格式:视频

  • 格式:mp4movavimkvflvwebm
  • 大小:最短 10 秒,最长 4 小时。

输入路径要求

通过请求参数 video_url 提供给算子输入数据,当前支持公网 URL、TOS 路径这两种方式。

  • 公网 URL:公网可访问的视频 URL,格式为 http/https
    • 公网 URL 不支持需要登录态或额外 Header 鉴权的地址;临时 URL 需在任务执行期间有效。
  • TOS 路径:将待处理数据上传至与当前 LAS 服务同主账号、同地域的 TOS Bucket后,可提供 TOS 路径,格式为tos://bucket_name/demo/
    • TOS 对象需存在且具备读取权限。

输出要求

细分

详细要求

输出数据模态

  • 文本(字幕文件)

输出格式:字幕文件

  • 格式:.txt.srt.xml.vtt

输出路径:TOS

通过请求参数caption_output_path 指定算子输出结果的存储路径,当前支持设置为 TOS 路径。

  • TOS 路径:与LAS服务同主账号、同地域下,有可写权限的 TOS Bucket 目录,格式:tos://bucket/output/

计费说明
  • 计费标准

    细分项

    计费标准说明

    计费项

    基于输入视频时长统计用量进行计费,包括2个计费项:字幕识别费用字幕翻译费用。需支付的费用为所有计费项的计费之和。

    计费类型

    按量计费,单位:元/分钟,按实际的计费用量每小时出账。

    单价

    各计费项的单价以调用模型时,基于模型输入长度进行阶梯定价,处于不同输入长度的梯度范围内的单价不同。

    • 视频字幕识别:从输入视频中智能识别字幕的费用,费用单价与使用的字幕来源方式有关。
    • 视频字幕翻译:费用单价为固定单价,但此部分总费用还与需要翻译的语言的数量有关,使用算子进行字幕翻译时,如果需要翻译为多个语种,每个语种都会产生字幕翻译费用。
  • 计费详情
    计费公式:

    总费用 =  视频字幕识别费用 + 视频字幕翻译费用 
          = (字幕识别单价 * 输入视频时长)+(字幕翻译单价 * 输入视频时长 * 需要翻译的语言的数) 
    
    计费项
    单价

    字幕识别

    视频字幕来源方式-OCR低精度:0.15 元/分钟

    视频字幕来源方式-OCR高精度:0.25 元/分钟

    视频字幕来源方式-ASR低精度:0.015 元/分钟

    视频字幕来源方式-ASR高精度:1.5 元/分钟

    字幕翻译

    固定单价:0.1 元/分钟/个

  • 计费示例

    • 示例场景:输入一个 5 分钟的中文视频,字幕来源方式选择 OCR 高精度,需要将视频字幕翻译为英文、日文。
    • 费用详情:
      总费用 = 0.25 元/分钟 * 5分钟 + 0.1 元/分钟/个 * 5分钟 * 2个 = 2.25 元

注意与前提

细分项

注意与前提

开通 LAS

  • 如果您是一个全新的火山引擎用户,此前未开通过 LAS 产品,您可先开通 LAS,不使用 LAS 的计费功能仅开通 LAS 产品不会产生费用。开通操作请参见准备工作
  • 开通完成后可查看算子介绍文档,了解算子能力、上手引导等,详情可参见:LAS 智能数据处理算子

费用

调用算子前,您需先了解使用算子时的模型调用费用,详情请参见大模型调用计费

鉴权(API Key)

调用算子前,您需要先生成算子调用的API Key,并建议将API Key配置为环境变量,便于更安全地调用算子,详情请参见获取 API Key 并配置

BaseURL

调用算子前,您需要先根据您当前使用的LAS服务所在地域,了解算子调用的BaseURL,用于配置算子调用路径参数取值。
详情请参见获取 Base URL,下文中的调用示例仅作为参考,实际调用时需替换为您对应地域的路径取值。

Rest API 调用

Submit

接口说明

调用视频字幕翻译算子提交异步任务,支持字幕提取、翻译和多格式输出。

请求参数

参数
类型
是否必填
示例值
描述
operator_id
string
las_video_subtitle_translate
算子 ID。
operator_version
string
v1
算子版本。
data
VideoCaptioningInfo
视频字幕翻译请求参数。
video_url
string
https://example.com/video.mp4
输入视频地址。支持 http/httpstos://bucket/key
caption_source
string
ocr_high_precision
字幕来源类型。可选值:ocr_low_precisionocr_high_precisionasr_low_precisionasr_high_precision
output_language
list of string
[en-US]
输出语言,必须是支持的语言代码之一。
audio_language
string
条件必选
zh-CN
音频语言,当 caption_sourceasr_low_precisionasr_high_precision 时必填。必须是支持的语言代码之一。
caption_output_path
string
tos://bucket/output/
字幕输出目录。
caption_format
list of string
[.srt]
字幕格式,可选 .txt.srt.xml.vtt。可同时指定多种格式, 默认为.srt

返回参数

参数
类型
示例值
描述
metadata
metadata
请求元信息。
task_id
string
task-xxx
异步模式下的任务 ID,用于作业状态查询。
task_status
string
PENDING
异步模式下的任务状态。
  • PENDING, 接收请求
  • RUNNING, 正在运行
  • COMPLETED, 已完成
  • FAILED, 失败
  • TIMEOUT, 超时
business_code
string
0
业务码。
error_msg
string
如有异常,会返回详细错误信息。

示例

请求示例

curl --location "https://operator.las.cn-beijing.volces.com/api/v1/submit" --header "Content-Type: application/json" --header "Authorization: Bearer $LAS_API_KEY" --data '{
    "operator_id": "las_video_subtitle_translate",
    "operator_version": "v1",
    "data": {
        "video_url": "https://example.com/sample_video.mp4",
        "caption_source": "ocr_high_precision",
        "output_language": ["en-US"],
        "caption_format": [".srt"],
        "caption_output_path": "tos://bucket/output/"
    }
}'

返回示例

{
    "metadata": {
        "task_id": "task-20260323153012-abc123",
        "task_status": "PENDING",
        "business_code": "0",
        "error_msg": ""
    }
}

错误码

HttpCode

错误码

错误信息

说明

400

Parameter.Invalid

The parameter is invalid..

参数不合法

401

Authorization.Missing

Missing Authorization

缺少鉴权信息时返回。

401

ApiKey.InValid

The api key is invalid

API Key 不合法时返回。

Poll

接口说明

查询视频字幕翻译任务的执行状态和结果。

请求参数

参数

类型

必填

示例值

说明

operator_id

string

las_video_subtitle_translate

算子 ID

operator_version

string

v1

算子版本

task_id

string

task-xxx

任务 ID

返回参数

参数
类型
示例值
描述
metadata
metadata
请求元信息。
task_id
string
task-xxx
异步模式下的任务 ID。
task_status
string
COMPLETED
异步模式下的任务状态。
  • PENDING, 提交任务排队
  • RUNNING, 正在运行
  • COMPLETED, 已完成
  • FAILED, 失败
  • TIMEOUT, 超时
business_code
string
0
业务码。
error_msg
string
如有异常,会返回详细错误信息。
data
VideoCaptioningResponse
返回的数据。
video_url
string
https://example.com/video.mp4
输入视频地址。
video_duration
float
98.4
输入视频总时长(秒)。
final_captions
list of FinalCaption
最终字幕结果列表。
tos_path
string
tos://bucket/path/en-US_caption.srt
字幕文件 TOS 路径。
presigned_url
string
https://...
预签名访问 URL,有效期为3天。
language
string
en-US
字幕语言。
format
string
srt
字幕格式。

示例

请求示例

curl --location "https://operator.las.cn-beijing.volces.com/api/v1/poll" --header "Content-Type: application/json" --header "Authorization: Bearer $LAS_API_KEY" --data '{
    "operator_id": "las_video_subtitle_translate",
    "operator_version": "v1",
    "task_id": "task-20260323153012-abc123"
}'

返回示例

{
    "metadata": {
        "task_id": "task-20260323153012-abc123",
        "task_status": "COMPLETED",
        "business_code": "0",
        "error_msg": ""
    },
    "data": {
        "video_url": "https://example.com/sample_video.mp4",
        "video_duration": 98.4,
        "final_captions": [
            {
                "tos_path": "tos://bucket/captions/20260323/account/trace/en-US_caption_xxx.srt",
                "presigned_url": "https://...",
                "language": "en-US",
                "format": "srt"
            }
        ]
    }
}

错误码

HttpCode

错误码

错误信息

说明

400

Video.Invalid

视频文件无效或格式不支持

视频文件无法被解析或格式不支持时返回。

400

Video.DownloadFailed

视频下载失败

视频下载失败时返回。

400

Video.DurationTooShort

视频时长不足10秒

视频时长小于10秒时返回。

400

Video.DurationTooLong

视频时长超过4小时限制

视频时长超过4小时时返回。

400

Video.FrameExtractionFailed

抽帧失败

使用 ASR 高精度模式时抽帧失败返回。

400

Video.OcrFailed

OCR处理失败

OCR 识别处理失败时返回。

400

Video.AsrFailed

ASR处理失败

ASR 语音识别处理失败时返回。

400

Video.RefineFailed

字幕精修失败

ASR 高精度模式字幕精修失败时返回。

400

Video.TranslateFailed

字幕翻译失败

字幕翻译失败时返回。

400

Video.CaptionUploadFailed

字幕文件上传失败

字幕文件上传失败时返回。

400

Parameter.Invalid

不支持的视频格式/无效的语言代码等

参数值不合法时返回,如视频格式不支持、语言代码无效等。

400

Parameter.Missing

缺少必需参数

缺少必需参数时返回,如使用 ASR 模式时未提供 audio_language。

401

Authorization.Missing

Missing Authorization

缺少鉴权信息时返回。

401

ApiKey.InValid

The api key is invalid

API Key 不合法时返回。

500

Internal.ServerError

Internal server error

服务内部错误时返回。

最近更新时间:2026.06.23 21:16:55
这个页面对您有帮助吗?
有用
有用
无用
无用