WebCodecs 开启 Web 音视频新篇章

这篇具有很好参考价值的文章主要介绍了WebCodecs 开启 Web 音视频新篇章。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

本期作者

WebCodecs 开启 Web 音视频新篇章,前端,音视频

WebCodecs 是什么

  • WebCodecs 是一个 Web 规范,21 年 9 月份在 Chrome 94 中实现

  • WebCodecs 提供访问编解码能力的接口,可精细控制音视频数据

 Web 音视频 API 存在什么问题

音视频技术在 Web 平台上的应用非常广泛,已有许多 Web API 间接调用了编解码器来实现特定功能:

  • 视频播放:MSE

  • 音频解码:WebAudio

  • 录制视频:MediaRecorder

  • 实时流媒体:WebRTC

但没有方法可以灵活配置或直接访问编解码器,所以许多应用使用 JS 或 WASM (比如 ffmpeg.wasm)来实现编解码功能,尽管存在诸多缺陷或限制

  • 低性能(WebCodecs 编码速度可达到 ffmpeg.wasm 的 20 倍)

  • 高功耗

  • 额外网络开销(下载已内置的编解码器)

这么做的原因是以前的 Web API 在特定场景都存在难以克服的障碍

  • WebAudio 只能解码完整的音频文件,但不支持数据流、不提供解码进度信息、更不支持编码

  • MediaRecorder 只能录制特定格式(WebM、MP4)的视频,无法控制编码速度、输出缓冲区等

  • WebRTC 与 MediaStream API 高度耦合,且不透明,仅能用于实时音视频通信

  • Video 标签、MSE 最常用于视频播放,但无法控制解码速率、缓冲区长度,且只支持播放部分视频容器格式

总结:目前 API 在特定场景做到简单、够用,但无法实现高效且精细地控制

WebCodecs 设计目标

  • 流式传输:对远程、磁盘资源进行流式输入输出

  • 效率:充分利用设备硬件,在 Worker 中运行

  • 组合性:与其他 Web API(如 Streams、WebTransport 和 WebAssembly)配合良好

  • 可恢复性:在出现问题时能够恢复的能力(网络不足、资源缺乏导致的帧下降等)

  • 灵活性:能适应各种场景(硬实时、软实时、非实时),能在此之上实现类似 MSE 或 WebRTC 的功能

  • 对称性:编码和解码具有相似的模式

非 WebCodecs 目标

  • 视频容器 封装/解封装 相关 API

  • 在 JS 或 WASM 中实现编解码器

以上总结于 译 WebCodecs 说明,让大家快速了解 WebCodecs API 的背景和目标

WebCodecs 能做什么

WebCodecs API 介绍

先了解 WebCodecs API 在视频生产消费链路所处的位置

WebCodecs 开启 Web 音视频新篇章,前端,音视频

由图可知 WebCodecs API 提供的能力

  • 控制编解码过程

  • 访问编解码前后的底层数据

WebCodecs 开启 Web 音视频新篇章,前端,音视频

WebCodecs 开启 Web 音视频新篇章,前端,音视频

  • VideoFrame、EncodedVideoChunk 对应编码前的源图像和编码后的压缩数据,两者均提供获取底层二进制数据的接口;

  • VideoEncoder、VideoDecoder 用于前两者的类型转换

  • Web 平台所有表达图像相关的类型,都可以转换为 VideoFrame

  • 这里可以看到编码、解码过程在 API 设计上的对称性

  • 图像编解码习得的知识,同样可以对称迁移到音频编解码

WebCodecs 开启 Web 音视频新篇章,前端,音视频

以上就是 WebCodecs 提供的核心 API,新增 API 的数量非常少,主要难点在音视频相关的背景知识。

利用 mp4box.js 解封装 mp4 文件,得到 EncodedVideoChunk 后给 WebCodecs 解码,即可实现 mp4 -> 图像帧。

WebCodecs 开启 Web 音视频新篇章,前端,音视频

WebCodecs 不涉及环节

音视频生产消费链路中,由其他 Web API 提供,包括:

  • 音视频数据的采集与渲染

  • 封装/解封装

  • 传输、存储

相关 Web API

基于底层 API 可以构建的基础能力

WebCodecs 开启 Web 音视频新篇章,前端,音视频

  • WebAudio:音频处理

  • WebGPU/WebGL + OffscreenCanvas:离屏图像处理

  • OPFS:本地文件读写

  • WebWorker + WASM:密集型计算

  • WebTransport:低延迟网络传输

基于 Web 平台已有的能力,加上 WebCodecs 提供的编解码能力,能帮助开发者实现那些功能呢?

DEMO 演示及实现

WebCodecs 是相对底层 API,简单功能可能也需要写非常多的辅助代码,可以借助 WebAV 封装的工具函数来快速实现功能

WebAV 基于 WebCodecs,提供简单易用的 API 在浏览器中处理音视频数据

接下来演示 DEMO 效果以及基于 WebAV 的代码实现

1.可控解码

以设备最快的速度解码一个 20s 的视频,并将视频帧绘制到 Canvas 上

可控解码的意义不只是它能实现超快速或逐帧播放视频,而在于它能快速遍历所有帧,这是视频处理的基础

decode-video-demo

首先从 WebAV 导出一个 MP4Clip 对象,它只需要一个 MP4文件 URL 进行初始化

然后使用 tick 方法获取到视频帧,再绘制到 canvas 上

while true 表示不做任何等待,所以到底有多快取决于网络下载和设备解码的速度


import { MP4Clip } from '@webav/av-cliper'
 
// 传入一个 mp4 文件流即可初始化
const clip = new MP4Clip((await fetch('<mp4 url>')).body)
await clip.ready
 
let time = 0
// 最快速度渲染视频所有帧
while (true) {
  const { state, video: videoFrame } = await clip.tick(time)
  if (state === 'done') break
  if (videoFrame != null && state === 'success') {
    ctx.clearRect(0, 0, cvs.width, cvs.height)
    // 绘制到 Canvas
    ctx.drawImage(videoFrame, 0, 0, videoFrame.codedWidth, videoFrame.codedHeight)
    // 注意,用完立即 close
    videoFrame.close()
  }
  // 时间单位是 微秒,所以差不多每秒取 30 帧,丢掉多余的帧
  time += 33000
}
clip.destroy()

2. 添加水印

给视频添加随时间移动的半透明文字水印

先把文字转换成图片,这样很容易借助 css 实现各种文字效果;

然后控制图片按照一定规则移动,这里省略了动画的配置;

动画配置方法跟 css 的动画几乎是一样的,只需提供 0%,50% 特定时机的坐标就行了,WebAV 会自动计算出中间状态的坐标值,来实现动画效果;

最后将 MP4Clip 跟 ImgClip 合成输出一个新的视频流


const spr1 = new OffscreenSprite(
  new MP4Clip((await fetch('<mp4 url>')).body)
)
 
const spr2 = new OffscreenSprite(
  new ImgClip('水印')
)
spr2.setAnimation(/* animation config */)
 
const com = new Combinator()
 
await com.add(spr1, { main: true })
await com.add(spr2, { offset: 0 })
// com.ouput() => 输出视频流
  • 3. 绿幕抠图

带绿幕的数字人形象与背景图片合成视频,使用 WebGL 对每帧图像进行处理,将人物背景修改为透明效果

抠图实现参考文章:WebGL Chromakey 实时绿幕抠图

// 创建抠图工具函数
const chromakey = createChromakey(/* 绿幕抠图配置 */)
// 背景绿幕的测试视频
const clip = new MP4Clip((await fetch('<mp4 url>')).body)
// MP4 的每一帧 都会经过 tickInterceptor
clip.tickInterceptor = async (_, tickRet) => {
  if (tickRet.video == null) return tickRet
  return {
    ...tickRet,
    // 抠图之后再返回
    video: await chromakey(tickRet.video)
  }
}

4. 花影

在浏览器中运行的视频录制工具,可用于视频课程制作、直播推流工作台

视频演示视频课程制作的基本操作,包含 “添加摄像头、分享屏幕、修改素材层级、剪切视频片段、预览导出视频” 五个步骤

WebCodecs 的应用场景

应用场景预测

  • 视频生产

  • 视频剪辑、直播工作台,搭配多人协同、AI 能力

  • 视频消费

  • 播放器、视频会议、云游戏

  • 算力转移

  • 视频压缩、缩略图生成、植入水印、调整速率

 视频生产:从零到一

由于缺失编码能力,导致 Web 端少有视频生产工具;

现有的 Web 视频剪辑工具都强依赖服务端能力支持,交互体验存在优化空间;

在 Web 页面借助 Canvas 制作动画是非常简单的,借助 WebCodecs 的编码能力,现在就能将动画快速保存为视频。

视频裁剪、添加水印、内嵌字幕等基础视频剪辑能力,没有 WebCodecs 都是难以实现的,WebCodecs 将填补该领域的空白

视频消费:能力增强

借助 HTMLMediaElement、MSE,Web 平台的视频消费应用已经非常成熟;

以上 API 虽然简单易用,但无法控制细节,常有美中不足之感

比如,缓冲延迟控制、逐帧播放、超快速播放、解码控制等

WebCodecs 将支持构建更强、体验更好的视频消费应用

算力转移:成本体验双赢

目前 Web 使用的音视频服务,其处理过程都是在服务器上完成的

比如,众多在线视频处理工具提供的:压缩(降低分辨率、码率)、水印、变速、预览图 功能

处理流程:用户上传视频 -> 服务器处理 -> 用户下载视频;
整个过程消耗了服务器的计算成本、带宽成本,用户上传下载的等待时间

WebCodecs 能让更多的任务在本地运行,不仅降低了服务运营成本,还能提升用户体验

案例分享

没有 WebCodecs 以上的工具已经存在了,为什么相信它们会应用 WebCodecs?

首先,有了 WebCodecs 之后这些工具能做到体验更好、更便宜、迭代更快;

再结合以往经验和 Web 平台所具备优势,相信 WebCodecs 未来会得到广泛应用

分享两个例子

1. 用户视频消费行为变化

  1. 荒芜 时代
    用户行为:下载电影然后离线观看,装机必备本地视频播放器

  2. Flash 时代
    用户行为:在线观看视频逐渐流行

  3. HTML5 时代
    用户行为:PC 平台 Web 在线观看成为首选

  4. WebCodecs 时代
    补齐音视频编解码能力
    用户行为:期待 WebCodecs 配合 AI 加多人协同,音视频剪辑、视频会议、直播推流等工具将逐渐 Web 化

2. 富文本编辑

Web 开放了几个核心 API,让大部分文字编辑转移到线上,产生大量优秀的知识管理应用

借助 Web 的易访问性、搭配协同编辑,将生产沟通效率提升了一个等级

  • contenteditable:可编辑节点

  • Selection:选区

  • Range:文档片段

还有大量产品案例:Notion、Figma、VSCode...

总结:一旦 Web 平台具备某个领域的基础能力,相关产品不可避免的 Web 化

WebCodecs 的优势与限制

优势

性能

WebCodecs 开启 Web 音视频新篇章,前端,音视频

ffmpeg.wasm 最大的障碍就是性能问题,导致难以大规模应用,主要是因为它不能使用硬件加速所以编解码非常慢

测试简单的视频编码场景,WebCodecs 的性能是 ffmpeg.wasm 的 20 倍

Web 平台

Web 平台天然具有的优势:跨平台、便捷性、迭代效率

再加上底层能力越来越完善,已具备构建大型、专业软件的条件;

相信 WebCodecs 也能凭借 Web 平台的加持,获得更大的应用空间

限制

  • 生态不成熟

  • 比如 缺少优秀的 封装/解封装 工具包,支持容器格式有限

  • 兼容性

  • 旧版本浏览器不支持 WebCodecs

  • 受限于浏览器提供的编解码器

  • 编解码的可控参数不够丰富(为了通用性不可避免的交换)

  • 暂无法自定义编解码器

生态不成熟只需要时间和更多开发者的积极参与,一般 to B 产品对兼容性会更宽容一些,to C 的产品可以降级到服务端实现

比较麻烦的是 Web 平台提供的编解码器相对 Native 直接调用来说,还是有一些差距

如果需要自定义编解码器,或对编解码器的参数配置有非常高的要求,技术方案选择的时候需要慎重考虑 WebCodecs

愿景

  • WebCodecs 成为 Web 平台音视频处理的基础;

  • WebCodecs 像 HTML5 一样,促进音视频在 Web 平台的应用和发展。

附录

  • WebAV 基于 WebCodecs 构建的音视频处理 SDK

  • 译 WebCodecs 说明

  • Web 音视频(零)概览

  • WebAV DEMO

  • 花影 在浏览器中运行的视频录制工具

WebCodecs 开启 Web 音视频新篇章,前端,音视频文章来源地址https://www.toymoban.com/news/detail-791857.html

到了这里,关于WebCodecs 开启 Web 音视频新篇章的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • WebGL 入门:开启三维网页图形的新篇章(上)

    🤍 前端开发工程师、技术日更博主、已过CET6 🍨 阿珊和她的猫_ CSDN 博客专家、23年度博客之星前端领域TOP1 🕠 牛客 高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 🍚 蓝桥云课 签约作者、上架课程《Vue.js 和 Egg.js 开发企业级健康管理项目》、《带你

    2024年02月21日
    浏览(29)
  • Docker:开启应用程序开发新篇章的利器

    在现代软件开发领域中,容器化技术正在迅猛发展。而其中最受欢迎和广泛使用的就是 Docker。本文将介绍 Docker 的基本概念和优势,并探讨其在应用程序开发中的实际应用。 Docker 是一种轻量级的容器技术,可以将应用程序及其依赖项打包到一个独立的虚拟环境中,称为 Doc

    2024年02月15日
    浏览(27)
  • 旧物回收小程序开发,开启绿色生活新篇章

    随着科技的发展和人们生活水平的提高,物质生活的丰富带来了大量的废弃物。如何合理处理这些废弃物,实现资源的再利用,已成为社会关注的焦点。旧物回收小程序的开发与应用,为这一问题提供了有效的解决方案。本文将探讨旧物回收小程序的意义、开发流程以及如何

    2024年02月22日
    浏览(26)
  • 医疗在线问诊小程序:开启数字化医疗新篇章

    随着科技的飞速发展,医疗行业正逐步向数字化转型。其中,医疗在线问诊小程序作为一种新型的医疗健康服务模式,为人们提供了更为便捷、高效的医疗咨询服务。本文将探讨医疗在线问诊小程序的发展背景、优势及应用场景,以期为医疗行业的数字化转型提供有益参考。

    2024年02月21日
    浏览(22)
  • AI+低代码:开启普惠人工智能时代的新篇章

    🌷🍁 博主猫头虎 带您 Go to New World.✨🍁 🦄 博客首页——猫头虎的博客🎐 🐳《面试题大全专栏》 文章图文并茂🦕生动形象🦖简单易学!欢迎大家来踩踩~🌺 🌊 《IDEA开发秘籍专栏》学会IDEA常用操作,工作效率翻倍~💐 🌊 《100天精通Golang(基础入门篇)》学会Golang语言

    2024年02月15日
    浏览(27)
  • GNSS技术与无人机协同:开启未来交通新篇章

    随着科技的不断发展,全球导航卫星系统(GNSS)技术与无人机技术的协同应用成为未来交通系统的引人瞩目的新方向。创新微公司在这一领域的技术创新为实现GNSS技术与无人机的紧密协同提供了新的可能性。本文将深入探讨GNSS技术与无人机协同的前景,并介绍创新微公司在

    2024年01月25日
    浏览(28)
  • TVP 专家谈腾讯云 Cloud Studio:开启云端开发新篇章

    点击链接了解详情 导语 | 近日,由腾讯云 TVP 团队倾力打造的 TVP 吐槽大会第六期「腾讯云 Cloud Studio 专场圆满落幕,6 位资深的 TVP 专家深度体验腾讯云 Cloud Studio 产品,提出了直击痛点的意见与建议,同时也充分肯定了腾讯云 Cloud Studio 的实力与价值,帮助腾讯云 Cloud Studi

    2024年02月07日
    浏览(26)
  • C语言练习题解析:挑战与突破,开启编程新篇章!(2)

    💓博客主页:江池俊的博客 ⏩收录专栏:C语言刷题专栏 👉专栏推荐:✅C语言初阶之路 ✅C语言进阶之路 💻代码仓库:江池俊的代码仓库 🎉欢迎大家点赞👍评论📝收藏⭐ 🎈前言: 本专栏每篇练习将包括 5个选择题 + 2个编程题 ,将涵盖C语言的不同方面,包括基础语法、

    2024年02月10日
    浏览(27)
  • C语言练习题解析:挑战与突破,开启编程新篇章!(1)

    💓博客主页:江池俊的博客 ⏩收录专栏:C语言刷题专栏 👉专栏推荐:✅C语言初阶之路 ✅C语言进阶之路 💻代码仓库:江池俊的代码仓库 🎉欢迎大家点赞👍评论📝收藏⭐ 🤝表情分享:🔎📷🥇🎈🐬🍁💯⭕️💮📍🚩👀🚨🧩💥📌🌴 🎈前言: 本专栏每篇练习将包

    2024年02月10日
    浏览(24)
  • 边缘计算网关在温室大棚智能控制系统应用,开启农业新篇章

    项目需求 ●目前大棚主要通过人为手动控温度、控水、控光照、控风,希望通过物联网技术在保障产量的前提下,提高作业效率,降低大棚总和管理成本。 ●释放部分劳动力 , 让农户有精力管理更多大棚,进而增加农户收入。 ●地方管理部门,通过“大棚管理平台”可以

    2024年02月04日
    浏览(42)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包