音视频技术开发周刊 | 300

这篇具有很好参考价值的文章主要介绍了音视频技术开发周刊 | 300。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

每周一期,纵览音视频技术领域的干货。

新闻投稿:contribute@livevideostack.com。

音视频技术开发周刊 | 300

著名数据和AI企业Databricks,收购类ChatGPT开源平台MosaicML

6月27日,Databricks在官网宣布,以13亿美元(约94亿元)价格收购了类ChatGPT开源平台MosaicML。本次交易是全球生成式AI赛道第一笔超过10亿美元的收购。

LangKit:ChatGPT等大语言模型界的“安全管家”开源了

ChatGPT等大语言模型一直有生成虚假信息、数据隐私、生成歧视信息等难题,阻碍了业务场景化落地。为了解决这些痛点并增强大语言模型的安全性,AI和数据监控平台WhyLabs推出了LangKit。

加速大模型应用落地,“火山方舟”正式发布

6月28日,在2023火山引擎V-Tech体验创新科技峰会上,火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务(MaaS,即Model-as-a-Service)。

理解指向,说出坐标,Shikra开启多模态大模型参考对话新维度

在人类的日常交流中,经常会关注场景中不同的区域或物体,人们可以通过说话并指向这些区域来进行高效的信息交换。这种交互模式被称为参考对话(Referential Dialogue)。如果 MLLM 擅长这项技能,它将带来许多令人兴奋的应用。例如,将其应用到 Apple Vision Pro 等混合现实 (XR) 眼镜中,用户可以使用视线注视指示任何内容与 AI 对话。

音视频技术开发周刊 | 300

LinkedIn 将开放 AIGC 辅助撰写简历功能

面向职场的社交平台LinkedIn, 将生成式 AI 引入帖文写作中,此项功能在测试完成之后会面向所有用户开放。

ChatGPT的iPhone应用程序更新:添加了Bing搜索引擎

ChatGPT for iOS现在提供与Bing搜索的连接。这意味着AI驱动的ChatGPT应用程序,能够获取更近期的信息,而不仅仅使用它在训练过程中所接触到的旧数据(ChatGPT知识库截至2021年)。

https://www.digitaltrends.com/mobile/chatgpts-iphone-app-now-has-bing-built-in/

音视频技术开发周刊 | 300

字节跳动服务器芯片负责人创立 RISC-V CPU 公司,估值超 1 亿美元

据获悉,字节跳动前 RISC-V 和服务器芯片项目负责人卢山已离职创业,成立蓝芯算力,方向为 RISC-V 数据中心 CPU(中央处理器),蓝芯算力正在进行首轮融资,投前估值超过 1 亿美元。

芯片工艺决定了未来计算芯片架构

论文作者总结了ISCA(国际计算机架构会议)举办至今五十年内,每个十年发表论文的共性主题,结合论文主题和半导体芯片工艺两者的变化进行了脉络梳理。在此基础上,作者提出观点:未来十年将是计算芯片架构领域的黄金十年。

Meta一直在为自主研发尽可能多的芯片做出努力

本月初,苹果发布了其Vision Pro混合现实头戴设备,将激化Apple和Meta之间在AR和VR市场的竞争。在过去的五年中,Meta一直在努力自主研发尽可能多的芯片,以更好地区分其产品与苹果的产品。

https://www.theinformation.com/articles/how-meta-stumbled-in-quest-for-chip-independence

音视频技术开发周刊 | 300

COMSOL:基于图像数据生成网格的方法

这篇文章解释了COMSOL 软件如何帮助用户,利用三维成像技术获得的数据生成仿真网格。

老照片修复算法:具有细节和结构增强的修复网络

论文作者在这篇文章中,提出了一种级联的由粗到细的老照片修复算法,可以同时恢复老照片中的结构化和非结构化损伤。

科学量化的色差值DE不一定能真实反映人眼感受的颜色差异

在工业界,对于色差公式在人眼可感知阈值或者可接受容限附近色差的预测性能非常关注,因为色差公式对于产品颜色质量控制的评价主要处于这个色差范围。但人类对大自然中不同色彩的辨别能力是不一样的。

音视频技术开发周刊 | 300

绿屏的6种检测方案

在这篇文章中,作者使用了opencv检测、图像全域检测等六种方案尝试解决问题,并提出了关于提高方案效率和健壮性的若干建议。

沉浸式视频流媒体的Versatile Video Coding(VVC)标准

该论文介绍了VVC(Versatile Video Coding)标准及其在沉浸式视频流媒体中的应用,以及VVC的ISOBMFF存储格式。

音视频技术开发周刊 | 300

聊聊新一代蓝牙技术:LE Audio横空出世,无线耳机迎来进化

这篇文章梳理了蓝牙技术的发展脉络,并介绍了常见的蓝牙音频格式,并详细阐述了为何LE Audio能成为未来蓝牙音频中的主流。

音视频技术开发周刊 | 300

建设高性能终端平台——传音元宇宙的基础设施探索

本次分享将分为三个部分,第一部分介绍全球用户在音视频业务中的痛点;第二部分主要阐述传音针对不同用户所研发的网络优化,音视频影像,游戏体验优化等技术。第三部分详细介绍了,为提前布局元宇宙,并在AIGC时代迎来新的机遇,传音针对不同地区的人群研发了AI语音,虚拟人等技术;在未来也将在终端平台搭建异构计算,交互体验预测等新的技术平台。

华科开源:半直接法视觉-激光雷达里程计 SDV-LOAM

在这篇文章中,作者提出了SDV-LOAM,它结合了半直接视觉里程计和自适应扫描到地图激光雷达里程计,用于避免跟踪误差、实现高跟踪精度。

远程渲染虚拟现实中的眼底部分聚焦空间压缩技术

在远程渲染的虚拟现实(VR)中,应用程序的渲染被移至云端,使得高质量实时内容可以在低功耗的独立式头戴显示器(HMD)上消费。此篇论文探讨了,在远程渲染的虚拟现实中应用聚焦技术和超分辨率的策略,以解决延迟和高带宽要求的挑战,并优化传输的图像质量。

https://dl.acm.org/doi/pdf/10.1145/3597063.3597359

音视频技术开发周刊 | 300

Zoom加入AOMedia,双方的“见面礼”不仅是AV1

6月21日消息,视频会议软件Zoom加入了开放媒体联盟(AOMedia),成为了该联盟组织的其中一员。这意味着,下一代编解码器AV1有望获得Zoom公司的支持。

音视频技术开发周刊 | 300

LiveVideoStackCon 2023 上海站日程发布

LiveVideoStackCon 2023 上海站音视频技术大会以「沉浸·新视界」为主题,除了探索音视频技术在不同场景下的融合与发展外,还增添了游戏、AIGC和数字化行业案例等新鲜火爆的话题。在这里,你可以感受到多媒体生态内的头部公司、顶级玩家对行业当前发展趋势、瓶颈挑战,与对未来规划的深入解读。

我们将邀请60余位顶级讲师聚集一堂,与你共同分享他们的专业见解。这是一个与业内顶尖专家进行深入交流的绝佳机会,你将有机会亲自与他们面对面,从他们丰富的经验中获得宝贵的技术心得。

音视频技术开发周刊 | 300

AIGC产业研究报告 2023

AIGC产业研究报告系列共分为六个部分,包括语言生成篇、图像生成篇、音频生成篇、视频生成篇、三维生成篇、分子发现与电路设计篇,目前已经全部发布,欢迎关注收藏并与我们共同探讨AIGC产业发展。

B站改革:将以视频播放分钟数代替播放次数

在B站14周年庆之际,董事长兼CEO陈睿进行了以“很高兴遇见你”为主题的演讲。该演讲分享了B站过去14年专注的三件事以及B站在UP主内容创作生态、商业收入等方面的发展。同时,B站将以播放分钟数替代目前外显的播放次数,以更好地挖掘B站的优质内容。

IBM扩大与Adobe合作,推进生成式AI应用

IBM在官网宣布扩大与Adobe的合作伙伴关系,帮助其生成式AI产品Adobe Sensei GenAI和 Adobe Firefly加速场景化落地和应用进程。

音视频技术开发周刊 | 300

《时代》专访ChatGPT之父:人工智能影响经济还需要很多年

奥特曼的公司OpenAI,通过其病毒式产品ChatGPT,将人工智能带入公众的视野。几乎没有人质疑OpenAI是这场革命的先锋。最终,这场革命将改变世界,不管是好是坏,两者都有可能。

华创资本熊伟铭:不着急投资AIGC应用,真正的风口还没到来

ChatGPT爆火之后,大模型成为创投“新宠”,但也有一些长期布局AI赛道的投资人并没有出手。文章来源地址https://www.toymoban.com/news/detail-521620.html


到了这里,关于音视频技术开发周刊 | 300的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包赞助服务器费用

相关文章

  • 音视频技术开发周刊 | 317

    音视频技术开发周刊 | 317

    每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。 MIT惊人再证大语言模型是世界模型!LLM能分清真理和谎言,还能被人类洗脑 MIT等学者的「世界模型」第二弹来了!这次,他们证明了LLM能够分清真话和假话,而通过「脑神经手术」,人类甚至还能

    2024年02月07日
    浏览(10)
  • 音视频技术开发周刊 | 302

    音视频技术开发周刊 | 302

    每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。 ChatGPT神器Code Interpreter终于开放,到底怎么用?这里有一份保姆级教程 Code Interpreter 已经正式开放。 上海世界AI大会:MidJourney名字的来源是庄子? MidjourneyCEO大卫·霍尔兹在2023世界人工智能大会上发

    2024年02月16日
    浏览(6)
  • 音视频技术开发周刊 | 284

    音视频技术开发周刊 | 284

    每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。 Google联合多加巨头推出ML基础设施:OpenXLA 阿里巴巴,AWS,AMD,Apple,Arm,NVIDIA都在其中。 https://opensource.googleblog.com/2023/03/openxla-is-ready-to-accelerate-and-simplify-ml-development.html 万字长文,探讨关于ChatGP

    2023年04月09日
    浏览(17)
  • 音视频技术开发周刊 | 305

    音视频技术开发周刊 | 305

    每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。 大神回归学界:何恺明宣布加入 MIT 「作为一位 FAIR 研究科学家,我将于 2024 年加入麻省理工学院(MIT)电气工程与计算机科学系 EECS 担任教职。」 AI 领域的著名学者,ResNet 发明人何恺明,最近在

    2024年02月14日
    浏览(15)
  • 音视频技术开发周刊 | 285

    音视频技术开发周刊 | 285

    每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。 GPT-4 Office全家桶发布 谷歌前脚刚宣布AI工具整合进Workspace,微软后脚就急匆匆召开了发布会,人狠话不多地祭出了办公软件王炸——Microsoft 365 Copilot,再次闪瞎全世界。从此,不管是Word、PPT、Exce

    2024年02月02日
    浏览(14)
  • 音视频技术开发周刊 | 297

    音视频技术开发周刊 | 297

    每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。 Geenee AR为品牌商和零售商提供虚拟试穿应用 这意味着Geenee AR的虚拟试穿解决方案能够与品牌商现有的销售渠道无缝集成。 谁说苹果掉队了?WWDC上只字未提AI,却已低调入场大模型 尽管苹果没有在

    2024年02月08日
    浏览(10)
  • 玩赚音视频开发高阶技术——FFmpeg

    玩赚音视频开发高阶技术——FFmpeg

    随着移动互联网的普及,人们对音视频内容的需求也不断增加。无论是社交媒体平台、电商平台还是在线教育,都离不开音视频的应用。这就为音视频开发人员提供了广阔的就业机会。根据这些年来网站上的音视频开发招聘需求来看,音视频开发人员的需求量大,且薪资待遇

    2024年02月13日
    浏览(15)
  • 5G时代音视频开发前景怎么样?音视频开发需要掌握哪些技术?(1),手把手教你5G时代Webview的正确使用姿势

    5G时代音视频开发前景怎么样?音视频开发需要掌握哪些技术?(1),手把手教你5G时代Webview的正确使用姿势

    你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。 我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你

    2024年04月11日
    浏览(21)
  • 抖音视频批量智能剪辑/智能一键成片功能如何技术开发源头?

    抖音视频批量智能剪辑/智能一键成片功能如何技术开发源头?

     抖音seo,视频剪辑,批量发布,账号矩阵管理,无人直播自动询盘锁定客户,想实现以上功能都要有正规的接口权限,这个权限接口已经在前面文章发过。 智能剪辑:咱们研发公司自主研发的,包括算法,算法是阶乘算法,无限产出,六大剪辑模式已经满足当下需求了,当

    2024年02月09日
    浏览(12)
  • 【音视频SDK测评】线上K歌软件开发技术选型

    【音视频SDK测评】线上K歌软件开发技术选型

    在线K歌软件的开发有许多技术难点,需考虑到音频录制和处理、实时音频传输和同步、音频压缩和解压缩、设备兼容性问题等技术难点外,此外,开发者还应关注音乐版权问题,确保开发的应用合规合法。 前面写了几期关于 直播 SDK 技术选型 的文章,主要是从RTC实时音视频

    2024年02月14日
    浏览(14)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包