焱融 YRCloudFile 跨云多源数据管理,直击自动驾驶 “割裂式存储”痛点

这篇具有很好参考价值的文章主要介绍了焱融 YRCloudFile 跨云多源数据管理,直击自动驾驶 “割裂式存储”痛点。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

​汽车产业作为国民经济支柱产业之一,其在国民经济战略性支柱产业的地位是不可撼动的。在《“十四五”交通领域科技创新规划》中也提出,到 2025 年实现关键技术研发应用取得新突破,科技创新能力全面增强,创新环境明显优化三大总体目标。其中,明确了在运输服务领域,自动驾驶、智能航运、机场智能运行管控等技术在部分场景得到示范应用。

可见,智能化技术正悄然走进人们生活,自动驾驶也逐渐从 L1-L2 阶段,开始向 L3-L4 级别发展,众多整车厂和自动化驾驶算法系统开发厂商正在积极探索,力求占领行业第一位,拿到自动驾驶这把汽车未来市场宝藏的钥匙。

当前,在整体汽车自动化驾驶行业中,核心竞争力已经从车辆硬件转向自动驾驶决策“AI 大脑”。AI 训练只有在不断迭代更新的过程中,才能逐渐增长“见多识广”的能力,做出准确的判断。其中,提升 AI 自动驾驶算法迭代能力,可谓是各家厂商竞争对抗的关键能力。

实际上,影响 AI 迭代的核心关键主要是,算法设计和海量的数据

海量有特征的训练数据是让 AI 具备认识世界的重要环节,从路测数据采集到数据中心的数据预处理、特征数据管理、训练、数据归档等一系列过程都需要高效衔接运行,只要其中一个环节不通畅,或者效率低就会导致整体业务效率下降。因此,AI 算法的竞争背后是 AI 算法内的海量数据竞争,如何完善数据流管理成为了自动化驾驶迭代的关键。

焱融 YRCloudFile 跨云多源数据管理,直击自动驾驶 “割裂式存储”痛点

自动化驾驶业务流程图

在自动驾驶的发展过程中,数据正向着更复杂的方向发展,总结近几年的数据模式,可以发现数据具备以下特征:

数据多样性

根据不同自动驾驶级别,数据产生的来源不同。数据类别不仅包括了汽车基础数据,还包括基础设施、交通数据、地理信息数据,以及车主的大量用户身份类数据、用户状态数据、行为类数据等。

数据规模大

自动驾驶车辆作为跨产业技术的融合载体,融合了来自汽车、道路、天气、用户、智能计算系统等多方面的海量数据,涉及数据类型多,需要统计分析的数据总量大。

数据非结构性

数据多样性决定了不同来源的数据格式不同,数据的非结构性和非标准性对数据聚合或拆分技术,以及权限管理和安全存储都带来了巨大的挑战。

数据流动性

大量自动驾驶数据在用户端、车端、云端等多场景的交互,使得数据的流动性增大。

以上是自动化驾驶行业的业务数据特点,为进一步说明这些已知的特征,我们将以一家全球无人驾驶科技公司的解决方案为例,帮助大家了解焱融科技是如何构建该公司 IT 基础平台支撑其业务发展。

割裂式存储难处理

该全球无人驾驶科技公司是一家专注于 L4 级别无人驾驶卡车技术研发与应用的人工智能企业,具备感知、定位、决策、控制等无人驾驶核心功能,能够实现货运卡车在干线物流场景和半封闭枢纽场景下的全无人驾驶。

在该公司的整体业务流程中,包含数据预处理、特征数据管理、训练、归档等多个环节,原始数据需要经过众多环节处理,才能成为业务要求的特征化数据。在使用 YRCloudFile 之前,该公司管理数据的方式是采用割裂式的方式,比如:

  • 数据预处理,使用大容量存储

  • 特征数据管理,使用高性能存储

  • 训练阶段,使用高性能存储

  • 归档阶段,使用大容量存储

如此频繁更改数据存储方式是因为整体业务亟需应对性能和成本的要求。但割裂的数据存储管理方式极易产生数据流程的直接成本、时间成本、运维压力,同时还会涉及到本地数据和算力配合,云端数据和算力配合的跨云需求等等,而这些成本、压力和需求最终会直接影响产品和业务的发展效率。

焱融科技支持“跨云多源数据管理”

焱融科技充分了解到该公司全业务流程存储管理的痛点以后,根据自身在行业多年的AI 自动化驾驶领域存储经验,提出了“混合云存储”解决方案。通过路测取回的原始数据作为共享母版的方式,搭建本地到云端的跨云架构方案,将原先数据流向“大容量存储-高性能存储-大容量存储”的拷贝方式,通过 YRCloudFile DataLoad 技术实现统一管理,按照业务发展需要按需流转,自动化管理,彻底摒弃传统人工或者脚本管理运维的原始方式。

YRCloudFile 通过将数据预处理、特征数据管理、训练、归档业务环节串联起来,达到了真正意义上的流管理方式,使得数据随业务在系统内部流动,单阶段性能比传统架构提升 7 倍左右,实现在数据预处理阶段,计算集群通过向低成本的对象存储读取数据进行业务开展,读取后通过文件层加速,实现后续工作。

焱融 YRCloudFile 跨云多源数据管理,直击自动驾驶 “割裂式存储”痛点

YRCloudFile 跨云多源整合业务流程图

在数据预处理阶段,原始数据经过低成本低性能的传统存储到达数据预处理计算集群,随着业务访问存储的并发量在不断上升,从几个到几十个,持续时长随业务变化,这就给存储带来了较大压力,因为每个数据预处理的带宽都比较大,而且是大文件和小文件混合模式,所以对于底层存储的性能是一个考验。

性能监测传统存储支撑性能最大约为3GB/s,数据预处理环节使存储性能问题成为业务发展的第一个短板,亟需解决。

在使用 YRCloudFile 作为文件层,向下对接对象层后,开启 YRCloudFile DataLoad 功能,同样在数据预处理环节中,性能监测反馈可满载运行 60 个数据预处理任务,20GB/s 的带宽量,前端计算带宽基本打满,此时相较于传统存储,采用 YRCloudFile DataLoad 后性能提升 7 倍左右。而大量素材是通过 YRCloudFile DataLoad 进行了多源整合和加速,并未改变原始数据的存储方式,从性能和成本、管理都得到了很好的平衡,关键实现了业务效率的极大提升。

焱融 YRCloudFile 跨云多源数据管理,直击自动驾驶 “割裂式存储”痛点

数据预处理业务并发对比图

另外,数据在进入预处理存储后,就开始了由 YRCloudFile 统一命名管理,实现了数据随业务发展流动,除了能让上文提到的数据预处理环节实现降本增效,还可以帮助后续环节中的多个业务环节利用 YRCloudFile DataLoad 技术功能来提升性能。

例如在生产环节,相比全量提取对比数据的办法,YRCloudFile 采用 DataLoad 技术,可以按需读取生产数据对比数据进行测试,从整体时效性上,具备秒级响应特征,对比传统全量拷贝方式,业务效率提升巨大。

在帮助客户实现业务数据多源整合的同时,YRCloudFile 还通过分层技术功能让客户落地了本地到云端的同步双活方案,达成了业务连续性的要求,并最大化降低 TCO。具体架构如下:

焱融 YRCloudFile 跨云多源数据管理,直击自动驾驶 “割裂式存储”痛点

YRCloudFile 分层双活业务架构

在本地算力端部署 YRCloudFile,满足业务加速要求的同时,向下开启对象接口,通过 YRCloudFile 全生命周期管理策略,按照周期管理将冷热数据分开,冷数据自动下刷至对象存储,热数据在 YRCloudFile 的文件层,保障性能稳定和平衡成本支出。在业务调取冷数据时,可以通过透明调取的方式,按照 YRCloudFile 统一命名空间管理。

在此基础上,YRCloudFile 对接云上对象存储,将按照数据生命周期管理的策略,把本地下刷至对象存储的数据同步上传到云上对象存储,实现本地和云端对象存储数据同步。如若业务需要读取冷数据时,YRCloudFile 会根据读取指令将优先读取本地存储目标数据和切片返回给业务端,采用云端不读取的方式,节约数据成本。当本地对象故障时,冷数据同步在云端,那么 YRCloudFile 会检测数据位置,读取云端数据和切片返回给计算。以此来整体保障业务连续性,避免因网络、站点等产生的故障问题。

通过 YRCloudFile DataLoad 技术和多级分层技术,该公司的存储成本直接下降 300% 且性能提升 500%以上,实现在全业务流程中,数据存储的管理对于业务是完全透明的。这也意味着,无论数据如何变动,业务端都无需“操心”。包括归档以后,也是由 YRCloudFile 全生命周期统一管理,达到“跨云多源数据管理”能力。

该公司在采用高性能分布式文件存储 YRCloudFile 的方案后,打破了传统存储的壁垒,全面提升了数据整合能力,并在业务实际使用过程中,配合完善的运维能力,提升整体可维护使用能力,真正做到“最懂自动化驾驶业务的存储系统”。目前,焱融科技已经帮助该公司建立多个数据中心和跨云整体混合云平台,有效优化业务流程,提升整体业务效率。文章来源地址https://www.toymoban.com/news/detail-407988.html

到了这里,关于焱融 YRCloudFile 跨云多源数据管理,直击自动驾驶 “割裂式存储”痛点的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包赞助服务器费用

相关文章

  • 【数据库管理】②实例管理及数据库启动关闭

    【数据库管理】②实例管理及数据库启动关闭

    用于管理和访问 database. instance 在启动阶段读取初始化参数文件(init parameter files). (parameter file)文本初始化参数文件 -- 静态参数文件. 1)文本文件,必须通过编辑器修改参数. 2)修改参数下次重启实例才生效. 3)pfile参数文件可以不在database server上. 命名方式: init+SID.ora (system paramet

    2023年04月08日
    浏览(16)
  • 数据仓库元数据管理

    数据仓库元数据管理是数据仓库中至关重要的一环,它涉及到对数据仓库中的元数据进行收集、存储、组织、查询、维护和安全管理等方面的工作。本文将介绍数据仓库元数据管理的定义、分类、应用、价值、管理方案、具体实施和挑战,以帮助读者更好地理解和应用数据仓

    2024年04月28日
    浏览(8)
  • 大数据-------元数据管理

    大数据-------元数据管理

    元数据就是描述数据的数据,它为企业的各类数据提供了上下文环境,使企业能够更好地了解、管理和使用数据。 现在数据对于公司的决策十分的重要,随着业务的发展,业务线会慢慢庞大起来,随着开发人员的变更以及增多,没有元数据治理,很难保证数据质量,这时候就

    2024年02月13日
    浏览(6)
  • 数据仓库—主数据管理

    在当今信息爆炸的时代,数据已经成为企业最重要的资产之一。然而,许多企业在管理数据时面临着挑战,其中之一就是处理不同系统中的数据不一致问题。主数据管理(Master Data Management,MDM)就是为了解决这一问题而诞生的。 在说主数据之前,我们先提一下元数据,因为

    2024年04月14日
    浏览(7)
  • YRCloudFile V6.9.0 加速企业在大数据应用技术创新

    YRCloudFile V6.9.0 加速企业在大数据应用技术创新

    近日,焱融科技发布分布式文件存储产品 YRCloudFile 6.9.0 版本。该版本在功能和性能方面有多项技术性突破,主要包括大数据应用无缝对接 Hadoop ,为大数据应用提供高性能存储平台;独有的 Dataload 功能和智能分层细粒度化,更加精确丝滑地响应业务需求;同时实现 NFS/SMB 协议

    2024年01月18日
    浏览(10)
  • 全平台数据(数据库)管理工具 DataCap 管理 Rainbond 上的所有数据库

    DataCap是用于数据转换、集成和可视化的集成软件,支持多种数据源、文件类型、大数据相关数据库、关系数据库、NoSQL数据库等。通过该 DataCap 可以实现对多个数据源的管理,对数据源下的数据进行各种操作转换,制作数据图表,监控数据源等功能。 安装 Rainbond,可通过一条

    2023年04月21日
    浏览(25)
  • 什么是数据管理,数据治理,数据中心,数据中台,数据湖?

    什么是数据管理,数据治理,数据中心,数据中台,数据湖?

    大家好,我是独孤风,大数据流动的作者。 最近几个概念频繁出现在大家的视野内。 什么是数据管理,数据治理,数据中心,数据中台,数据湖? 他们之间又有怎么样的区别和联系呢? 这几个概念常常让人混淆,今天我们就来详细解析一下。 数据管理是指组织对其整个数

    2024年02月17日
    浏览(13)
  • Docker基本管理与网络以及数据管理

    Docker基本管理与网络以及数据管理

    Docker是一个go语言开发的应用容器引擎,运行容器里的应用。docker是用来管理容器和镜像的一种工具。 容器是在linux上本机运行,并与其他容器共享主机的内核,它运行的是一个独立的进程,不占用其他任何可执行文件的内存,非常轻量。 虚拟机运行的是一个完整的操作系统

    2024年02月07日
    浏览(13)
  • 【数据库管理】⑩数据字典

    【数据库管理】⑩数据字典

     1. 数据字典的概述 数据字典(Data Dictionary) 是数据库管理系统中的一个重要组成部分,它 是一个存储数据库元数据的集合,包含了数据库中所有对象的定义和描述信息。 数据字典可以帮助用户了解数据库中的各种对象和数据结构,以及它们之间的关系和依赖关系。 数据字

    2024年02月12日
    浏览(15)
  • 【⑩MySQL】:表管理,让数据管理不再困难

    【⑩MySQL】:表管理,让数据管理不再困难

    ✨欢迎来到小K的MySQL专栏,本节将为大家带来MySQL表/数据库创建和管理的讲解 ✨ ✨ 1.1 表的基本概念 在MySQL数据库中,表是一种很重要的数据库对象,是组成数据库的基本元素,由若干个字段组成,主要用来实现存储数据记录。表的操作包含创建表、查看表、删除表和修改表

    2024年02月12日
    浏览(50)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包