Doris架构中包含哪些技术?

这篇具有很好参考价值的文章主要介绍了Doris架构中包含哪些技术?。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Doris主要整合了Google Mesa(数据模型),Apache Impala(MPP Query Engine)和Apache ORCFile (存储格式,编码和压缩)的技术。

为什么要将这三种技术整合?

Mesa可以满足我们许多存储需求的需求,但是Mesa本身不提供SQL查询引擎。

Impala是一个非常好的MPP SQL查询引擎,但是缺少完美的分布式存储引擎。

自研列式存储:存储层对存储数据的管理通过storage_root_path路径进行配置,路径可以是多个。存储目录下一层按照分桶进行组织,分桶目录下存放具体的tablet,按照tablet_id命名子目录。因此选择了这三种技术的组合。

Doris架构中包含哪些技术?,架构

Doris的系统架构如下,Doris主要分为FE和BE两个组件。

整体架构

Doris的架构很简洁,使用MySQL协议,用户可以使用任何MySQL ODBC/JDBC和MySQL客户端直接访问Doris,只设FE(Frontend)、BE(Backend)两种角色、两个进程,不依赖于外部组件,方便部署和运维。

FE:Frontend,即Doris的前端节点。主要负责接收和返回客户端请求、元数据以及集群管理、查询计划生成等工作。

BE:Backend,即Doris的后端节点。主要负责数据存储与管理、查询计划执行等工作。

FE,BE都可线性扩展FE主要有两个角色,一个是follower,另一个是observer。多个follower组成选举组,会选出一个master,master是follower的一个特例,Master跟follower,主要是用来达到元数据的高可用,保证单节点宕机的情况下,元数据能够实时地在线恢复,而不影响整个服务。

Observer节点仅从leader节点进行元数据同步,不参与选举。可以横向扩展以提供元数据的读服务的扩展性。

数据的可靠性由BE保证,BE会对整个数据存储多副本或者是三副本。副本数可根据需求动态调整。

Doris架构中包含哪些技术?,架构

元数据结构

Doris采用Paxos协议以及Memory+ Checkpoint + Journal的机制来确保元数据的高性能及高可靠。元数据的每次更新,都会遵照以下几步:

(1)写入到磁盘的日志文件中

(2)再写到内存中

(3)定期checkpoint到本地磁盘上

相当于是一个纯内存的一个结构,也就是说所有的元数据都会缓存在内存之中,从而保证FE在宕机后能够快速恢复元数据,而且不丢失元数据。

Leader、follower和observer它们三个构成一个可靠的服务,如果发生节点宕机的情况,一般是部署一个leader两个follower,目前来说基本上也是这么部署的。就是说三个节点去达到一个高可用服务。单机的节点故障的时候其实基本上三个就够了,因为FE节点毕竟它只存了一份元数据,它的压力不大,所以如果FE太多的时候它会去消耗机器资源,所以多数情况下三个就足够了,可以达到一个很高可用的元数据服务。文章来源地址https://www.toymoban.com/news/detail-682446.html

到了这里,关于Doris架构中包含哪些技术?的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包赞助服务器费用

相关文章

  • dinky+flink+doris实时架构全流程demo

    dinky+flink+doris实时架构全流程demo

    官网下载地址:https://archive.apache.org/dist/doris/1.2/1.2.3-rc02/   #doris单机部署 #配置FE  #配置 BE #下载地址:Index of /dist/flink/flink-1.14.6 #Flink单机部署 #相关依赖包下载 #启动 #访问 #下载  #Dinky单机部署 #配置dinky #添加依赖 依赖下载:https://download.csdn.net/download/qq_41060328/87817727 备份

    2024年02月15日
    浏览(11)
  • Doris-简介、架构、编译、安装和数据表的基本使用

    Doris-简介、架构、编译、安装和数据表的基本使用

    目录 1、Doris简介 2、Doris网址 3、Doris架构 3、编译和安装 3.1、软硬件需求 3.2、编译 3.2.1、安装Docker环境 3.2.2、使用Docker 开发镜像编译 3.3、集群部署 3.3.1、创建目录并拷贝编译后的文件 3.3.2、部署 FE 节点 3.3.3、配置 BE 节点 3.3.4、在 FE 中添加所有 BE 节点 3.3.5、启动 BE 3.3.6、部

    2024年02月21日
    浏览(8)
  • 【大数据入门核心技术-Doris】(三)Doris基本Shell和数据模型

    参考 【大数据入门核心技术-Doris】(二)Doris安装部署_forest_long的博客-CSDN博客 一、DCL 1、登录 mysql  -h FE_HOST -P9030 -uroot 2、修改密码 SET PASSWORD FOR \\\'root\\\' = PASSWORD(\\\'your_password\\\'); 3、创建新用户 CREATE USER \\\'test\\\' IDENTIFIED BY \\\'test_passwd\\\'; 后续登录时就可以通过下面链接命令登录: mysql

    2024年02月02日
    浏览(15)
  • Doris(一)-简介、架构、编译、安装和数据表的基本使用

    Doris(一)-简介、架构、编译、安装和数据表的基本使用

    Doris是由百度大数据研发,是一个现代化的MPP(Massively Parallel Processing)大规模并行处理的分析型数据库产品。仅需亚秒级响应时间即可获得查询结果,有效地支持实时数据分析。 Apache Doris 的分布式架构非常简洁,易于运维,并且可以支持 10PB 以上的超大数据集。 Apache Dori

    2023年04月17日
    浏览(13)
  • 【技术选型】Doris vs starRocks

    【技术选型】Doris vs starRocks

    仅从当前能看到的数据中,相比于doris,starRocks在性能方面具备优势,且更新频率高(降低维护成本)。 并发性不能太低——相比于clickhouse不到100的QPS 支持大表关联——降低数据清洗的压力,因为oneId有可能实时变化 集群化——需要有一定扩展能力,以针对不同量级客户 可

    2024年01月23日
    浏览(6)
  • 轻松存储千亿级数据,知乎基于Doris的DMP系统架构实践

    轻松存储千亿级数据,知乎基于Doris的DMP系统架构实践

    一、背景   1、DMP 业务   知乎业务中存在哪些问题需要解决?   为什么要建立 DMP 平台来解决这些问题?     2、DMP 业务流程   当前这些业务的运营流程是怎样的?   DMP 如何与业务结合并赋能?     其中运营模式包含如下 3 类:   1)站内运营自闭环   内容运营。拿内容

    2023年04月27日
    浏览(9)
  • 【大数据】Doris:基于 MPP 架构的高性能实时分析型数据库

    【大数据】Doris:基于 MPP 架构的高性能实时分析型数据库

    Apache Doris 是一个基于 MPP ( Massively Parallel Processing , 大规模并行处理 )架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于

    2024年02月11日
    浏览(15)
  • 从 Apache Doris 到 SelectDB Cloud:云原生架构下的弹性能力揭秘

    从 Apache Doris 到 SelectDB Cloud:云原生架构下的弹性能力揭秘

    随着云时代的到来,越来越多企业开始在公有云、私有云乃至 K8s 容器平台构建实时数据平台。云计算基础设施的革新,促使着数据仓库朝着云原生的方向发展。而用户日益复杂的业务负载和降本增效的需求,对于系统资源的精细化管理和成本效益等方面提出了更高的要求。

    2024年04月25日
    浏览(7)
  • Apache Doris 开源最顶级基于MPP架构的高性能实时分析数据库

    Apache Doris 开源最顶级基于MPP架构的高性能实时分析数据库

    Apache Doris是一个基于MPP架构的易于使用,高性能和实时的分析数据库,以其极高的速度和易用性而闻名。海量数据下返回查询结果仅需亚秒级响应时间,不仅可以支持高并发点查询场景,还可以支持高通量复杂分析场景。 这些都使得 Apache Doris 成为报表分析、即席查询、统一

    2024年02月03日
    浏览(9)
  • Apache Flink X Apache Doris构建极速易用的实时数仓架构

    Apache Flink X Apache Doris构建极速易用的实时数仓架构

    大家好,我叫王磊。是SelectDB 大数据研发。今天给大家带来的分享是《Apache Flink X Apache Doris构建极速易用的实时数仓架构》。 下面是我们的个人介绍:我是Apache Doris Contributor 和阿里云 MVP。同时著有《 图解 Spark 大数据快速分析实战》等书籍。 接下来咱们进入本次演讲的正题

    2023年04月24日
    浏览(12)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包