西电分布式系统考试复习

这篇具有很好参考价值的文章主要介绍了西电分布式系统考试复习。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

分布式系统复习要点

by Fa1con_JS

考试形式

8-10道问答题,偏重理解,优缺点评判

分布式系统定义

(20年原题,老师强调)基本定义:各个通过网络互联的独立自治的计算节点组成,这些计算节点通过消息传递的机制进行相互协作,以完成共同的目标。在普通用户角度看来,计算节点内聚在一起,是一个整体,用户在使用系统功能时,往往无法察觉到分布式系统的内部构成和节点之间的协作关系!

基本概念:多个计算节点,网络互联(异构网络互联,可无线,可有线),独立自治,相互协作以完成共同目标,消息传递模型(并非内存共享结构模型!)

**消息传递节点:出错之间是独立的,无共享架构(相互之间物理上不共享,通过计算机网络共享资源)**设计分布式计算算法需要考虑容错(各节点独立自治,网络互联),时钟同步,通信代价(数据量控制,多计算,少交互,尽量避免频繁的通信,与共享结构区分开来),分布式计算和并行计算的关系(子集关系:并行计算包括有分布式计算,分布式计算是并行计算中的一种特殊关系),分布式计算和云计算的关系(严格上说云计算是在用户上看,给用户以一种云的感觉,分布式计算是实现云计算的一个核心技术,但是云计算可以有很多别的实现方式,比如。。。云计算是目标,分布式计算是手段

构建分布式系统带来的收益

提高计算能力,提高存储能力,提高网络吞吐能力(并发访问能力),提高可靠性(解决局部节点失效问题),提高安全性(解决被局部攻击问题),提高可拓展性(解决瓶颈问题),实现资源共享,实现跨越时空的协同服务(发挥不同节点的优势)

(20年原题)Q.分布式系统的定义

A.见定义模块,这里不再赘述。

(20年原题)Q.同一个物理主机上是否可以包含多个分布式计算节点?为什么?

A:可以包含,因为可以进行虚拟化操作,一台物理设备抽象出多台虚拟设备,虚拟设备之间进行消息传递机制协作,即视为多个分布式计算节点,这些节点统称为分布式虚拟计算节点,也即虚拟节点。

(20年原题)Q.用多个计算节点构成分布式系统可以带来哪些好处?

A.主要包含以下好处:1.提高并发度,提高计算任务完成速率,因为节点变多,各个节点分到的计算任务得到平摊,各任务之间可以并行计算,同时也支持了更多用户同时访问的程度。2.提高容错性:单个节点或局部几个节点失效不会影响整体系统的完善性和正确性,用户只会感觉到系统处理速度变慢,可以通过更换计算设备来进行无缝纠错。3.提高系统可拓展性、开放性及安全性,部分节点被攻击,系统仍然可以正常工作。

(老师强调)用哪些特性衡量分布式系统的优劣

  1. 业务层性能:时间复杂度,空间复杂度,通信复杂度(交互复杂度)

    (以下为分布式特有)

  2. 可拓展性(水平可拓展性:用户增加,简单增加服务器就可以提升系统能力)(垂直可拓展性:加CPU,内存(单机系统升级)可以提升系统能力,如果单线程的设计程序,增加CPU核数不能提升系统能力)

  3. 容错性:不能因为局部服务器失效就整体失效,网络接触不良,局部错误尽量不能影响整体系统的功能(可用性,可恢复性)

  4. 并发性:单个节点可能要和多个其他端交互,多个客户端同时访问单个节点的问题

  5. 透明性:在用户看来,分布式系统应该是一个整体的功能逻辑,用户不需要知道服务器的网络拓扑结构、服务器分布和数量及存储位置等。

  6. 开放性:允许节点随时接入随时退出

  7. 安全性:局部节点被黑客攻击,分布式系统仍可正常工作

  8. 可观测性/可维护性:(可观测性)作为维护员,得知道哪一台服务器失效、负载情况等,所有服务器情况都可以被维护员管理到(可能通过一个可视化系统观测到),非常的清晰。(可维护性)替换特别方便,替换故障节点直接进行原地更换,无需通知他人,而且系统无需停机,用户感觉不到正在维护的过程

分布式系统的故障模型

  1. 节点故障模型:失效停止,失效停止重启,拜占庭模型:节点失效后(可能被黑客攻击),仍然参与工作,可能发出错误的数据包,扰乱系统的正常工作。企业内部节点:设置故障模型只需为失效停止模型即可;任何系统(联网的):容忍拜占庭模型
  2. 信道故障:传输延迟的不确定性、网络断裂、丢包、数据包乱序(TCP不考虑该问题)
  3. 时钟不同步:各个机器的时钟可能不太一样->时间戳(time-stamp)

设计分布式系统的挑战

容错能力,全局视角问题(节点染色方法,部分节点不知道自己在全局的地位,只能通过和相邻节点沟通解决冲突等)

分布式计算任务的分类

OLTP:在线(联机)事务处理系统(拿到任务请求后要迅速完成,高并发设计,实时性需求非常高)

OLAP:在线(联机)分析处理系统(允许延时长,不太强调并发性,方便数据分析)

准实时处理任务(流处理,介于OLAP和OLTP之间):(比如商品推荐系统,时效性介于两者之间,不用太快,但也不能太慢)

(19年原题,一整道大题)分布式系统架构模式

  • C-S模式:负载均衡技术(LB):如何架构(反向代理),带来的收益(性能,可拓展性提高,容错性提高:某一台设备失效,只是性能会略微下降一点),**常用负载均衡算法,要掌握每个负载策略的优劣势和具体的应用场景,例如轮询,随机负载均衡策略(优:编写简单,劣:随机负载会让缓存失效(随机访问),可能导致一些关键缓存被忽略(比如用户登录密码))**不同层级实现负载均衡(Nginx:传输层负载均衡。网络层负载均衡(IP地址改变),数据链路层负载均衡(LVS,MAC地址改变),应用层负载均衡(目标程序改变等))
  • 主从架构模式(若干从节点,一个主节点,一种C/S结构的模式)(HDFS,MapReduce,Spark等)优点:好设计,从节点宕机不会影响总体功能。由于从节点均服从主节点的调控,安全性较高。缺点:主节点容易成为瓶颈和失效关键节点,解决方式:设计主节点的备份节点
  • 总线模式:消息队列,异步通信,无主通信
  • 对等模式:运行的程序之类完全相同,又称对等互联网络技术,没有客户端或服务器的概念,只有平等的同级节点,同时对网络上的其他节点充当客户端和服务器。优点:去中心化(比特币的根本出发点),可扩展性强(用户可以随意加入随意离开),健壮稳定性,资源共享,优化传播速度,容错性高。缺点:无法确定用户传输内容的真实、无害性,可能容易受到部分用户的攻击而瘫痪失效,建立连接数太多,消息延迟大,以及消息的重复性消除问题
  • 混合模式(不算单独的,可以视为tradeoff)

(19年原题)常用的负载均衡策略及功能

  • 随机
  • 轮询
  • 固定权重值(总权重和为1)
  • (19年考具体原理)IP哈希(一致性哈希)(以上四种为静态负载均衡策略)
  • 最少TCP连接数(以下三种是考虑实际负载的均衡策略)
  • 最小响应时间
  • 基于各服务器实际负载的动态负载均衡算法(CPU,内存,磁盘IO占用情况)

主要功能:实现高并发,高可用性,以及部分安全性,同时也有伸缩性(增加或减少服务器,给用户依旧以整体的感觉)文章来源地址https://www.toymoban.com/news/detail-479353.html

</

到了这里,关于西电分布式系统考试复习的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包赞助服务器费用

相关文章

  • 分布式计算----期末复习题(仅供参考)

    一.单选题,每个2分 1.Hadoop 之父 是下面的哪一位?(B) A. James Gosling        B.Doug Cutting    C.Matei Zaharia   D.Linus Benedict Torvalds 2.Hadoop中,用于 处理或者分析海量数据 的组件是哪一个?(  B   ) A.HDFS     B.MapReduce     C.Yarn   D.以上选项都不是 3.HDFS中 存储和管理元数据

    2024年02月10日
    浏览(15)
  • 什么是分布式系统,如何学习分布式系统

    什么是分布式系统,如何学习分布式系统

    正文 虽然本人在前面也写过好几篇分布式系统相关的文章,主要包CAP理论,分布式储存与分布式事务,但对于分布式系统,并没有一个跟清晰的概念。分布式系统涉及到很多的技术、理论与协议,很多人也说,分布式系统是“入门容易,深入难”,我之前的学习也只算是管中

    2024年02月13日
    浏览(19)
  • (快手一面)分布式系统是什么?为什么要分布式系统?分布式环境下会有哪些问题?分布式系统是如何实现事务的?

    《分布式系统原理与泛型》中这么定义分布式系统: “ 分布式系统是若干独立计算机的集合, 这些计算机对于用户来说就像单个相关系统 ”, 分布式系统(distributed system)是建立在网络之上的软件系统。 就比如:用户在使用京东这个分布式系统的时候,会感觉是在使用一

    2024年02月08日
    浏览(12)
  • 高级分布式系统-第10讲 分布式控制系统

    高级分布式系统-第10讲 分布式控制系统

    高级分布式系统汇总:高级分布式系统目录汇总-CSDN博客 自动化是关于一切人造系统自动、智能、自主、高效和安全运行的科学与技术 计算机控制技术是实现自动化的主要方法和手段 分布式控制技术是伴随着机器大工业生产而诞生的特殊计算机控制技术 指利用计算机(通常

    2024年01月19日
    浏览(13)
  • 分布式系统中的分布式链路追踪与分布式调用链路

    本文分享自天翼云开发者社区《分布式系统中的分布式链路追踪与分布式调用链路》,作者:c****w 在分布式系统中,由于服务间的调用关系复杂,需要实现分布式链路追踪来跟踪请求在各个服务中的调用路径和时间消耗。这对问题排查和性能监控都很重要。 常用的分布式链

    2024年01月19日
    浏览(14)
  • 高级分布式系统-第15讲 分布式机器学习--分布式机器学习算法

    高级分布式系统-第15讲 分布式机器学习--分布式机器学习算法

    高级分布式系统汇总:高级分布式系统目录汇总-CSDN博客 按照通信步调,大致可以分为同步算法和异步算法两大类。 同步算法下,通信过程中有一个显式的全局同步状态,称之为同步屏障。当工作节点运行到 同步屏障 ,就会进入等待状态,直到其工作节点均运行到同步屏障

    2024年01月18日
    浏览(13)
  • 分布式系统概念和设计——分布式共享内存

    分布式系统概念和设计——分布式共享内存

    分布式共享内存 分布式共享内存是在不共享物理内存的计算机之间实现数据的共享的一个抽象。 有一个底层运行的系统保证其透明性,但是进程还是根据内存的分布处理物理内存的分布式能力 DMS最关键点: 不需要关心数据的通信,消息传递能力是巨大的底层支持。 生存周

    2024年02月10日
    浏览(11)
  • 分布式系统架构设计之分布式缓存技术选型

    分布式系统架构设计之分布式缓存技术选型

    随着互联网业务的快速发展,分布式系统已经成为了解决大规模并发请求、高可用性、可扩展性等问题的重要手段。在分布式系统中,缓存作为提高系统性能的关键技术,能够显著降低数据库负载、减少网络延迟、提高数据访问速度。当面对大量并发请求时,如果每次都直接

    2024年02月03日
    浏览(252)
  • 高级分布式系统-第14讲 分布式控制经典理论

    高级分布式系统-第14讲 分布式控制经典理论

    高级分布式系统汇总:高级分布式系统目录汇总-CSDN博客 模糊控制是一种以模糊集合论、模糊语言变量以及模糊逻辑推理为数学基础的控制方法,它模拟人的思维,构造一种非线性控制,以满足复杂的不确定的过程控制的需要,属于智能控制范畴。 由于模糊控制是对人的思维

    2024年02月01日
    浏览(26)
  • 高级分布式系统-第12讲 分布式控制经典理论

    高级分布式系统-第12讲 分布式控制经典理论

    高级分布式系统汇总:高级分布式系统目录汇总-CSDN博客 分布式控制系统的设计,是指在给定系统性能指标的条件下,设计出控制器的控制规律和相应的数字控制算法。 根据偏差的比例(Proportional)、积分(Integral)、微分(Derivative)进行控制(简称PID控制),一种广泛应用

    2024年01月20日
    浏览(12)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包