对于监控选型的一些思考

这篇具有很好参考价值的文章主要介绍了对于监控选型的一些思考。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

  • 监控的选型:

1.首先是拉模式(例如prometheus)和推模式:

拉可以随意控制拉取频率和指标,可大可小,推的话收集者可以下发改变推频率的指令,实现比较麻烦;拉失败快速知道客户端节点agent监控异常,推的话只能看哪个节点没上报比较麻烦;

拉模式下客户端agent只需要读取数据放到指定地方即可,不管发送,避免像推一样推失败导致进程整体退出;拉模式需要知道从哪拉,可以借助k8s实现,推模式需要知道往哪推,需要通过watch长连接监听注册的接收者节点的状态(如果不监听,agent推送数据失败没问题,就重新选择一个接收点推送,并随机一段时间后重新从注册中心拉取数据,但是接收节点添加新节点了呢,能不能手动关掉接收点,让他们重新拉取,或者给所有点发一个重新拉取的命令);

节点比较多的时候,拉模式需要进行分片比较难做,负载均衡的任务在收集者(哪个收集器去拉哪几个客户端agent),推模式下客户端agent做负载均衡,实现更容易;拉模式是时间触发,推模式可以做到事件触发,更灵活;

2. 对于注册中心的选择到底是ETCD还是DNS域名:

DNS 服务发现ip,添加ip是比较容易的,但是下掉ip是没有相应的事件驱动的,只能适用于小量的服务请求,因为客户端不知道哪个ip坏掉了,但是又不能放弃这个坏掉的ip(万一已经好了呢);还有个问题,每次请求域名都是走DNS吗,会不会走缓存,如果走缓存,添加了节点多久更新一次呢?(DNS缓存失败的怎么容灾)究其根本,域名是有缓存的,并且不能像注册中心那样主动推送事件,只能失败重试。

对于监控来说,流行的是prometheus是agent起端口然后拉的模式,这样的好处呢,一个不用维护长连接的问题,每次短连接并不影响容器的性能,拉不通能够瞬间感知,但是同样也有问题,怎么做分片,实现多机器节点任务分发,首先monitor节点会做list/watch所有IP,接下来解决就是分片,哪台机器拉取那一片(可以通过取余数解决),可以每台机器占有一个片,然后占有的片去执行任务,执行完后再去占有下一片。但是又有个问题,机器占有这一片之后挂了呢,可以让agent保有未拉取的片,然后等待下一次一起拉取出来。那分片不均等的问题怎么解决呢,分片不均等是存在的,这也是一种权衡吧,可以加大片的数量,但是对于监控场景来说是接受的

Promethus更偏向于优先export的扩展,因为pull的模式下agent没有必要知道往哪个地方发送数据

pull 和 push 最大的区别在于 单条连接的复用程度 。pull 需要知道从哪里pull,push需要知道往哪里push,因此需要注册中心来记录。pull 可以通过注册中心来 做,promethus通过list/watch k8s的相关数据,push的话可以通过DNS来解决,也可以通过自行注册的方式;文章来源地址https://www.toymoban.com/news/detail-507775.html

到了这里,关于对于监控选型的一些思考的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包赞助服务器费用

相关文章

  • 监控场景及开源监控方案选型

    监控场景及开源监控方案选型

    先看监控的需求来源,即监控系统可做什么 再跳出监控,从可观测性,看监控与日志、链路间的关系及它们各自的作用 最后介绍开源社区几个有代表性的方案以及它们各自的优缺点,便于你之后做技术选型。 系统出问题我们能及时感知。随时代发展,对监控系统提出更多诉

    2024年01月22日
    浏览(11)
  • 对于xshell连接不上虚拟机的一些解答

    对于xshell连接不上虚拟机的一些解答

    如果你发现你可以在虚拟机内ping通 之后,在你电脑dos下也可以ping通。 然而,还是发现你的xshell连接不上虚拟机。 这里使用ifconfig   我发现这个地址是在变化的,之前是129,现在是131,所以这样再到xshell,在连接属性那里,把地址改了就可以了,再重新连接,OK了。   本文

    2024年02月07日
    浏览(10)
  • 关于推荐场景的一些思考

    由于用户数的飙升,推荐使用的技术栈也在不断升级,以满足更高并发和更大数据量的推荐场景。 推荐相关的原始数据从小几十万到几百万,到几千万,再到上亿。 从全库的用户数据中load出满足条件的用户,在jvm做计算,得到推荐结果。 随着用户数量的上升,满足条件的用

    2023年04月09日
    浏览(18)
  • 关于账号安全的一些思考

    关于账号安全的一些思考

    目录 声明 0x01-提升账号安全的目的 0x02-问题分析 1、攻击思路 1.1、页面关键点拆解 1.2、关于提升账号成本 2、攻击行为 3、黑产资源 维度1:资源 维度2:作弊工具 0x03-矛与盾 资源维度 1、IP资源 1.1、IP资源介绍 1.2、攻击方式 (1)IP池实现逻辑 (2)IP池页面展示 1.3、防御思路

    2023年04月10日
    浏览(9)
  • 线程同步的一些思考

    A、B轮流 这种没有顺序依赖的打印场景,只需要将notify唤醒提前,就不会有死锁问题 先A后B 正确写法: 总结: 说一下这种场景的特点,就是有顺序,那么意味着需要标识。意味着其它n个线程执行只有其中一个满足条件的线程能够往下执行然后 通知 ,这个很重要,因为线程

    2024年02月12日
    浏览(11)
  • 客户管理系统在选型过程中遇到一些常见的问题

    客户管理系统在选型过程中遇到一些常见的问题

      如今很多企业都搭上了客户管理系统这趟顺风车,将现有规范化取得了很大成果。而也有很多企业处在观望态度,主要原因还在于担心 客户管理系统在选型过程中遇到一些常见的问题。 接下来分享一些真实的客户需求: 部署系统后可以微调 “选型时,我们比较关注软件使

    2024年02月08日
    浏览(8)
  • 解决前端恶意代码侵入的一些思考

    解决前端恶意代码侵入的一些思考

    安全,特别是软件代码安全,近年来被业内人士频繁提出,可见其受重视程度。而这些,起源与全球化的开源大生产。 开源软件运动如火如荼的进行了二十四五年(如果从1998年2月3日在硅谷的一次会议中首次提出“open source”一说开始算 - 当时互联网先驱Netscape刚刚宣布开放

    2023年04月08日
    浏览(11)
  • 我对ChatGPT的一些看法与思考

    我对ChatGPT的一些看法与思考

    1.1 ChatGPT是干啥的 ChatGPT全名Chat Generative Pre-trained Transformer,是美国OpenAI公司推出的一个聊天机器人程序,是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写

    2023年04月16日
    浏览(14)
  • AIGC批量图生成的一些思考

    AIGC批量图生成的一些思考

    从技术到先进生产力,从先进装备到作战能力,中间隔了一道GAP。现在AI技术进展很快,开源的模型大部分是单点或者一个模块单元的突破。如何把这些技术整装成作战单元,为业务带来实际的价值是我们必须要解决的一个问题。 这部分介绍的是如何搭建一个基于内容的图检

    2024年04月15日
    浏览(10)
  • 投资基金中一些别人的思考

    大部分投资者目前选择基金主要还是通过历史业绩判断未来。实际上影响基金未来业绩表现的维度比较多, 比如股票、债券等各类资产的持仓情况、仓位及换手率水平、基金规模等等。对于权益类基金而言,持仓行业分布怎样、 个股和行业集中度怎样?对于债券类基金而言

    2024年02月01日
    浏览(7)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包