欢迎光临门徒注册监控摄影有限责任公司,门徒平台专业从事安防监控专业技术、防盗报警、门禁考勤、小区/楼宇智能化系统工程等项目。
LATEST NEWS
新闻动态
联系我们
销售热线:
Contact Hotline
门徒注册地址 门徒注册登录
传真:门徒注册地址

E-mail:admin@91084.com

公司地址:深圳罗湖区984号
当前位置: 门徒娱乐 > 新闻动态 > 行业资讯 >
监控系统介绍
 

  随着云计算、微服务等技术的流行以及互联网业务迅速发展运维人员与开发人员需要关注的服务数量也呈现出了指数级的增长如何做好监控能够快速且精准的定位问题成为了最迫切要解决的问题。

  某个模块出现故障没有及时发现等到故障影响范围扩大到影响业务场景才发现

  数据库目前的数据量如何增长速度如何。又例如每日活跃用户的数量增长的速度

  我们的请求延迟刚刚大幅增加了有没有其他现象同时发生

  系统出现瓶颈CPU占用居高不下内存不足磁盘被写满。

  以上这些问题一旦发生会对我们的业务产生巨大的影响。因此每个公司或者 IT 团队都会针对此类情况建立自己的 IT 监控系统。

  通过收集信息的分析结果预知存在的故障风险并采取行动。

  通过监控数据定位故障协助生成解决方案。

  监控数据可视化便于统计按照一定周期导出、归档用于数据分析和问题复盘。

  通常我们的系统会记录不同等级和状态的运行日志信息这些信息与事件息息相关例如PV/UV用户登录下订单用户平均响应时间等等。

  当代的互联网的服务通常都是用复杂的、大规模分布式集群来实现的。互联网应用构建在不同的软件模块集上这些软件模块有可能是由不同的团队开发、可能使用不同的编程语言来实现、有可能布在了几千台服务器横跨多个不同的数据中心。因此就需要一些可以帮助理解系统行为、用于分析性能问题的工具。

  分布式服务的跟踪系统需要记录在一次特定的请求后系统中完成的所有工作的信息。举个例子上图展现的是一个和5台服务器相关的一个服务包括前端A两个中间层B和C以及两个后端D和E。当一个用户这个用例的发起人发起一个请求时首先到达前端然后发送两个RPC到服务器B和C。B会马上做出反应但是C需要和后端的D和E交互之后再返还给A由A来响应最初的请求。对于这样一个请求在调用链监控系统中我们通常称之为一个trace。

  分布式追踪中的每个组件都包含自己的一个或者多个span。例如在一个常规的RPC调用过程中OpenTracing推荐在RPC的客户端和服务端至少各有一个span用于记录RPC调用的客户端和服务端信息。

  通过分布式系统跟踪工作流或事务通常看起来如上所述。虽然这种类型的可视化对于查看各种组件如何组合在一起是有用的但是它不传达任何持续时间不能很好地扩展并且在涉及并行性时是麻烦的。另一个限制是无法轻易显示延迟或时序的其他方面。甚至基本跟踪可视化的更有用的方法通常如下所示

  这种展现方式增加显示了执行时间的上下文相关服务间的层次关系进程或者任务的串行或并行调用关系。这样的视图有助于发现系统调用的关键路径。通过关注关键路径的执行过程项目团队可能专注于优化路径中的关键位置最大幅度的提升系统性能。例如可以通过追踪一个资源定位的调用情况明确底层的调用情况发现哪些操作有阻塞的情况。

  一个span代表系统中具有开始时间和执行时长的逻辑运行单元。span之间通过嵌套或者顺序排列建立逻辑因果关系。

  每一个span都有一个操作名称这个名称简单并具有可读性高。例如一个RPC方法的名称一个函数名或者一个大型计算过程中的子任务或阶段。span的操作名应该是一个抽象、通用的标识能够明确的、具有统计意义的名称.

  每个span可以进行多次Logs操作每一次Logs操作都需要一个带时间戳的时间名称以及可选的任意大小的存储结构。

  Baggage拥有强大功能也会有很大的消耗。由于Baggage的全局传输如果包含的数量量太大或者元素太多它将降低系统的吞吐量或增加RPC的延迟。

  度量类主要采用时序数据库的解决方案。它是以事件发生时间以及当前数值的角度来记录的监控信息是可以聚合运算的用于查看一些指标数据和指标趋势。所以这类监控主要不是用来查问题的主要是用来看趋势的。

  时序数据库Time Series Database是用于存储和管理时间序列数据的专业化数据库为时间序列数据提供高性能读写和强计算能力的分布式数据库服务。时序数据库特别适用于物联网设备监控和互联网业务监控场景。

  关系数据库比较适合数据量规模并不是很大读多写少对吞吐性读写延迟不是很高一致性要求高的场景。

  时序数据库适合巨量数据规模读少写多读写延迟低数据一致性要求不高即便丢失数据也不影响业务的场景。

  这类数据描述了某个被测量的主体在一个时间范围内的每个时间点上的测量值 。

  时序数据是以某个固定频率采样而产生的不会受其他因素制约。

  整个数据的规模是TB甚至是PB级的 历史数据分析价值有限通常有保存周期时效性强。

  时序数据库的一些基本概念不同的时序数据库称呼略有不同。

  field: 度量下的不同字段。比如位置这个度量具有经度和纬度两个field。一般情况下存放的是会随着时间戳的变化而变化的数据。

  时序数据库的存储原理关系型数据库存储采用的是 B tree虽然降低了数据查询的磁盘寻道时间但是无法解决大量数据写入时的磁盘效率。

  某一层的数据文件总量超过阈值就在这一层中选择一个文件和下一层的文件进行合并。

  如此这般上层的数据都是较新的数据查询可以从上层开始查找依次往下并且这些数据都是按照时间序列存放的。

  一般我们将监控系统分为五层来考虑仅供参考

  接下来我们来看看有哪些优秀实践。这里介绍几个比较流行的监控系统

  Open-Falcon是小米开源的企业级监控工具用Go语言开发而成包括小米、滴滴、美团等在内的互联网公司都在使用它是一款灵活、可扩展并且高性能的监控方案。

  4Graph是基于RRD的数据上报、归档、存储组件。Graph在收到数据以后会以rrdtool的数据归档方式来存储同时提供RPC方式的监控查询接口。

  5Judge告警模块Transfer转发到Judge的数据会触发用户设定的告警规则如果满足则会触发邮件、微信或者回调接口。这里为了避免重复告警引入了Redis暂存告警从而完成告警的合并和抑制。

  6Dashboard是面向用户的监控数据查询和告警配置界面。

  **监控目标存储**Prometheus Server 本身就是一个时序数据库将采集到的监控数据按照时间序列存储在本地磁盘中。

  如果监控数据达到告警阈值Prometheus Server会通过HTTP将告警发送到告警模块alertmanger通过告警的抑制后触发邮件或者webhook。Prometheus支持PromQL提供多维度数据模型和灵活的查询通过监控指标关联多个tag的方式将监控数据进行任意维度的组合以及聚合。

  一、 应用背景 随着制造业竞争压力的日益增加数字化工厂概念被提出并不断完善。为了提高产品质量、满足用户对产品日益灵活的需求、提高自身核心竞争力从而占领更大的市场份额越来越多企业开始选择建设数字化工厂进行精益化生产与管理。通…

  由于业务的多样性这些平台和系统也变得异常的复杂。如何对其进行监控和维护是我们 IT 人需要面对的重要问题。就在这样一个纷繁复杂地环境下监控系统粉墨登场了。 今天我们会对 IT 监控系统进行介绍包括其功能分类…

  经济高速发展的今天我们处于信息大爆炸的时代。随着经济发展信息借助互联网的力量在全球自由地流动于是就催生了各种各样的服务平台和软件系统。 由于业务的多样性这些平台和系统也变得异常的复杂。如何对其进行监控和维护是…

  文章目录 第十七章 文件1. 文件和目录路径1.1 选取路径部分片段1.2 路径分析1.3 Paths的增减修改 2. 目录3. 文件系统4. 路径监听5. 文件查找6. 文件读写7. 本章小结 第十七章 文件 在丑陋的 Java I/O 编程方式诞生多年以后Java终于简化了文件读写的基本操作。 在 …

  大家好我是爱吃里脊下面由我来讨论下监控的想法。提到监控对于维护系统至关重要对发现问题解决问题起着决定性的作用。 我们来先来进行整体拆解一个监控系统包含三个主体数据采集&…

  Docker进阶-容器监控cAdvisorInfluxDBGranfana 概述 前面文章介绍使用docker compose组合应用并利用scale快速对容器进行扩容。 由于docker compose启动的服务都在同一台宿主机上对于一个宿主机上运行多个容器应用时容器的运行情况如CP…

  一个稳定可靠的系统离不开监控我们不仅监控服务是否存活还要监控系统的运行状况。运行状况主要是对这些组件的核心metrics采集、抓取、分析和报警。 一、监控的数据 监控的日志数据一般包括 v APP、PC、Web 等系统运行Log采用…

  前言 最近准备做一个监控系统正好看到了这篇文章这篇文章很简单但很清晰结合原文的图片我进行一下翻译。 原文地址 ByteByteGo 原文 A well-designed metric monitoring and alerting system plays a key rol…

用户注册
平台登录
平台主管
门徒注册地址
返回顶部