区域性停电每天都会发生

您在东京的网站已关闭。
您的监控工具显示一切正常。

传统网站正常运行时间监控从 3-5 个位置进行检查。这还不够。 当亚洲的 DNS 失败、欧洲的 CDN 配置错误或南美的 ISP 丢包时 - 您会从愤怒的客户而不是仪表板中发现。

有一种更好的方法来运行正常运行时间监控服务。

你不想发现的场景

现在是星期一早上。你检查你的监控仪表板——全是绿色的。正常运行时间:99.99%。生活是美好的。

然后你打开收件箱。三张来自新加坡的支持票。两个来自孟买。法兰克福的一位潜在企业客户发来一条沮丧的消息:“您的网站在过去 6 小时内无法访问。”

您的监控工具从未向您发出警报,因为它从弗吉尼亚州和俄勒冈州进行检查。它不知道世界其他地方无法联系到您。

这不是假设。 SaaS 公司、电子商务商店和在线服务每天都会发生这种情况。不覆盖全球的网站可用性监控是有盲点的监控。

为什么您的网站对您有用但对其他人却失败

互联网不是一个网络。它是由数千个网络缝合在一起的——任何接缝都可能撕裂。

DNS解析失败

您的域名可从 Cloudflare 的美国服务器正确解析。但东南亚的区域 DNS 解析器缓存了陈旧的记录,或者您的 DNS 提供商在该区域的任播节点遇到了问题。用户获得 NXDOMAIN。您的监控显示绿色。

BGP 和路由问题

上游提供商宣布一条错误路线。来自南美洲的流量在到达您位于美国的服务器之前会绕道亚洲 200 毫秒。或者更糟糕的是——数据包完全陷入黑洞。你的服务器没问题。通往它的道路不是。

CDN边缘节点故障

您的 CDN 提供来自 200 多个边缘站点的内容。法兰克福的一个节点开始返回 503 错误。悉尼的另一家公司的证书不匹配。 CDN 的状态页面显示“所有系统均可运行”。这些地区的用户不同意。

区域 ISP 限制

印度的一家主要 ISP 对某些 IP 范围的流量进行速率限制。 Jio 用户的加载时间为 10 秒,而 Airtel 用户的加载时间为 800 毫秒。如果不从这些网络内部进行监控,您将永远无法关联该模式。

共同点:所有这些都是特定于位置的问题。它们不会影响您的原始服务器。它们不会出现在您的 APM 中。它们仅针对特定地理区域的用户出现,并且只有对这些区域进行适当的网站正常运行时间监控才能捕获它们。

为什么大多数正常运行时间监控服务都会忽略这些问题

并不是其他工具坏了。他们只是在解决不同的问题。

监控地点有限

大多数网站可用性监控工具会从 3-10 个地点进行检查,主要集中在美国和西欧。如果您的用户位于亚洲、非洲、南美洲或大洋洲,那么您在运营时无法了解他们的体验。

来自云数据中心的综合检查

从 AWS 或 GCP 区域进行检查与从真实 ISP 网络进行检查不同。云到云的连接通常比真实用户的体验更好。监控看起来很棒;用户体验不匹配。

无诊断深度

基本的正常运行时间检查会告诉您“下降”或“上升”。他们不会告诉你原因。是 DNS 吗?路由问题? SSL协商失败? TLS 握手超时?如果没有跟踪路由、MTR 和延迟细分,您就是在盲目调试。

走向全球成本高昂

具有适当全球覆盖范围的企业监控成本为 200-500 美元/月。对于用户分布在多个地区的 SaaS 或电子商务商店来说,这是不可行的。因此,团队会向更便宜的工具妥协,并希望得到最好的结果。

监控差距

典型的正常运行时间监控位置 3–10
拥有大量互联网用户的国家 100+
独特的 ISP/路由路径 数千
您实际拥有的可见度 < 5%

当您从 5 个位置进行监控时,您只能看到 5% 的图片。另外 95% 是您的客户居住的地方,也是隐藏问题的地方。

当您忽略区域中断时会发生什么

成本是真实的,即使它们不是立即可见的。

无声的用户流失

无法加载您网站的用户不会提交支持票证。他们关闭选项卡并前往其他地方。持续 2 小时的区域性中断可能会导致数百名潜在客户永远不再返回,而且您不会在任何分析中看到他们,因为他们从未加载您的跟踪脚本。

转换失败

结账页面超时。从未提交的注册表单。 API 调用无提示地失败。每个区域的可用性问题都会直接影响收入。如果您的网站可用性监控没有发现问题,您就无法量化您所损失的内容。

SEO降级

Google 从多个区域抓取。如果 Googlebot 无法从某些位置访问您的网站,您的网页就会取消索引。核心网络生命力在高延迟区域会下降。排名下降。自然流量减少。当您注意到时,您已经失去了几个月的 SEO 动力。

复合效应

数周未被发现的地区问题变得常态化。团队将其归咎于某些地区的“不稳定的互联网”。支持票被驳回。慢慢地,你的产品在特定市场上就会被认为不可靠——而且这种声誉很难扭转。

解决方案

如何正确检测区域可用性问题

有效的网站正常运行时间监控需要覆盖范围、深度和历史背景。

1

从全球 50 多个地点进行监控

覆盖各大地区:北美洲、南美洲、欧洲、亚洲、非洲、大洋洲。包括用户实际所在国家/地区的位置,而不仅仅是一级数据中心区域。

更多位置 = 更少盲点。就是这么简单。

2

使用跟踪路由和延迟细分

当某件事失败时,您需要知道失败的路径何处。是DNS解析吗? TCP握手? TLS 协商?到达第一个字节的时间? Traceroute 和 MTR 可以准确显示问题所在的跃点。

诊断时间:几分钟而不是几小时。

3

与历史基线进行比较

新加坡的 300 毫秒响应时间是正常还是退化?只有有历史数据你才知道。趋势分析揭示了时间点检查完全忽略的缓慢退化。

在问题变得中断之前发现问题。

全面的网站正常运行时间监控包括哪些内容

HTTP/HTTPS 状态代码
DNS解析时间
TCP 连接延迟
TLS 握手时序
SSL 证书验证
内容关键词验证
整页加载时间
Traceroute 和 MTR 诊断

实用清单:设置适当的网站正常运行时间监控

无论您使用我们的服务还是其他服务,这些都是基本原则。

1

绘制您的用户地理位置

使用您的分析来确定您的用户来自哪里。如果 15% 的流量来自印度,那么您需要从印度进行监控,而不仅仅是“亚洲”。

2

选择至少 50 多个位置的正常运行时间监控服务

更少的位置意味着更多的盲点。确保覆盖非洲、南美、东南亚和东欧——而不仅仅是美国/欧盟。

3

设置关键路径监控

不要只监控您的主页。监控注册、结账、API 端点以及任何直接影响收入或用户体验的页面。

4

启用诊断工具

Traceroute、MTR 和 DNS 监控应与 HTTP 检查一起运行。当某些东西损坏时,您需要知道原因 - 而不仅仅是它坏了。

5

配置区域异常警报

当特定区域的延迟高于基准或可用性低于基准时,即使全球正常运行时间看起来不错,也会收到通知。

6

每周回顾——不要设定然后忘记

每周花 10 分钟回顾区域绩效趋势。缓慢的退化在实时中是不可见的,但在历史图表中是明显的。

7

与您的事件响应集成

监控只有在触发操作时才有用。将警报连接到 Slack、PagerDuty 或 Webhook,以便相关人员立即了解。

一个例子

Latency Global 如何解决这个问题

我们专门构建 Latency Global 来解决全局可见性问题。我们的监控运行于跨越六大洲的 70 多个真实位置——不仅仅是云区域,而是反映真实用户体验的实际网络优势点。

每次检查都包括完整的延迟细分:DNS、TCP、TLS、TTFB。您可以按需获取路由跟踪和 MTR。历史数据保留可让您与基线进行比较。而且费用是每月 5 美元——而不是 200 美元。

70 多个全球监控位置(很快将有 40 个)
60 秒检查间隔
HTTP、Ping、DNS、端口、SSL、Traceroute、MTR 监控
通过电子邮件、Slack、网络钩子即时警报
完整的 API 访问权限以实现自动化
开始于
5 美元
每月
包括 5 台显示器
所有 70 多个地点(很快将有 40 个)
所有监控类型
30 天数据保留
没有合同,随时取消

7 天免费试用 · 试用结束前不收取任何费用 · 随时取消。

常见问题

这与 Pingdom、UptimeRobot 或 StatusCake 有什么不同?

这些服务通常在 5 到 15 个地点进行监控,其中大部分位于美国和西欧。 Latency Global 从各大洲的 70 多个地点进行监控,包括经常被忽视的地区:南美洲、非洲、东南亚、东欧和大洋洲。如果您在这些地区有用户,您将发现其他工具遗漏的问题。

为什么有 70 多个地点?这不是太过分了吗?

如果您拥有全球用户,则不然。一个站点可以从 10 个位置完美访问,从 11 个位置开始完全中断。区域 DNS 问题、CDN 错误配置和路由问题均因位置而异。更多的覆盖范围意味着更少的盲点。

你们支持什么类型的监控?

HTTP/HTTPS 正常运行时间、Ping、DNS 解析、端口监控、SSL 证书到期、关键字验证、Traceroute 和 MTR。每种类型都可以让您以不同的方式了解基础设施的运行状况。

警报的速度有多快?

检测到故障后几秒钟内就会触发警报。如果检查间隔为 60 秒,您最多将在 1-2 分钟内了解问题。警报将发送至电子邮件、Slack 或 Webhooks——您可以选择。

你们提供免费试用吗?

是的!每个新帐户均可享受 7 天的免费试用,并具有完全访问权限。只需输入您的卡即可开始 - 在试用期结束之前不会向您收费。在做出决定之前,设置您的监视器、浏览仪表板并查看您的网站在全球范围内的表现。试用后计划起价为 5 美元/月。试用期间随时取消。

有API吗?

是的。完整的 REST API,在入门计划中每天最多可处理 10,000 个请求。创建监视器、获取结果、管理警报——所有这些都以编程方式进行。 API 文档可在您的仪表板中找到。

2 分钟内开始全局监控

添加您的第一个网址。选择您的位置。在世界各地的用户告诉您出现问题之前,真正了解您的网站的表现。

开始免费试用

7 天免费试用 · 试用结束前不收取任何费用

5 美元/月 • 无合同 • 随时取消