一切尽在一个平台

监控、事件管理、状态页面和开发者工具 — 无需配置集成,无需额外付费。

监控

HTTP/HTTPS 监控

从多个全球位置检查端点,支持自定义请求头、认证、状态码断言和可配置的失败阈值。

Web 检测器 — 页面加载

真实 Chromium 加载您的页面,每次检查间隔捕获 Web Vitals(TTFB、FCP、LCP、CLS)、HAR 瀑布图、截图和控制台日志。

Web 检测器 — 测试套件

将标准 Playwright .spec.ts 文件作为定时监控运行。通过 oackctl 部署,预装 npm 依赖,生成通过/失败报告和 HTML 报告。

SSL 与域名到期

每日检查 SSL 证书和域名注册到期时间。在到期前 30、14、7 和 1 天发送告警,支持去重。

多位置检查

同时从 20+ 个位置运行检查。可配置的失败模式 — 任一、多数或全部位置失败时告警。

网络诊断

TCP_INFO 指标(RTT、重传、拥塞窗口)、带逐跳地理定位的 traceroute,以及可选的 pcap 捕获用于深度分析。

事件与值班

事件生命周期

声明、调查、识别、监控和解决。严重级别从通知到紧急,支持责任人分配和内部评论。

值班排班

每日、每周和自定义轮换,支持时区和休假替换。从仪表板查看当前值班人员。

升级策略

多级升级,支持可配置超时和双重触发器(未确认 + 持续时间)。主值班和副值班自动呼叫。

事后复盘

结构化模板,配备富文本 Markdown 编辑器。基于探测历史、HAR 文件和部署上下文的 AI 辅助根因分析。

Slack 集成

在 Slack 中声明和管理事件。自动创建频道、升级私信含确认按钮,以及双向时间线同步。

自动创建事件

监控失败通过服务触发器自动创建事件。关联监控、严重级别映射,恢复时自动解决。

状态页面

公开与私有页面

基于 slug 的 oack.io URL 或使用 CNAME 的自定义域名。支持密码保护。自定义品牌,含 Logo、Favicon 和主色调。

组件与分组

将服务组织为组件分组,根据事件历史自动计算可用率。支持拖放排序。

监控触发器

关联监控失败时自动创建和解决状态页面事件。每个触发器可配置严重级别映射。

订阅者通知

邮件订阅者支持双重确认。精细化定向 — 订阅全部组件、特定组件或分组。品牌化邮件通知。

计划维护

规划维护窗口,支持时长预设、自动状态转换,以及维护前后的订阅者通知。

服务

服务目录

将监控分组为逻辑服务。健康状态根据关联监控计算 — 正常、降级、部分故障或重大故障。

依赖关系图

映射服务间的上游和下游依赖关系。可视化图表展示完整的服务拓扑。

影响分析

当服务降级时,查看哪些下游服务可能受到影响。为升级和事件分类提供依据。

外部告警接入

通过兼容 PagerDuty Events API v2 的端点接收外部系统告警。通过 Oack 升级策略进行路由。

分析与诊断

探测详情与瀑布图

深入查看任意检查的完整时序瀑布图、Server-Timing 分解、检测器地理位置、CDN 边缘信息和 traceroute。

延迟百分位

DNS、connect、TLS、wait 和总延迟的 p50、p75、p90、p95、p99 分解,覆盖 24 小时、7 天、30 天和 90 天基线。

可用率与可靠性

可用率百分比、MTBF 和 MTTR,覆盖 7 天、30 天、90 天和 365 天窗口。每个监控的阈值:良好/降级/严重。

Cloudflare 日志丰富

将 Cloudflare 边缘日志导入探测详情。查看缓存状态、边缘 PoP、源站响应时间和安全规则触发。

图表评论

使用时间点或时间范围评论注释图表。@提及支持邮件通知、线程回复和永久链接分享。

事件时间线

告警、事件、部署和评论的统一信息流。PagerDuty 同步、图表位置深度链接和 CI/CD 事件接入。

开发者工具

Terraform Provider

以代码方式管理监控、告警渠道、状态页面、服务和升级策略。完整支持现有资源导入。

CLI (oackctl)

终端中的完整 API 覆盖。部署 Playwright 测试套件、管理监控和团队,支持 device-flow 认证和 JSON 输出。

API 客户端

官方 Go、Python 和 Node.js 客户端,完整 API 覆盖。OpenAPI 3.0 规范,配备 Swagger UI 供探索。

MCP Server

53 个只读工具供 AI 代理使用。Claude、Cursor 和其他 MCP 客户端可以对话式查询监控、指标、事件和状态页面。

多渠道告警

邮件、Slack、Telegram、Discord、PagerDuty、Webhook、推送通知。个人和团队渠道,支持按监控覆盖设置。

探测分享

通过只读链接分享单次探测或时间范围快照。可配置的字段隐藏,保护敏感数据。

从简单开始,逐步扩展

两分钟内免费开始可用性检查。浏览器测试、事件管理、值班和状态页面,准备好了就添加。