借助健康状况和问题排查 页面,您可以查看服务和应用的健康状况。
- 查看根据您在 Cloud Monitoring 中设置的提醒政策而显示的未结提醒。当提醒政策的条件得到满足时,Monitoring 会将未结提醒称为“突发事件” 。
- 查看活跃 Google Cloud 突发事件。这些突发事件是针对 Google Cloud 服务中断或降级的情况。
- 查看有关资源健康状况和性能的 Google Cloud 指标,例如利用率、延迟时间或错误。
您可以在 App Hub 应用中查看项目和 受支持的基础架构的健康状况数据。
- 在项目视图中,您可以查看所选项目中活跃 Google Cloud 产品的健康状况数据。
- 在应用视图中,您可以查看所选应用中服务和工作负载的健康状况数据。
您还可以使用 Gemini Cloud Assist 调查 来帮助您排查问题。
准备工作
如需查看 App Hub 应用的数据,请确保完成以下步骤:
为文件夹设置 App Hub 并创建您的 应用。
如需使用调查,请设置 Gemini Cloud Assist。
所需角色
如需获得查看应用和资源健康数据所需的权限,请让管理员向您授予项目(项目视图)或文件夹的管理项目(应用视图)的以下 IAM 角色:
-
查看应用和项目数据:
Cloud Hub Operator (
roles/cloudhub.operator) -
创建和查看调查:
Investigations Creator (
roles/geminicloudassist.investigationCreator)
如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限。
您也可以通过自定义 角色或其他预定义 角色来获取所需的权限。
如果您想根据分析结果进行更改,可能需要其他权限,或者需要与组织中具有所需权限的成员协调。例如,更改 GKE 集群的配置需要相应的 GKE 权限。
查看健康状况和问题排查信息
在 Google Cloud 控制台中,前往健康状况和问题排查页面,
选择要 查看的项目或应用:
如需查看应用的数据,请选择配置为用于应用管理的文件夹。配置为用于应用管理的文件夹 具有特殊图标 (
)。文件夹的管理 项目也具有特殊图标 (
),并且项目名称采用 格式
FOLDER-NAME-mp。如果您选择管理项目而不是文件夹,项目选择器会自动将选择更改为文件夹。如需查看单个项目的数据,请选择包含要查看的资源的项目。
从时间范围选择器中,选择要查看的时间范围。默认情况下,该 页面会显示提醒、 Google Cloud 突发事件和健康状况数据,时间范围为 过去一小时。
该页面会显示所选时间范围内的以下信息:
- 未结提醒:显示所选项目中的提醒 政策或与所选应用关联的提醒政策的未结提醒总数。 如需在 Monitoring 中查看提醒,请点击查看提醒 。 如需详细了解如何查看提醒(Monitoring 将其称为 突发事件),请参阅 基于指标的提醒政策的突发事件。
- Google Cloud 突发事件:显示所选项目或应用的 Google Cloud 突发事件总数。如需在 Personalized Service Health 中查看突发事件,请点击查看突发事件 。 详细了解如何在 Service Health 中查看突发事件。
- Google Cloud 产品 (项目视图):显示所选项目中每个活跃 Google Cloud 产品的未结提醒和 Service Health 事件(包括突发事件)。产品列表下方会显示包含所选产品关键健康状况数据的图表。
- 服务和工作负载(应用视图):显示应用中每个活跃 服务或工作负载的未结提醒和 Google Cloud Service Health 事件(包括突发事件)。服务和工作负载列表下方会显示包含所选服务或工作负载关键健康状况数据的图表。
如需查看列出的产品、服务或工作负载的详细信息,请点击列表中的相应名称。您可以使用以下选项来帮助您了解发生的事件或排查问题。
查看所选产品、服务或工作负载的图表。 每个图表都会显示所选时间段内的健康状况指标。
- Cloud Monitoring 提醒事件。
- Service Health 事件
- 特定于产品的事件
默认情况下,图表会显示推荐事件,但您可以使用页面顶部的**注解** 选择器选择要查看的 事件。如需详细了解如何在图表上显示和隐藏事件,请参阅 在信息中心内显示事件。
您可以像与其他 Monitoring 图表互动一样与这些图表互动。 了解如何探索图表数据。
如需查看产品、服务或工作负载的未结提醒,请点击提醒 列中的链接。
如需查看产品、服务、 或工作负载的相关突发事件,请点击Google Cloud **突发事件** 列中的链接。 Google Cloud
如需在项目视图中查看产品的其他详细信息,请点击查看详情 。每个产品都提供额外的可观测性数据、日志和其他信息,以帮助您诊断和排查问题。
如需在 Monitoring 中打开应用工作负载或服务的详细信息,请点击查看信息中心 。应用监控 页面会显示工作负载或服务的信息中心。
使用 Gemini Cloud Assist 进行问题排查
Gemini Cloud Assist 调查功能可用于排查 基础设施和应用问题,进行 Google Cloud 根本原因分析。调查可以帮助您更快地诊断和解决问题。
在 Cloud Hub 中,您可以查看最近的调查或打开新的调查。
如需创建或查看调查,请执行以下操作:
在 Google Cloud 控制台中,前往健康状况和问题排查页面,
选择要 查看的项目或应用:
如需查看应用的数据,请选择配置为用于应用管理的文件夹。配置为用于应用管理的文件夹 具有特殊图标 (
)。文件夹的管理 项目也具有特殊图标 (
),并且项目名称采用 格式
FOLDER-NAME-mp。如果您选择管理项目而不是文件夹,项目选择器会自动将选择更改为文件夹。如需查看单个项目的数据,请选择包含要查看的资源的项目。
最近的 Cloud Assist 调查 部分会显示您创建的或有权查看的最近调查。
后续步骤
- 详细了解 Monitoring 提醒。
- 详细了解 Service Health 和 Google Cloud 突发事件。
- 了解 Monitoring 信息中心。
- 了解 Gemini Cloud Assist 调查。