GSE agent 状态异常定位

节点管理app或 Job 显示 agent 状态异常:

  1. 检查对应 ip 机器上的 gse_agent 进程是否正常 ps -ef |grep gse_agent
  2. 检查 gse_agent 的 48533 连接是否正常
  3. 检查 gse_agent 与 gse server 的证书是否匹配
  4. 检查该ip在CC上的业务及云区域id是否正确
  5. 检查 gse_api 日志,查看启动时是否有“UPDATE_REDIS_FAILED”信息,若有则重启gse_api

直连的agent

  • 查看agent机器上的 gse_agent 进程是否成对出现

* 查看是否和gse_task的48533端口建立链接:`netstat -antp | grep :48533`

```bash
[root@nginx-1 ~]# netstat -antp |grep :48533
tcp        0      0 10.0.1.2:35544          10.0.1.226:48533        ESTABLISHED 26714/./gse_agent
  • 登陆到第一步显示链接的gse_task的IP(10.0.1.226),继续查看链接:netstat -antp | grep :48533 | grep 10.0.1.2 确认gse_task上看到的ip和agent的ip一致。若不一致,可能agent->gse_task时发生了NAT转换

Proxy下的agent

  • 查看agent是否和proxy(gse_agent)的48533建立链接:netstat -antp | grep :48533
  • 和直连agent的排查同理,到proxy上查看建立链接的ip是否一致。
Copyright © 腾讯蓝鲸 2012-2018 all right reserved,powered by Gitbook最后修订日期: 2019-08-06

results matching ""

    No results matching ""