[实测解决] Google Antigravity 频繁 500 报错 Agent terminated due to error
这篇是我的一次真实排障记录。前几天我在 Google Antigravity 里连续跑任务时,几乎每隔一段时间就会被打断,界面反复弹这段错误:
Agent terminated due to error
You can prompt the model to try again or start a new conversation if the error persists.
See our troubleshooting guide for more help.
问题描述
我这边最直接的现象有两个:
- Antigravity 任务中途被强制终止,出现
Agent terminated due to error - Debug 面板同时出现
HTTP 500 Internal Server Error
当时抓到的日志大概是这样:
Trajectory ID: xxxxxx
Error: HTTP 500 Internal Server Error
Sherlog:
TraceID: 0x16a4c76252bbbv
{
"error": {
"code": 500,
"message": "Internal error encountered.",
"status": "INTERNAL"
}
}问题分析
我先说结论:这次不是单一因素,至少是“模型侧波动 + 网络出口画像”叠加出来的问题。
1) 从 429 变成 500,不代表网络已经完全没问题
我先前用普通共享出口时,最常见是 429。切到 SkyVPN 后,429 基本消失了,但开始频繁出现 500。看起来像“问题换形态”,本质上是请求通过率提高了,但模型端或链路端仍不稳定。
2) Gemini 模型更容易复现
我这几天重复测下来,Gemini 相关任务更容易触发 INTERNAL 500。同样的流程切到其他模型,报错频次会明显低一些。所以这部分我判断和模型服务端状态有关系,短期内只能规避,不能彻底根治。
3) 出口 IP 画像会放大报错体感
同样是“能连上”,不同出口质量下体验差异很大。共享数据中心 IP 更容易把短时波动放大成连续失败,而更干净、接近真实家庭宽带的住宅出口,通常能把失败频率压下来。
解决方案
我最后用的是“可恢复优先”的方案,不追求一次性根治,而是先把工作流稳定住。
第一步:接受一个现实
Gemini 出现 INTERNAL 500 时,很多场景是服务端问题,客户端没有万能修复按钮。与其在本地反复折腾,不如把精力放在降低触发频率。
第二步:固定使用 SkyVPN 的美国家宽 IP
我把出口固定在 SkyVPN 的美国住宅线路后,体感改善最明显:
- 任务被中断的频率下降
- 同样提示词下,连续执行成功率更高
- 长任务里反复重试的次数减少
我主要看重的就是这几个点:独享住宅 IP、IP 画像更干净、接近真实家庭宽带、可以按需切换并固定出口。对于这类依赖风控判定的 AI 平台,这些特性能明显降低“误伤率”。
第三步:流程上做降风险
我现在会同时做三件事:
- 关键任务前先固定同一出口,不来回切地区
- Gemini 连续报 500 时先切短任务,避免长链路硬顶
- 出现连续
INTERNAL 500时暂停几分钟再试,而不是无脑连点重试
总结经验
这次排障给我的经验很直接:
- Antigravity 的 500 报错,不一定是你本地配置坏了
- Gemini 相关链路短期确实可能更容易抖动
- 网络层做对了,至少能把“频繁崩”变成“偶发可控”
如果你也在搜这类问题,可以先按我的路径走:先把出口质量和稳定性收敛,再谈模型策略。我的实测结果是,SkyVPN 的美国家宽 IP 不能保证 100% 零报错,但确实能把工作中断频率降到可接受范围。