Published on 2026年1月9日

2025 AI 大模型排行榜ChatGPT Atlas 浏览器自动化Perplexity Comet 网页代理GPT-5 Codex 编程助手Claude 4.5 Opus 代码生成Gemini 3 Pro 前端开发Cursor AI IDE 评测Antigravity IDE 多模型Nano Banana Pro 图片生成Google Veo 3.1 视频生成AI 模型选型指南住宅 IP 降低风控SkyVPN AI 使用稳定

2025 年度 AI 大模型最强榜单排位赛出炉

引言：迷茫于模型之海

2025 年，各种 AI 大模型你方唱罢我登场，几乎每隔几周就冒出一个"屠榜"的新模型。作为深度用户，我一开始也是眼花缭乱——到底哪家强？自媒体博主们轮番吹捧，每个新模型都号称"世界第一"。我也曾心动去跟风，可真等自己上手，却又发现模型开始"降智"或者并不适合我的场景。

这让我意识到：脱离具体使用场景去空谈模型性能是没有意义的。

AI 用户其实很现实，谁强用谁。比如过去一年全球 AI 流量份额中 ChatGPT 从 86% 跌到了 65%，而 Google 的 Gemini 从 5.7% 暴涨到 21.5%。我决定静下心来，亲自按使用场景把市面上的大模型产品逐一体验一番，挑出各领域的年度最强榜单。

接下来我就以第一人称视角，分享我在浏览器自动化、编程助手、内容创作搜索、AI 编程 IDE、图像生成和视频生成这几个领域踩过的坑和找到的宝，并聊聊我是如何解决过程中遇到的问题的。

浏览器自动化：ChatGPT Atlas vs. Perplexity Comet

问题场景

我常需要让 AI 代理在网页上执行操作，比如抓取信息、点击按钮，甚至填写表单。有些网页还布下 Cloudflare 的"五秒盾"或者验证码，专治机器行为。我希望找到一款聪明的浏览器 AI 助手，能够替我自动化操作网页且尽可能不被当作机器人拦下。

体验过程

最初我尝试了 ChatGPT Atlas。这款工具据说采用了视觉智能来控制浏览器，相当于给 ChatGPT 安上了眼睛和手。实际用下来我很惊讶：Atlas 真的能"看到"网页上的内容，连复杂的图片验证码也识别得了，甚至会自己输入通过！有一次碰到 Cloudflare 的挑战页面，它居然也成功模拟人类操作通过了验证。这在以前是不可想象的。Atlas 的操作准确率也挺高，自动点击、表单填写基本没出错。

不过好景不长，Atlas 对用户行为的风控非常严格。我兴冲冲地让它自动下单几次商品，结果做到第三次时就触发了风控——Atlas 突然停下不干了，提示我可能进行了一些敏感操作，需要稍后再试。这让我有点扫兴，毕竟正干到一半被掐了。后来我才了解到，Atlas 出于安全考虑，对连续自动化操作次数做了限制，一旦频繁执行脚本就会暂时锁定。

我只好换个思路，改去尝试 Perplexity Comet。

Comet 是 Perplexity 公司推出的网页自动化助手，它走的是另一个路线——基于网页 DOM 元素来操作，相当于"看不见"页面视觉，只能通过网页的代码结构来点击和读取。上手后发现 Comet 确实没法识别验证码，碰到 Cloudflare 验证也直接卡关（毕竟它看不到图片和复杂交互，只能干瞪眼）。这一点 Atlas 完胜。

好在 Comet 对用户操作的限制相对宽松一点，我连续折腾它跑了十来次脚本也没见它跳警告。不过 Comet 的问题在于免费额度太低，跑几下就提示我用完免费自动化次数了，再想用得氪金升级套餐。

总之，两款工具各有千秋：Atlas 能力强但管得严，Comet 没那么智能但给的绳子长一点。

对比总结

产品	出品方	亮点	缺点	上榜理由
ChatGPT Atlas	第三方（借助 OpenAI 多模态）	视觉驱动，能识别验证码、突破 Cloudflare	风控严格，敏感操作易被暂停	视觉能力独树一帜
Perplexity Comet	Perplexity	运行稳定，风控宽松	无法识别验证码，免费额度低	适合简单网页自动化

踩坑补充：在探索浏览器 AI 助手时，我也发现有时候并非 AI 能力不行，而是我们的网络环境拖了后腿。例如使用公共 VPN 或数据中心 IP 访问，有些网页更容易触发 Cloudflare 人机验证，导致 Atlas/Comet 还没开始工作就被拦下。我后来听取圈内朋友建议，换用了 SkyVPN 提供的独享住宅 IP。这相当于让我每次都从一个干净的家庭宽带网络出发，减少了被网站当机器人的概率。实际体验下来，果然 Cloudflare 挑战大幅减少，Atlas 也更少误触发风控了。

编程助手：Codex、Claude Code 与众模型争锋

问题场景

写代码可以说是 AI 最火的应用领域之一，各种 Code AI 如雨后春笋。我经常需要 AI 帮忙写复杂模块、定位棘手 Bug，甚至希望它自动完成整个功能。我想评测一下当下主流的编程助手，看看谁才是 2025 年的代码之王。

体验过程

起初我最信赖的还是 OpenAI 系的 Codex。在我常用的 IDE 里开启 Codex 的"GPT-5.2-codex-high"模式，它的表现几乎无可挑剔：有几个团队里谁也解决不了的疑难 Bug，Codex 一出手就给出了修复方案，着实让我叹服它的代码理解力和创造力。这也印证了我之前的看法：复杂项目、深层 Bug 的解决，OpenAI 系依然技高一筹。

不过 Codex 有个致命缺点：**速度非常慢！**让它改一小段代码，我都能跑去刷一集《凡人修仙传》了回来它还在"思考"。有一次只是改个函数名这种小事，它卡在那里半天没响应，把我急得不行。因此，我后来在很多小改动上不敢再用 Codex，实在等不起。

为了提升效率，我转向 Anthropic 家的 Claude 模型，具体来说是在一个叫 Claude Code 的编程平台上使用 Claude 4.5 Opus 版本。Claude Opus 4.5 给我的第一印象是速度飞快。同样的任务，它刷刷几秒就出结果了，让我这个性急的人感觉舒服多了。而且它的代码质量也很不错，基本仅次于 Codex 那档次。Claude Code 平台本身也很好用，我用的是它集成的 IDE，直接写代码、提问、一气呵成。

在这个平台上 Claude 提供了两个版本：Opus 和 Sonnet。我也试了试 Claude 4.5 Sonnet，说实话有点鸡肋：能力不如 Opus，代码问题解决率感觉逊色前三甲，而且如果通过 API 调用的话，收费还挺贵。不划算！后来我干脆放弃了 Sonnet，要用 Claude 我就只用 Opus 4.5。Anthropic 官方有按月的订阅方案，比用 API 经济，我就一直续着，实现相对无限制地用 Claude Opus 写码。

接下来不得不提 Google 的 Gemini。Google 在 2025 年放出多模态大招 Gemini，我赶紧上车试用了 Gemini 3 Pro 模型的编程能力。这家伙在前端开发方面简直无敌！我那些让人头秃的前端布局、样式、小交互，全都交给 Gemini 3 Pro 去写，拿到的代码不仅功能对路，审美还在线——页面效果挺符合我的期望，看来 Google 在训练时估计融入了不少 UI/UX 知识。

更爽的是，Gemini 3 Pro 不仅会写代码，你跟它闲聊对话也没问题，而且它还能无缝连接 Google 自家的各种服务生态。比如我写代码过程中，它可以直接调用谷歌搜索帮我找资料，还能访问 Google Drive 读取我项目的文档，这种和生态联动的体验太方便了。

Google 可真大方，我听说用 .edu 教育邮箱申请它的 AI 服务，可以免费用 Gemini Pro 整整一年——这对开发者来说简直是天降福利，要知道要是用 OpenAI 的 API 跑这么大模型，单实体识别一轮就得烧掉上万美元了。我身边很多同好现在都把 Gemini 当日常主力，一是能力强，二来大模型调用不再肉疼钱包。

除了这些大厂模型，我也没忘记观察一下平价替代品。一个让我有点惊喜的是国产开源阵营的 GLM 4.7。某次我在 Claude Code 的平台上发现支持调用 GLM 4.7，好奇试了试。GLM 4.7 写一般业务代码还行，至少逻辑没啥硬伤。最夸张的是它便宜到离谱：我算了下，一个月订阅费用不到 ¥20 人民币，而且还基本用不完给的配额！这价格恐怕一杯奶茶钱吧…所以 GLM 我后来就留着当个备用选手，用它来处理一些简单的小需求，既能完成任务又省调用大模型的钱。

最后说个踩坑货：我一度尝试过社区吹得挺响的一个开源项目 OpenCode。它号称完全开源，还提供类似 Copilot 的自动补全。我满怀期待地想迁移过去，用它替代一些闭源服务。结果发现 OpenCode 只和 Zed 编辑器集成得不错，对 VS Code 这类主流编辑器非常不友好。我平时主力用 VS Code，装上 OpenCode 插件体验极差，代码补全时灵时不灵，很多语言还不支持，高亮也出问题。调试了好久也没解决，整个过程非常糟心。最后我只好放弃了 OpenCode，心想难怪它没能上榜——工具再自由开源，不能好好用也是白搭。

对比总结

排名	产品	出品方	亮点	缺点	上榜理由
🥇	GPT-5.2 Codex	OpenAI	代码能力最强，疑难 Bug 克星	生成速度堪忧	终极代码质量
🥈	Claude 4.5 Opus	Anthropic	能力强且响应快	订阅才划算	高效全能代码助手
🥉	Gemini 3 Pro	Google	前端开发突出，生态联动	-	前端利器，多模态全能
-	Claude 4.5 Sonnet	Anthropic	-	能力平庸，API 贵	❌ 未上榜
备选	GLM 4.7	清华开源	便宜到离谱（月费不到 ¥20）	能力中规中矩	平价好用的国产后备军

顺带感慨一句：网络上琳琅满目的 AI 排行榜真不敢全信。我踩过的坑告诉我，不要迷信所谓权威排名，也别完全听信自媒体的一面之词。毕竟很多"KOL"吹的新模型是不是货真价实，还得自己试了才知道。有的新模型标榜世界第一，可能拿了厂商的钱在忽悠；还有的确实一时风头无两，却难免后继无力甚至逐渐降智。现在我更倾向于按需选择：哪个模型更适合某类任务，就用它；不追最新噱头，追求稳定可靠。

创作与搜索：ChatGPT 与 Perplexity 双雄

问题场景

除了专业任务，我也经常需要 AI 写写文章、整理资料，或者在脑洞大开时回答各类稀奇古怪的问题。这类创作与信息搜索场景，以前基本是 ChatGPT 一家独大，不过如今也出现了一些强力辅助，比如 Perplexity 这样结合搜索引擎的工具。

体验过程

对于长篇内容创作和富有创造力的任务，我还是最常用 ChatGPT。OpenAI 的 ChatGPT 在 2025 年依然宝刀不老，我使用的是最新的 GPT-4.5（大家戏称 GPT-5）版本，写出来的文章流畅度、创意和语言风格都无可挑剔。像这篇博文的大纲，我其实就是先和 ChatGPT 脑暴，让它给了我一些思路 😁。ChatGPT 就像个才华横溢的写手，不管是写代码解释、营销文案还是文学风格模仿，它都能游刃有余。因此在创作领域，我依然把 ChatGPT 列为 No.1 的生产力工具。

不过 ChatGPT 有个弱点：知识截止和搜索能力。虽然它有了插件和联网模式，但有时候我懒得切换那些功能，或者需要一个直接能上网搜证据的 AI。

这时候 Perplexity 就派上用场了。Perplexity 是我这两年新宠的 QA 助手，它内置了搜索引擎，提问时会实时检索最新资料并给出引用来源的答案。这对付那些需要最新实时信息的问题特别有效。比如近期有个冷门技术细节，我问 ChatGPT 支支吾吾答不准确，换 Perplexity 立刻引用了一篇 2025 年 1 月的论坛帖子，答案又准又新，还有来源链接方便我自行核对。

从体验看，Perplexity 在事实类问答上非常可靠，而且回答简洁有力，不会长篇废话。这和 ChatGPT 形成了互补：一个擅长创意输出，一个擅长精确查证。

对比总结

产品	出品方	定位	上榜理由
ChatGPT	OpenAI	通用对话与创作	全能创作天花板
Perplexity AI	Perplexity	实时搜索问答	知识检索小能手

小 tip 分享：尽量保证你的网络环境稳定可靠。我注意到，像 ChatGPT 这样的服务，有时候如果检测到用户网络环境异常（比如频繁换 IP 或者来自一些"知名"代理 IP 段），可能回答质量都会打折扣。我现在基本全程开着 SkyVPN 的住宅 IP 节点，一方面网速稳定不掉线，另一方面它的 IP 画像干净，不会让 OpenAI 觉得我是在批量刷号或者机器人操作。自打用了干净 IP 后，ChatGPT 很少再抽风"降智"，回答也更顺畅。

AI 编程 IDE：多模型集成的新体验

问题场景

有了强大的编程模型，还需要趁手的工具来发挥它们。我尝试过几款专为 AI 编程打造的 IDE，它们通常集成多种大模型，让开发者可以在一个环境里随心切换使用。今年让我印象最深的有三款：Cursor、Antigravity 和 Windsurf。

体验过程

Cursor

这款 IDE 可以说是 AI 编程圈的明星产品了。Cursor 支持集成多个模型，无论是 OpenAI 的 GPT 系还是 Anthropic 的 Claude 系，甚至一些开源模型都能加进去，根据任务需要调用不同引擎。更棒的是它的界面和功能设计非常贴近开发者习惯。

我用 Cursor 写代码时，感觉就像在用进阶版的 VS Code：该有的代码补全、错误检查、即时预览它都有，同时还能随时召唤 AI 帮我写/改代码、解释 bug。Cursor 给我的体验算是目前最优的，难怪很多人评价它是"现象级"的 AI IDE。

我入手的是它的最低付费档，每月 $20 美元，但令人惊喜的是这一档居然还额外赠送价值 $30 美元的调用额度，这相当于抵消了部分费用。整体来看，用 Cursor 写代码省时省心，物有所值。

Antigravity

这个名字很酷，实际产品也很硬核。Antigravity 和 Cursor 有点类似，也是商业 IDE，主打多模型融合。我看到它最大的卖点是集成了 **Google Gemini 3、Claude 的两个版本（Sonnet 和 Opus 4.5）**等等一系列强模型，用户可以灵活选择。

我在 Antigravity 上用 Gemini 3 Pro 跑过一个 NLP 任务，顺利完成；也用 Claude Opus 做过代码生成，体验都很平滑。值得一提的是，Antigravity 对免费用户还挺友好——免费用户每 7 天会自动重置一定额度，也就是说哪怕不花钱，每周也能用固定配额的高级模型服务。这对预算有限的学生开发者很友善。

我后面嫌每周等重置不过瘾，就干脆充了它的会员，每月 $19 美元。会员待遇更爽：每隔 5 小时就重置额度，几乎等于无限用了。我经常白天工作让 AI 写代码，晚上睡觉前 5 小时一到额度又满血复活，第二天接着用，非常爽快。可以说 Antigravity 满足了我高频调用 AI 的需求，是性价比极高的生产力工具。

Windsurf

这款产品是朋友安利给我的，据说在一些极客圈子小有名气。Windsurf 同样是多模型 IDE，理念上跟前两者一致：把各家大模型接入进来提供编码助手。

我只试用了几天，说实话目前感觉它还在成长中。UI 界面有些地方不够直观，某些功能偶尔出小 bug，需要刷新才能继续。这些让我回想起 Cursor 刚推出 beta 时也经历过类似的打磨期。所以我对 Windsurf 的看法是潜力很大但尚未成熟。如果开发团队积极改进，我相信它有机会跻身一线。但就 2025 年这一年的体验来看，我暂时没有把它列入"最佳"名单，只能算是值得关注的后起之秀吧。

对比总结

排名	产品	付费方案	亮点	上榜理由
🥇	Cursor	$20/月 + 赠 $30 额度	体验最佳的多模型 IDE	得心应手的 AI 超级 IDE
🥈	Antigravity	免费每周重置 / $19/月每 5h 重置	性价比超高	重度用户福音
-	Windsurf	-	概念出色	⏳ 尚需打磨，有待改进

题外话：在用这些 IDE 时我还顺带验证了之前提到的网络环境问题。因为 IDE 里调用模型接口也是走网络嘛。我发现在用 Antigravity 切换不同地区的模型时，如果不用点技巧，很容易触发一些 IP 风控限制。后来我干脆一直通过 SkyVPN 连接，选用它接近真实家庭宽带的 IP 节点，像美国、欧洲这些地区随需切换。有了干净固定的出口 IP 后，无论是连接 OpenAI、Anthropic 还是 Google 的服务都稳定了许多，再也没遇到过因 IP 异常被临时封禁的情况。这让我深刻体会到：稳定的网络和 IP 环境，真是 AI 生产力的隐形保障。

图片生成：Nano Banana Pro 崭露头角

问题场景

作为内容创作者，我有时候也需要 AI 帮忙生成配图，比如文章头图、插画等等。此前一直用 Midjourney 和 Stable Diffusion 系为主，但今年 Google 推出的 Gemini 3 多模态模型自带图像生成能力，引入了一个叫 Nano Banana Pro 的图像生成工具。我当然要去试试这款传说中"能写会画"的新秀。

体验过程

Nano Banana Pro 名字挺俏皮，但用起来可不含糊。它本质上是 Gemini 3 Pro 模型在图像生成和编辑方面的一个预览版。我上手以后发现几个让人惊喜的点：

画质超高

Nano Banana Pro 能输出最高 4K 分辨率的图片（据说是 16 百万像素级别），而且细节相当锐利。这对需要高清素材的人来说福音啊，以前很多 AI 图像都是小图放大糊，现在直接一步到位出大图了。

文本融合效果好

过去 AI 画图最头疼的是控制文字内容，比如生成一张带文字的海报几乎不可能，因为模型总是把字搞得奇形怪状。但 Nano Banana Pro 解决了这个难题。我试着让它生成一张带句宣传标语的图片，结果图片上的英文字母清晰可辨，一点也不走样！看来 Google 在多模态联动上下了功夫。

人像和风格

不得不提，Nano Banana Pro 在生成人物肖像上也有突破。我让它试着画一个类似某知名影星脸庞的人物，以前模型总会画出"明星的邪魅二表亲"那种违和感，但这次生成的人脸神似度极高，五官细节再也不像拼贴怪。我心想这下修图师怕是压力更大了。

当然了，目前 Nano Banana Pro 也有一些限制，比如需要使用 Google 云的接口，有次数和 token 限制（生成一张高质量图要消耗不少额度）。另外，虽然它对风格迁移、照片编辑也支持对话式操作，但过于复杂的指令有时还达不到我预期，可能模型还在迭代训练中。

不过总体而言，这款工具已经足够让我惊叹，俨然有成为下一代最强 AI 绘图助手的潜质。我现在不少自媒体朋友也开始上手 Nano Banana Pro 出图，然后再用 PS 润色一下，速度和效果比纯人手设计快多了。

上榜理由

2025 年度图片生成领域我把桂冠颁给 Nano Banana Pro (Gemini-3-Pro Image)：

画质一流水平
多项技术突破（4K 输出、文本融入、人像精准）
为创意工作者带来了全新的生产力提升

其他老牌如 Midjourney、Stable Diffusion 依然各有所长，但论综合实力，这颗"香蕉"无疑是今年最亮眼的。

视频生成：Google Veo 3.1 初试锋芒

问题场景

文字有了，图片有了，如果还能自动生成视频，那创作闭环就完整了。今年我留意到 Google 在多模态上的大动作不止于 Gemini 图像，还有据说内部代号为"Veo"的视频生成模型。我作为短视频爱好者，当然得亲自试水 Google Veo 3.1。

体验过程

说实话，刚听说 AI 视频生成时我还有些将信将疑——毕竟视频生成的难度几何级高于图像。不过当我使用 Veo 3.1 生成了第一个短视频片段后，我真心感受到科技进步的震撼：AI 已经可以根据文字描述生成近乎真实的视频片段了！

我输入的提示词是："一段日出时分海边城市延时摄影视频"，希望看看模型能否理解这种场景。Veo 3.1 大概处理了几分钟，然后提供了一个 20 秒左右的视频片段。虽然谈不上媲美专业摄影机的画质，但视频里的场景和运动惊人地契合：朝阳徐徐从海平面升起，光线照亮高楼，云层和海浪都在缓缓流动。要不是我清楚这是 AI 生成的，真以为是哪位博主拍的延时素材。整个视频没有明显失真或闪烁，衔接也比较自然。

我注意到一些细节，比如浪花的细腻程度还欠缺，远处建筑在特写时有些模糊，但考虑到是 AI 自动生成，这已经很厉害了。

随后我又尝试生成了一个带人物活动的短片，提示词描述了一对情侣在樱花树下散步的场景。这个挑战就明显复杂得多。Veo 3.1 给出的结果可以看到人物轮廓和动作大致对了：两个人牵手走在飘落樱花的小路上。但面部细节和肢体细节还是有些怪异，特写镜头会感觉像动画渲染而非真人。不过场景的光影和氛围倒是拿捏得很好，整个画面的色调和意境让人感觉温馨唯美。

总的来说，Veo 3.1 展现出了前所未有的视频生成能力，但目前更适合风景、动画风格或远景人物，避免过于细节的内容。不过我相信随着模型继续升级，未来生成一段乱真视频或许不是梦。今年这款模型就已经让我刮目相看：我们离人人都是导演的时代又近了一步。

上榜理由

视频生成领域今年只有少数几家在探索，而 Google Veo 3.1 能够成功上榜，凭借的是行业领先的生成效果。作为 Google 多模态家族的新成员，它证明 AI 可以跨入视频创作的新纪元。虽然尚有提升空间，但它已是 2025 年度当之无愧的最强视频大模型。

解决问题：环境优化与多模协同

在深入体验了上述各领域的大模型后，我有一个整体的感悟：**挑对模型很重要，营造良好的使用环境同样关键。**所谓"工欲善其事必先利其器"，这里的"器"不仅指 AI 本身，还包括网络、IP 这些容易被忽视的细节。分享几点我的经验：

1. 按场景选模型

正如前文逐一比较的，没有单一绝对最强的模型，只有更适合某任务的模型。写代码用专精编程的，画图用视觉训练强的，问答找实时搜索的。不要迷信排行榜的一刀切，结合自己的用途去选择，才能事半功倍。

2. 保持稳定清洁的网络/IP

这一点特别针对深度使用 AI 服务的人。我踩过坑：因为一段时间频繁更换网络出口，结果 OpenAI 总弹出让我验证人机，Claude 那边也偶尔拒绝回答。

我后来使用 SkyVPN 的独享住宅 IP 后，这些麻烦基本没有了。同一个固定的住宅宽带 IP，每天高速访问，也不会被判定为异常流量。这个干净 IP 就像给我的 AI 使用环境打了一剂"稳定剂"，降低了 IP 风控和误封的风险。

据说有些 AI 服务如果怀疑你的 IP 有问题，还可能暗中降级你的模型响应（也就是大家戏称的"AI 被降智"），所以我格外小心。幸好有了接近真实家庭网络的 IP，加上 SkyVPN 支持多地区切换，我在需要的时候还能换到其他国家固定出口，既保证了安全又提高了便利。

3. 规避平台风控

比如在短视频平台上传 AI 生成内容时，我也会考虑 IP 因素。很多人不知道，如果你的账号 IP 异常，发短视频可能会被限流（也就是传说中的"影流"）。我曾经用普通代理 IP 发过一次 AI 剪辑视频，结果播放量惨不忍睹。后来换用 SkyVPN 提供的本地住宅 IP，再发类似内容，播放量就恢复正常了。我相信是因为平台认定我是正常用户而非批量机刷账号，所以没有给流量限制。这对想用 AI 批量生产内容的自媒体来说简直太重要了，一定要防患于未然。

总结：我的年度 AI 模型榜与心得

经过一番亲身折腾，我终于整理出了 2025 年度 AI 大模型最强榜单，涵盖从浏览器自动化、编程助手，到创作问答、IDE 工具，再到图像和视频生成等多个领域。

年度榜单速览

领域	🏆 年度最强	亮点一句话
浏览器自动化	ChatGPT Atlas	视觉驱动，验证码克星
编程助手	GPT-5.2 Codex	终极代码质量
创作问答	ChatGPT + Perplexity	创意输出 + 精准查证
AI IDE	Cursor / Antigravity	体验最佳 / 性价比之王
图片生成	Nano Banana Pro	4K + 文字融合
视频生成	Google Veo 3.1	文生视频新纪元

在每个领域，我选出的上榜产品和模型各有其过人之处：有的在技术上突破重围（如 Atlas 视觉过验、Nano Banana 图文融合），有的在体验上贴近用户（如 Cursor 极佳交互、Claude Code 高效便捷），也有的在成本上令人惊喜（如 GLM 4.7 的平价、Antigravity 的厚道）。

这一年 AI 领域让我见识到"百花齐放"的繁荣景象，同时也让我更加认同一件事：**AI 工具只有深入自己的工作流程，才能真正体会优劣。**纸面参数和他人评测永远只能做参考，正如我在踩坑过程中明白的——再风光的模型也要用得顺手才算强。

给同道中人的几点经验

最后，分享给同道中人的几点经验之谈：选型理性、部署细心。

前者是指根据需求挑对 AI 助手，不盲目追新炒冷饭
后者是提醒大家别忘了优化自己的使用环境，例如稳定的 VPN 和 IP、合理的账号策略，这些都会让你的 AI 使用之路更加顺畅安全

希望我的经历能给大家在茫茫 AI 模型大海中指点迷津，少走弯路。让我们一起期待明年，会不会有更令人惊掉下巴的"AI 大神"登场，又将改写这一榜单呢？无论如何，我都会第一时间去尝鲜，然后再来和大家聊聊那些新故事！

See all posts

skyvpn

@skyvpn_me