AI 时代的生存与进化指南(1)

在公司做了一次有关AI的分享，把PPT整理成文字，分成3篇。这是第1篇。
现场视频见文末。

起因是25年底在开发中遇到的一件日常琐事。当时移动端的接口在后端修改之后忘记了同步，导致出现了一些字段缺失的问题。我的第一反应是，直接收集移动端的接口，然后利用AI针对每个接口的输入输出快速写一套集成测试。在如今的AI能力下，这简直是信手拈来的小事。然而，这个提议当时却遭到了部分后端同学的强烈反对，他们潜意识里依然觉得AI干不了这种细致的活。这件事让我深深意识到，原来很多人对AI工具的认知依然停留在早期阶段，并不完全了解当前AI工具的各种硬核形态和真实边界。

从25年下半年开始，我个人的深切体会是，AI工具已经变得非常能打且完全够用了。我们已经到了必须强制自己改变工作习惯、全面拥抱AI的时刻。做任何事情都可以从道和术两个方向来讨论，今天有关AI的分享，我们主要聚焦术的层面。等到大家都形成了新的工作习惯，我们再来深入探讨底层的道。

想要真正用好AI，第一步是建立对当前模型生态的全局视野。这就好像在互联网早期，你选择用百度还是谷歌搜索，直接决定了你获取信息的准确度和工作效率的高低，甚至决定了你能不能干成手头这件任务。

根据去年年底的一份权威网络访问量估算数据，全球聊天机器人使用量排名前列的依然是ChatGPT、DeepSeek、Gemini、Perplexity和Claude。但要注意，当我们谈论在实际工作中使用AI时，主要有两个大版本：网页版和接口版也就是API版。大部分普通用户停留在网页版，而接下来我强烈建议大家深入使用的是API版。

看一份针对API提供商的年度使用量排名，榜单前五名勾勒出了清晰的四大天王格局。第一名是OpenAI，凭借先发优势和成熟的生态，占据了大约百分之五十以上的市场份额，其核心主力模型依然是业界标杆。第二名是Anthropic，也就是Claude的母公司。他们在企业服务和代码领域堪称专家，其API在代码生成和复杂逻辑推理任务中的使用量占比大幅提升。第三名是Google Cloud的Gemini，凭借海量Token的超大上下文窗口和多模态能力，在处理超大文档、长视频分析的API场景中遥遥领先。第四名是Meta的Llama系列，作为开源力量的首选，通过第三方托管API的形式被大量调用。第五名则是国内的DeepSeek，绝对的价格屠夫，API定价仅为国外巨头的几十分之一，且推理能力极其强大，成为了中小型开发者和AI初创公司的平替首选。

比流量更有参考意义的是回答准确度排行。在众多评测中，Gemini的预览版、Claude Opus、Grok以及Gemini Pro等模型常年霸榜。虽然排行榜受首发优势等非技术因素影响，比如ChatGPT依然是很多人的默认首选，但只要你试过把同一个复杂问题分别扔给不同的模型，就能肉眼可见地感受到它们在逻辑深度上的巨大差别。在日常生活中你用什么模型都无所谓，但在严肃的工作场景中，我的建议就是在这四大天王里做选择。选错了底层模型，在AI时代可能在源头上就输在了起跑线上了。

接下来，我详细聊聊我个人对这几个大模型产品的使用体验和避坑指南。

按我的使用时间顺序，最早接触的自然是OpenAI的ChatGPT。我在网页版上用了挺长一段时间，后来转去用其他的了。前几个月作为备用又用了一小段，但我发现了一个巨大的坑：如果你不充值每月二十美元的Plus会员或者更高级的Pro会员，免费网页版给出的答案已经略显简陋了，根本无法满足深度的技术需求。

然后是Anthropic的Claude。这是一个让我又爱又恨的产品。它由OpenAI出走的一批顶尖人才搞出来，我记得最开始在Slack上就能免费用，那时就发现它用来写代码异常稳定，逻辑严密。但是它的风控策略极其严苛，我曾试图在网页版充值会员，结果充了三次被封了三次，最后不得不用回ChatGPT。后来我才了解到它的国防定位。它的大金主是美国的一些准官方机构，比起纯粹的商业赚钱，它更在意自己的安全标签和数据合规，更像是一家硅谷的国防承包商而非纯粹的互联网公司，所以对部分地区的封锁极其严格也就不足为奇了。

第三个是我接触的Gemini，这也是我现在主要使用的核心模型。初次使用时最大的震撼就是一个字：快。大家如果还有印象，AI刚出来时，回答问题是一个字一个字往外蹦的，但在Gemini这里，几秒钟就能生成大段极具逻辑的完整代码，而且答案基本都很靠谱。作为搜索引擎时代的王者，以及当前大模型底层Transformer架构论文的鼻祖，谷歌的技术底蕴深厚。更绝的是它的多模态能力，应该是目前市面上最强的，我经常在排查Bug时，直接网页截图报错信息丢给它来分析，它能精准识别图片中的关键代码并给出解决方案。近期苹果也宣布要和谷歌合作，未来的Siri底层也会接入Gemini，势头非常猛。

最后是国产之光DeepSeek，深度求索。网页版我用的少，但我重度依赖它的API版本。对比一下各大厂商的API定价表你就会被震撼到，它的输入输出价格加起来，基本都是国外那几个主流大模型的几十分之一。对于懒得折腾网络环境、又需要大量调用API进行代码补全的人来说，它是最极致、最便捷的选择。

此外还有马斯克xAI出品的Grok。整体来说也是个非常优秀的产品，免费版的回答比免费的ChatGPT详细很多。因为背靠社交平台推特，在搜索实时新闻或社交媒体上的舆论信息时，它拥有无可比拟的时效性优势，我通常把它作为非工作和非技术场景下的强力备用。

未完待续..