- Published on
AI 时代的生存与进化指南(1)
- Authors

- Name
- Ethan

在公司做了一次有关AI的分享,把PPT整理成文字,分成3篇。这是第1篇。
现场视频见文末。
起因是25年底在开发中遇到的一件日常琐事。当时移动端的接口在后端修改之后忘记了同步,导致出现了一些字段缺失的问题。我的第一反应是,直接收集移动端的接口,然后利用AI针对每个接口的输入输出快速写一套集成测试。在如今的AI能力下,这简直是信手拈来的小事。然而,这个提议当时却遭到了部分后端同学的强烈反对,他们潜意识里依然觉得AI干不了这种细致的活。这件事让我深深意识到,原来很多人对AI工具的认知依然停留在早期阶段,并不完全了解当前AI工具的各种硬核形态和真实边界。
从25年下半年开始,我个人的深切体会是,AI工具已经变得非常能打且完全够用了。我们已经到了必须强制自己改变工作习惯、全面拥抱AI的时刻。做任何事情都可以从道和术两个方向来讨论,今天有关AI的分享,我们主要聚焦术的层面。等到大家都形成了新的工作习惯,我们再来深入探讨底层的道。
想要真正用好AI,第一步是建立对当前模型生态的全局视野。这就好像在互联网早期,你选择用百度还是谷歌搜索,直接决定了你获取信息的准确度和工作效率的高低,甚至决定了你能不能干成手头这件任务。
根据去年年底的一份权威网络访问量估算数据,全球聊天机器人使用量排名前列的依然是ChatGPT、DeepSeek、Gemini、Perplexity和Claude。但要注意,当我们谈论在实际工作中使用AI时,主要有两个大版本:网页版和接口版也就是API版。大部分普通用户停留在网页版,而接下来我强烈建议大家深入使用的是API版。
看一份针对API提供商的年度使用量排名,榜单前五名勾勒出了清晰的四大天王格局。第一名是OpenAI,凭借先发优势和成熟的生态,占据了大约百分之五十以上的市场份额,其核心主力模型依然是业界标杆。第二名是Anthropic,也就是Claude的母公司。他们在企业服务和代码领域堪称专家,其API在代码生成和复杂逻辑推理任务中的使用量占比大幅提升。第三名是Google Cloud的Gemini,凭借海量Token的超大上下文窗口和多模态能力,在处理超大文档、长视频分析的API场景中遥遥领先。第四名是Meta的Llama系列,作为开源力量的首选,通过第三方托管API的形式被大量调用。第五名则是国内的DeepSeek,绝对的价格屠夫,API定价仅为国外巨头的几十分之一,且推理能力极其强大,成为了中小型开发者和AI初创公司的平替首选。
比流量更有参考意义的是回答准确度排行。在众多评测中,Gemini的预览版、Claude Opus、Grok以及Gemini Pro等模型常年霸榜。虽然排行榜受首发优势等非技术因素影响,比如ChatGPT依然是很多人的默认首选,但只要你试过把同一个复杂问题分别扔给不同的模型,就能肉眼可见地感受到它们在逻辑深度上的巨大差别。在日常生活中你用什么模型都无所谓,但在严肃的工作场景中,我的建议就是在这四大天王里做选择。选错了底层模型,在AI时代可能在源头上就输在了起跑线上了。
接下来,我详细聊聊我个人对这几个大模型产品的使用体验和避坑指南。
按我的使用时间顺序,最早接触的自然是OpenAI的ChatGPT。我在网页版上用了挺长一段时间,后来转去用其他的了。前几个月作为备用又用了一小段,但我发现了一个巨大的坑:如果你不充值每月二十美元的Plus会员或者更高级的Pro会员,免费网页版给出的答案已经略显简陋了,根本无法满足深度的技术需求。
然后是Anthropic的Claude。这是一个让我又爱又恨的产品。它由OpenAI出走的一批顶尖人才搞出来,我记得最开始在Slack上就能免费用,那时就发现它用来写代码异常稳定,逻辑严密。但是它的风控策略极其严苛,我曾试图在网页版充值会员,结果充了三次被封了三次,最后不得不用回ChatGPT。后来我才了解到它的国防定位。它的大金主是美国的一些准官方机构,比起纯粹的商业赚钱,它更在意自己的安全标签和数据合规,更像是一家硅谷的国防承包商而非纯粹的互联网公司,所以对部分地区的封锁极其严格也就不足为奇了。
第三个是我接触的Gemini,这也是我现在主要使用的核心模型。初次使用时最大的震撼就是一个字:快。大家如果还有印象,AI刚出来时,回答问题是一个字一个字往外蹦的,但在Gemini这里,几秒钟就能生成大段极具逻辑的完整代码,而且答案基本都很靠谱。作为搜索引擎时代的王者,以及当前大模型底层Transformer架构论文的鼻祖,谷歌的技术底蕴深厚。更绝的是它的多模态能力,应该是目前市面上最强的,我经常在排查Bug时,直接网页截图报错信息丢给它来分析,它能精准识别图片中的关键代码并给出解决方案。近期苹果也宣布要和谷歌合作,未来的Siri底层也会接入Gemini,势头非常猛。
最后是国产之光DeepSeek,深度求索。网页版我用的少,但我重度依赖它的API版本。对比一下各大厂商的API定价表你就会被震撼到,它的输入输出价格加起来,基本都是国外那几个主流大模型的几十分之一。对于懒得折腾网络环境、又需要大量调用API进行代码补全的人来说,它是最极致、最便捷的选择。
此外还有马斯克xAI出品的Grok。整体来说也是个非常优秀的产品,免费版的回答比免费的ChatGPT详细很多。因为背靠社交平台推特,在搜索实时新闻或社交媒体上的舆论信息时,它拥有无可比拟的时效性优势,我通常把它作为非工作和非技术场景下的强力备用。
未完待续..