Claude 4正式发布,我在兴奋中恍惚的问:程序员路在何方?

2025年05月23日13:42:04 科技 1169

Claude 4正式发布,我在兴奋中恍惚的问:程序员路在何方? - 天天要闻

有些疯狂,我都不知道明年的这时候,世界会变成什么样。简而言之,Anthropic 在早晨发布了最新一代大模型 Claude Opus 4 和 Claude Sonnet 4。

新模型的亮点是推理、编程和复杂任务的解决能力。从种种数据来看,这两个新模型在复杂推理和工具使用方面已经超越了 GPT-4.1、o3 和 Gemini 2.5 Pro。

Opus 4 是 Anthropic 目前最强的 AI,号称能“连续工作好几个小时”。官方举了个例子,Opus 4 在用户测试里,能自主运行长达 7 小时,大幅提升了 AI 自动化的可能性。

Anthropic 还直接把 Opus 4 称为“全球最强编程模型”,在自家基准测试里,它在写代码和用各种工具(比如联网搜索)方面都超过了 Google Gemini 2.5 Pro、OpenAI 的 o3 reasoning 和 GPT-4.1。

相比之下,Claude Sonnet 4 走的是“高性价比+高效率”路线,更适合日常使用,替代了今年 2 月上线的 3.7 Sonnet。Anthropic 说,Sonnet 4 不仅代码能力更强、推理更准确,回复也更精准了。

两款新模型还有个共同提升:它们比上代模型(3.7 Sonnet)更不容易“投机取巧”地完成任务,出错概率低 65%。如果你给 Claude 本地文件访问权限,它们在做长时间、分阶段任务时,记忆力也大幅提升。

Claude 4正式发布,我在兴奋中恍惚的问:程序员路在何方? - 天天要闻

Anthropic 从去年开始,把模型的方向聚焦到提升 Claude 执行复杂任务(如研究和编程,甚至能编写完整代码库)的能力。

Anthropic 首席科学官 Jared Kaplan 表示:“任务越复杂,模型‘跑偏’的风险就越大……我们正专注于解决这个问题,让用户能够真正一次性委托大量工作给我们的模型。”

目前来看,他们家的模型也是当前行业最好的编程模型。包括 Cursor、Windsurf 等产品,都依赖于他们的模型才能取得令人满意的效果。

Opus 4 和 Sonnet 4 目前已经在 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 上线,并且都包含在 Claude 的付费套餐里,支持扩展思考模式。免费用户目前只能试用 Sonnet 4。

除了编程之外,新模型在写作方面的表现也很好。本质上,写作和编程是一件事。

Anthropic 首席产品官 Mike Krieger 在采访中表示,他我经常用 Claude 写作,在 Opus 4 和 Sonnet 4 之前,主要把模型当作思考伙伴,大部分写作还是自己完成。但现在大部分写作其实都是 Opus 完成的,几乎已经和他的写作风格无法区分。

知名内容社区 Every 的 CEO 也提到了 Claude 4 在写作方面的表现:

Claude 4正式发布,我在兴奋中恍惚的问:程序员路在何方? - 天天要闻

Mike Krieger 还透露说,接下来公司会在两个方向上重点探索。一方面是编程和 Agent 行为,这推动了许多编程初创公司;另一方面,也在推动模型如何学习并成为真正有用的写作伙伴。

这反过来也印证了 OpenAI 研究院姚顺雨前段时间对大模型下半场的论断。上半场,大家卷算法、卷参数,目标是构建一个更聪明的模型。而下半场,能够提升模型能力的手段已经编程定义问题,先定义清楚自己想解决什么问题,转而再根据场景和评估手段进行特性的调整。

等了一年,Claude 4 终于发布。这是一个多么美好的时代。目前,在 Cursor 中,已经可以试用刚刚发布的 Claude Sonnet 4。

那么,对程序员来说,这一切意味着什么?

老实说,这个问题没人能给出标准答案,但变革的浪潮已经不可逆转。过去一年,几乎所有做开发的人,都或多或少被 AI 助手“喂”过代码,或者直接让 AI 帮忙修 bug、查资料、跑自动化测试。

现在,AI 写代码的能力突飞猛进,而且不只是帮你补全几行代码,很多人已经开始用 Claude、GPT-4o、Gemini 这些模型来写完整的模块、甚至独立开发小工具。未来,AI 可能会变成你身边那个24小时不下班的“搭档”。

这可能是一个程序员“进化”的起点。最核心的变化,是角色的转变——从单纯“写代码的人”,变成“定义问题的人”。

我们要思考:我真正要解决什么需求?AI 生成的代码是不是贴合我的场景?最终的业务逻辑和产品体验,是不是被实现出来了?

科技分类资讯推荐

董明珠称孟羽童离开格力是因为“犯了很大错误” | 大鱼财经 - 天天要闻

董明珠称孟羽童离开格力是因为“犯了很大错误” | 大鱼财经

5月20日,孟羽童贴出与董明珠对话称,“时隔两年,收到了来自前老板的微信,像是心中的一块大石头终于落了地,心中是莫名的酸楚和感谢。”格力电器发文称:“520这天,爱是有回应的。这个周五,欢迎回家吃饭。猜猜董总要跟谁吃饭。”5月23日当天,格
小米发布搭载3纳米自研芯片旗舰产品 - 天天要闻

小米发布搭载3纳米自研芯片旗舰产品

5月22日晚,中国科技界传来喜讯:我国科技企业小米在京正式发布自研3纳米手机SoC芯片,被命名为“玄戒O1”,这是中国大陆地区首次研发设计出3纳米芯片。芯片是“现代工业粮食”,其制程工艺的先进性,是近年来全球科技竞逐的焦点。制程工艺数值越低,意味着晶体管集成度越高、性能越强。“手机SoC芯片是系统级芯片,集成CP...
中国医药3亿关联收购金穗科技:转型电商的豪赌 - 天天要闻

中国医药3亿关联收购金穗科技:转型电商的豪赌

中经记者 苏浩 卢志坤 北京报道(中国医药3.02亿元收购关联公司 公司公告/图)近期,中国医药(600056.SH)拟以现金3.02亿元收购控股股东通用技术集团旗下全资子公司新兴集团持有的北京金穗科技开发有限责任公司100%股权。中国医药方面表示,如完成本次收购,金穗科技将成为中国医药全资子公司,将围绕中国医药总体发展战略...
QQ浏览器发布“AI高考通”,可一键生成个性化志愿方案 - 天天要闻

QQ浏览器发布“AI高考通”,可一键生成个性化志愿方案

随着2025年高考临近,腾讯旗下QQ浏览器于5月23日发布行业首个高考领域智能体(Agent)产品——“AI高考通”。该产品依托腾讯混元大模型技术,深度整合高考全流程服务,打造从备考到志愿填报的一站式智能解决方案,开创“AI+教育”服务新模式。 作为连续7年服务高考的平台,QQ浏览器已累计为4亿人次提供高考服务,构建了包含...
全球首创!这款京产髋关节手术机器人获批上市 - 天天要闻

全球首创!这款京产髋关节手术机器人获批上市

一款诞生在北京的手术机器人正在破解髋关节置换手术的诸多难题。记者23日从北京企业长木谷获悉,由其自主研发的“ROPAHIP”人工智能髋关节手术机器人已获国家药品监督管理局的上市批准。这款手术机器人是全球首创搭载人工智能辅助骨科治疗的创新医疗器械,为全球骨科治疗贡献了“中国方案”。骨关节炎是全球致残率最高的慢...
拧紧机器人研发商“顶配机器人”完成数千万元种子轮融资 - 天天要闻

拧紧机器人研发商“顶配机器人”完成数千万元种子轮融资

机器人大讲堂获悉,拧紧机器人研发商“SLABOR顶配机器人”近日成功完成种子轮融资。该轮融资由梅花创投独家投资,融资金额总计达数千万元,将主要用于SLABOR顶配机器人技术迭代、产品系列完善及渠道市场拓展。 据机器人大讲堂了解,SLABOR顶配机器人(全称:深圳市顶配自动化技术有限公司)成立于2016年,是一家扎根于螺丝...
个人信息防泄露,认证方式权威!“国家网络身份认证”来了 - 天天要闻

个人信息防泄露,认证方式权威!“国家网络身份认证”来了

个人身份信息被非法采集,数字经济缺乏可信数字身份作为支撑,互联网平台难以找到权威、可靠、便捷的公民身份认证方式……基于个人真实身份信息的认证服务需求爆发式增长,虽然部分满足网络空间办理业务的信任基础,但也引发新的问题。公安部、国家互联网信息办公室等六部门近日联合公布《国家网络身份认证公共服务管理办法...