电话: 邮箱:
博 学 而 笃 志   切 问 而 近 思 SEEK BROAD KNOWLEDGE · ASK EARNESTLY

澳门银河游戏

澳门银河游戏

银河游戏娱乐官网(中国)IOS|Android/通用APP下载 Opus4.8刚发布, 立马被拆台: 跑分赢了GPT-5.5, 但编码王座不稳了

发布日期:2026-06-03 18:02 来源:未知 作者:admin 浏览次数:

银河游戏娱乐官网(中国)IOS|Android/通用APP下载 Opus4.8刚发布, 立马被拆台: 跑分赢了GPT-5.5, 但编码王座不稳了

AI圈炸锅了!Anthropic夜深扔出的Opus4.8,基准测试把GPT5.5踩在眼下,但设立者却集体吐槽:这数据和实质用起来总共不是一趟事?

此次升级,Anthropic给设立者塞了两个“硬菜”

5月28昼夜深,Anthropic偷偷发布了Opus4.8,此次不是只拼跑分,而是径直对准设立者的职责流,dynamic workflows和更低廉的fast mode。

dynamic workflows几乎是设立者的“超等助手”:它能让Claude写剧本转换上百个小AI(subagents)并行干活,最多一次能跑1000个,并发上限16个。最绝的是,这些小AI在后台忙的时间,你和Claude的对话还能络续,不会卡住。比如Jarred Sumner用它把Bun从Zig迁到Rust,75万行代码,11天就处置,易游娱乐app2026世界杯中国官方下载还通过了99.8%的测试!

fast mode更确实:速率是庸碌样式的2.5倍,价钱却砍到蓝本的三分之一,当今每百万输入token10好意思元,输出50好意思元,比4.7版块低廉太多。对那些追求速率和蒙眬量的场景来说,这但是真金白银的省。

乐鱼体育中国2026世界杯官网

除了快和低廉,Opus4.8还念念作念“安分的AI”

AI圈当今卷的不仅仅智商,还有“东谈主品”。Opus4.8此次重心吹的是“更安分”:骗取率比前代权贵镌汰,银河游戏娱乐官网(中国)IOS|Android/通用APP下载合作摧毁肯求的比例也更少,以至对我方写的代码颓势置之不理的概率低了四倍。

Anthropic说它在“亲社会秉性”上创了新高,比如更撑抓用户自主性,按用户最好利益行事。简易说,往日AI可能错了也不说,当今会主动指出风险,以至指示你那里区别。这对需要靠谱判断的设立者来说,几乎是旱苗得雨。

基准测试打了GPT5.5?但设立者不买账

Anthropic放出的基准数据很亮眼:Opus4.8在agentic coding上拿了69.2%,向上GPT5.5的58.65%和Gemini3.1 Pro的54.2%。但在terminal coding上,依然输给了GPT5.5,差3.6个点。

可设立者社区却不买账。Redis作家antirez径直月旦Anthropic犯了“首要政策罪过”:明明许多东谈主认为GPT5.5的编码体感更好,你却拿基准数外传我方更强,这不是让用户困惑吗?DHH也在X上夸GPT5.5:“用了这样多模子,惟有它让我反复惊羡‘怎样这样好’。”

网友Chubby更是径直点破:“Opus4.8很强,但Anthropic当今更像在追OpenAI,而不是引颈节律。”

Opus这一年:从“编码之王”到争议收敛

旧年5月Opus4刚发布时,Anthropic喊它“宇宙最好的编码模子”,确乎在长高下文和agent任务上让东谈主咫尺一亮。但这一年走来,争议收敛:4.6版块的长高下文订价坑:向上20万token就按更高价算,被用户骂变相加价;4.7版人道能下跌,还水火不容,Anthropic我方齐承认不如那时的Mythos Preview;最近Agent SDK拆分计费,又让习尚长入额度的用户动怒。

银河游戏娱乐官网(中国)IOS|Android/通用APP下载