DeepSeek-R1迎來0528小版本升級(jí):編程性能大提升
瀟湘 / 2025-05-29 15:15135474昨日晚間,深度求索旗下的大語言模型DeeoSeek-R1悄悄進(jìn)行了一次小版本升級(jí),但并未在官網(wǎng)發(fā)布更新公告,僅僅是在官方交流群中進(jìn)行了通知,目前在官網(wǎng)、APP、小程序上均已可用。如果不出所料,近日官網(wǎng)將會(huì)發(fā)布更新公告。

根據(jù)Live CodeBench編程代碼測(cè)試平臺(tái)的評(píng)分,更新到0528版本的DeepSeek-R1的代碼編程性能超越了OpenAI于今年年初推出的o3 mini high。

根據(jù)知乎博主@toyama nao的測(cè)試,DeepSeek-R1 0528版本的邏輯成績有14.4%的大幅提升,更新之后再次躋身推理模型的第一梯隊(duì),其中模型使用成本最亮眼,只有OpneAI o3 (high)的5%,不過通過測(cè)試的平均耗時(shí)較長。


在外網(wǎng)博主@Lech Mazur基于《紐約時(shí)報(bào)》解謎游戲的所設(shè)計(jì)的基準(zhǔn)測(cè)試Extended NYT Connections中,DeepSeek-R1 0528版本的得分由38.6提升49.8,提升幅度高達(dá)29%。在Thematic Generation benchmark測(cè)試中,DeepSeek-R1 0528版本的得分(越低越好)由1.80縮減至1.74,排名則是由第9名躍升至第5名。
DeepSeek團(tuán)隊(duì)還是非常謙虛,僅僅是一個(gè)小版本升級(jí)就有如此高的性能提升,換成別家說不定都命名成新模型了。
DeepSeek-R1迎來0528小版本升級(jí):編程性能大提升








陳震慘遭全網(wǎng)禁言,因?yàn)橥刀惵┒悾?/em>




滬公網(wǎng)安備 31010702005758號(hào)
發(fā)表評(píng)論注冊(cè)|登錄