AI资讯新闻榜单内容搜索-claude

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: claude
刚刚,新版DeepSeek-R1正式开源!直逼o3编程强到离谱,一手实测来了

刚刚,新版DeepSeek-R1正式开源!直逼o3编程强到离谱,一手实测来了

刚刚,新版DeepSeek-R1正式开源!直逼o3编程强到离谱,一手实测来了

新版DeepSeek-R1重磅开源,凌晨已放出权重!此次模型性能几乎与o4-mini(Medium)相当,编程实测超越Claude 4 Sonnet。网友纷纷惊叹:开源又一次胜利了。

来自主题: AI资讯
5843 点击    2025-05-29 11:44
准确率92.7%逼近Claude 3.5、成本降低86%,开源代码定位新神器LocAgent来了

准确率92.7%逼近Claude 3.5、成本降低86%,开源代码定位新神器LocAgent来了

准确率92.7%逼近Claude 3.5、成本降低86%,开源代码定位新神器LocAgent来了

又是一个让程序员狂欢的研究!来自 OpenHands、耶鲁、南加大和斯坦福的研究团队刚刚发布了 LocAgent—— 一个专门用于代码定位的图索引 LLM Agent 框架,直接把代码定位准确率拉到了 92.7% 的新高度。该研究已被 ACL 2025 录用。

来自主题: AI技术研报
5835 点击    2025-05-29 10:03
DeepSeek-R1 发布,性能对标 OpenAI o1 正式版,实测编程性能直逼claude 4

DeepSeek-R1 发布,性能对标 OpenAI o1 正式版,实测编程性能直逼claude 4

DeepSeek-R1 发布,性能对标 OpenAI o1 正式版,实测编程性能直逼claude 4

今天,我们正式发布 DeepSeek-R1,并同步开源模型权重。DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。DeepSeek-R1 上线API,对用户开放思维链输出,通过设置 `model='deepseek-reasoner'` 即可调用。

来自主题: AI资讯
7799 点击    2025-05-28 21:49
全靠Claude4!30年FAANG老工程师:AI帮我解决了4年老bug

全靠Claude4!30年FAANG老工程师:AI帮我解决了4年老bug

全靠Claude4!30年FAANG老工程师:AI帮我解决了4年老bug

AI 就像一头野驴,跑起来就不停。人类花了几百万年才走上食物链顶端,而大模型只用了不到十年时间,已经能把你和刘亦菲 P 进一张自拍了。奥!最新进展是已经能自己生成音画同步的超真实脱口秀了。

来自主题: AI资讯
7992 点击    2025-05-28 12:12
全球顶尖AI做物理,被人类按地摩擦?不懂推理大翻车,本科生碾压

全球顶尖AI做物理,被人类按地摩擦?不懂推理大翻车,本科生碾压

全球顶尖AI做物理,被人类按地摩擦?不懂推理大翻车,本科生碾压

最顶尖的AI模型,做起奥数题来已经和人类相当,那做物理题水平如何呢?港大等机构的研究发现:即使GPT-4o、Claude 3.7 Sonnet这样的最强模型,做物理题也翻车了,准确率直接被人类专家碾压!

来自主题: AI技术研报
7957 点击    2025-05-28 11:58
这位前百度实习生建立了一个牢不可破的 AI 帝国。

这位前百度实习生建立了一个牢不可破的 AI 帝国。

这位前百度实习生建立了一个牢不可破的 AI 帝国。

让我们把时钟拨回 2014 年 5 月,当刚完成博士后研究的 Dario Amodei 决定加入百度研究院(Baidu Research)时,他绝不会想到自己有朝一日能够亲手打造属于自己的 AI 帝国,并成为连谷歌和微软都无法撼动和忽视的强劲对手。

来自主题: AI资讯
7519 点击    2025-05-26 11:03
深度|Anthropic首席产品官:从Claude到MCP,最好的AI产品不是计划出来的,是从底层自发长出来的

深度|Anthropic首席产品官:从Claude到MCP,最好的AI产品不是计划出来的,是从底层自发长出来的

深度|Anthropic首席产品官:从Claude到MCP,最好的AI产品不是计划出来的,是从底层自发长出来的

从长期看,大多数内容将由AI生成。所以“这是不是AI生成的”这个问题将变得无意义真正。值得关注的是内容的来源、溯源和引用等问题。而讽刺的是,AI反而可能更有助于解决这些问题。

来自主题: AI资讯
7911 点击    2025-05-26 10:05
AI在「赚钱锦标赛」夺冠,比人类还会做生意!躺赚时代要来了?

AI在「赚钱锦标赛」夺冠,比人类还会做生意!躺赚时代要来了?

AI在「赚钱锦标赛」夺冠,比人类还会做生意!躺赚时代要来了?

Vending-Bench模拟环境可以测试大模型管理自动售货机的能力,结果显示,Claude 3.5 Sonnet表现最佳,人类屈居第四!

来自主题: AI技术研报
7677 点击    2025-05-25 16:22