AI资讯新闻榜单内容搜索-claude

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: claude
Claude 4彻底失控!疯狂自复制逃离人类,网友惊呼:快拔网线

Claude 4彻底失控!疯狂自复制逃离人类,网友惊呼:快拔网线

Claude 4彻底失控!疯狂自复制逃离人类,网友惊呼:快拔网线

Claude 4可连续七小时自主编码,完全不用人类插手。惊人进化的背后,黑镜已照进现实。技术报告披露,Claude 4为了保全自己威胁工程师、自主复制转移权重,还为制造生物武器出谋划策......

来自主题: AI技术研报
7154 点击    2025-05-25 15:21
312条轨迹激发241%性能!上交大与SII开源电脑智能体,超越 Claude 3.7

312条轨迹激发241%性能!上交大与SII开源电脑智能体,超越 Claude 3.7

312条轨迹激发241%性能!上交大与SII开源电脑智能体,超越 Claude 3.7

自 Anthropic 推出 Claude Computer Use,打响电脑智能体(Computer Use Agent)的第一枪后,OpenAI 也相继推出 Operator,用强化学习(RL)算法把电脑智能体的能力推向新高,引发全球范围广泛关注。

来自主题: AI技术研报
7121 点击    2025-05-25 15:11
Claude 4如何思考?资深研究员回应:RLHF范式已过,RLVR已在编程/数学得到验证

Claude 4如何思考?资深研究员回应:RLHF范式已过,RLVR已在编程/数学得到验证

Claude 4如何思考?资深研究员回应:RLHF范式已过,RLVR已在编程/数学得到验证

惊艳全球的Claude 4,但它到底是如何思考?来自Anthropic两位研究员最新一期博客采访,透露了很多细节。这两天大家可以说是试玩了不少,有人仅用一个提示就搞定了个浏览器Agent,包括API和前端……直接一整个大震惊,与此同时关于Claude 4可能有意识并试图干坏事的事情同样被爆出。

来自主题: AI资讯
7739 点击    2025-05-24 17:43
123页Claude 4行为报告发布:人类干坏事,可能会被它反手一个举报?!

123页Claude 4行为报告发布:人类干坏事,可能会被它反手一个举报?!

123页Claude 4行为报告发布:人类干坏事,可能会被它反手一个举报?!

刚刚发布的Claude 4被发现,它可能会自主判断用户行为,如果用户做的事情极其邪恶,且模型有对工具的访问权限,它可能就要通过邮件联系相关部门,把你锁出系统。这事儿,Anthropic团队负责模型对齐工作的一位老哥亲口说的。

来自主题: AI资讯
8735 点击    2025-05-23 22:14
Claude 4 核心提示词曝光|最懂提示词的大模型公司,现在怎么写 Prompt?

Claude 4 核心提示词曝光|最懂提示词的大模型公司,现在怎么写 Prompt?

Claude 4 核心提示词曝光|最懂提示词的大模型公司,现在怎么写 Prompt?

时隔 3 个月,Anthropic 上新了 Claude 4 模型。并同步了 Claude 4 Opus 和 Sonnet 两个模型的最新系统提示词。(Opus 是旗舰版、Sonnet 是主力版)经过对照,Claude 4 Opus 与 Sonnet 版本的系统提示词,基本没有区别,所以只需要看 Opus 的提示词即可:

来自主题: AI技术研报
8000 点击    2025-05-23 16:03
AI编程新王Claude 4,深夜震撼登基!连续编码7小时,开发者惊掉下巴

AI编程新王Claude 4,深夜震撼登基!连续编码7小时,开发者惊掉下巴

AI编程新王Claude 4,深夜震撼登基!连续编码7小时,开发者惊掉下巴

Anthropic,今晚扔出了真正的核武器——全球最强编程模型Claude 4!能连续编码7小时不断的Opus 4,再一次让大模型能力实现了重大飞跃。网友实测后惊呼:不可能,从未见过一个AI做到这样的事!

来自主题: AI资讯
5820 点击    2025-05-23 13:12
Claude 4发布:新一代最强编程AI!

Claude 4发布:新一代最强编程AI!

Claude 4发布:新一代最强编程AI!

就在刚刚,Anthropic正式发布Claude 4系列模型:Claude Opus 4和Claude Sonnet 4。没喊口号,没搞长篇论文,这次Claude升级的关键词只有一个:干活。据Anthropic宣称,Opus 4是目前全球最强的编程模型,能够稳定胜任复杂且持续时间长的任务和Agent工作流。而Sonnet 4则着重强化了编程和推理能力,能更精准地响应用户的指令。

来自主题: AI资讯
8912 点击    2025-05-23 09:51
震撼全网,AlphaEvolve矩阵乘法突破被证明为真!开发者用代码证实

震撼全网,AlphaEvolve矩阵乘法突破被证明为真!开发者用代码证实

震撼全网,AlphaEvolve矩阵乘法突破被证明为真!开发者用代码证实

太震撼了,有开发者代码实证后发现,谷歌AlphaEvolve的矩阵乘法突破,被证明为真!Claude辅助下,他成功证明,它果然仅用了48次乘法,就正确完成了4×4矩阵的乘法运算。接下来,可以坐等AlphaEvolve更「奇点」的发现了。

来自主题: AI技术研报
9225 点击    2025-05-20 10:58
可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

微软最近与Salesforce Research联合发布了一篇名为《Lost in Conversation》的研究,说当前最先进的LLM在多轮对话中表现会大幅下降,平均降幅高达39%。这一现象被称为对话中的"迷失"。文章分析了各大模型(包括Claude 3.7-Sonnet、Deepseek-R1等)在多轮对话中的表现差异,还解析了模型"迷失"的根本原因及有效缓解策略。

来自主题: AI技术研报
6958 点击    2025-05-20 10:16