
揭开大模型“伪遗忘”,港理工等团队:结构不变就是没忘
揭开大模型“伪遗忘”,港理工等团队:结构不变就是没忘近年来,大语言模型(LLMs)的能力突飞猛进,但随之而来的隐私风险也逐渐浮出水面。
近年来,大语言模型(LLMs)的能力突飞猛进,但随之而来的隐私风险也逐渐浮出水面。
Claude团队来搞开源了——推出“电路追踪”(circuit tracing)工具,可以帮大伙儿读懂大模型的“脑回路”,追踪其思维过程。该工具的核心在于生成归因图(attribution graphs),其作用类似于大脑的神经网络示意图,通过可视化模型内部超节点及其连接关系,呈现LLM处理信息的路径。
来自香港中文大学、爱丁堡大学、香港科技大学与华为爱丁堡研究中心的研究团队联合发布了一项关于AI记忆机制的系统性综述,旨在在大模型时代背景下,重新审视并系统化理解智能体的记忆构建与演化路径。
其实“野朋友”的AI能力还不完善,参与生态保护的人力资源也远远不够,而这个案例有趣之外,恰恰在于把生态保护跟大模型能力的训练结合在一起。其实“野朋友”的AI能力还不完善,参与生态保护的人力资源也远远不够,而这个案例有趣之外,恰恰在于把生态保护跟大模型能力的训练结合在一起。
为提升大模型“推理+搜索”能力,阿里通义实验室出手了。
孙子兵法有云:“故其疾如风,其徐如林”,意指在行进迅速时,如狂风飞旋;而在行进从容时,如森林徐徐展开。
现在,请大家一起数一下“1”、“2”。OK,短短2秒钟时间,一个准万亿MoE大模型就已经吃透如何解一道高等数学大题了!而且啊,这个大模型还是不用GPU来训练,全流程都是大写的“国产”的那种。
就在刚刚,中兴通讯星云大模型获推理榜总分第一,总榜并列第二!而在数学推理、科学推理、代码生成的细分赛道上,它同样表现抢眼。更难得的是,它是业内少数通过国家级权威安全认证的大模型。
文章以第一人称视角,讲述一名AI自媒体博主因行业竞争与技术迭代陷入深度焦虑的过程,最终通过反思意识到焦虑源于攀比与生存恐惧,而非技术本身。核心观点是接纳自身局限、明确独特价值、转向合作与好奇驱动,并提出三条实用建议,强调应对AI焦虑需聚焦个人定位而非盲目追赶。
豆包、文心一言、DeepSeek、元宝……这些国产AI工具,正在大规模进入职场内容流里。我们以为它们是工具,其实它们更像是一种“说得太像真的语气”,让每个使用者都可能在不经意间交出判断力。