
Hinton梦想的AI医生要来了!斯坦福哈佛实测:o1以78%正确率超人类
Hinton梦想的AI医生要来了!斯坦福哈佛实测:o1以78%正确率超人类Hinton梦想的AI医生要来了!斯坦福哈佛实测:o1以78%正确率超人类 新智元 新智元 2025年06月08日 12:45 北京
Hinton梦想的AI医生要来了!斯坦福哈佛实测:o1以78%正确率超人类 新智元 新智元 2025年06月08日 12:45 北京
仅用6小时,Claude 4就让研究者了解了如何制造神经毒气——这不是小说情节,而是真实事件。更令人担忧的是,Anthropic自身也无法完全评估风险。这是否意味着这家AI巨头的「安全人设」正在崩塌?
多模态检索是信息理解与获取的关键技术,但其中的跨模态干扰问题一直是一大难题。
最近的一篇论文中,来自人大和腾讯的研究者们的研究表明,语言模型对强化学习中的奖励噪音具有鲁棒性,即使翻转相当一部分的奖励(例如,正确答案得 0 分,错误答案得 1 分),也不会显著影响下游任务的表现。
一年一度,腾讯又开始招募顶尖学生了——“星火挑战营”,计划招募60-70人,主要面向高二、高三学生(2025级高考生)。一旦入选,就有机会前往深圳总部,挑战一线产业难题。
当地时间 6 月 4–5 日,在旧金山 St. Regis 酒店,一场没有模型发布的科技峰会,成了硅谷高管们确立AI新底层认知的关键节点。
最近,30位世界顶尖数学家亲自出马,在UC伯克利对OpenAI o4-mini展开「围剿」,两天连出教授级难题,结果却当场集体「破防」!有人直言:这个AI,的确已接近数学天才的水平。曾经以为AGI遥遥无期,如今仿佛只剩临门一脚了……
AI 搜索引擎初创公司 Perplexity AI 本周四宣布推出 SEC(证券交易)文件访问功能,旨在使复杂的财务数据变得更易于理解,适合从学生到顾问、再到日间交易者等各类投资者。
大模型的发展正在遭遇瓶颈。随着互联网文本数据被大规模消耗,基于数字世界训练的AI模型性能提升速度明显放缓。与此同时,物理世界中蕴藏着数字世界数百倍甚至千倍的多模态数据,这些数据远未被有效利用,成为AI发展的下一个重要方向。
20万次模拟实验,耗资5000美元,证实大模型在多轮对话中的表现明显低于单轮对话!一旦模型的第一轮答案出现偏差,不要试图纠正,而是新开一个对话!