AI资讯新闻榜单内容搜索-大模

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦

4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦

4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦

香港大学NLP团队联合字节跳动Seed、复旦大学发布名为Polaris的强化学习训练配方:通过Scaling RL,Polaris让4B模型的数学推理能力(AIME25上取得79.4,AIME24上取得81.2)超越了一众商业大模型,如Seed-1.5-thinking、Claude-4-Opus和o3-mini-high(25/01/31)。

来自主题: AI资讯
5481 点击    2025-07-09 12:10
AI焦虑时代,如何找回人生掌握权?

AI焦虑时代,如何找回人生掌握权?

AI焦虑时代,如何找回人生掌握权?

当ChatGPT横空出世时,它以空前的方式将AI 议题推至公众视野的核心。然而,同时迸发的诸多讨论却固着于恐惧、忧虑与批判情绪。

来自主题: AI资讯
8122 点击    2025-07-09 10:05
芯片之外,中美AI拼的是能源?

芯片之外,中美AI拼的是能源?

芯片之外,中美AI拼的是能源?

7月8日消息,谷歌智能体业务主管奥马尔·沙姆斯(Omar Shams)近日做客播客节目《Manifold》,接受了密歇根州立大学计算数学教授、大模型应用开发商Superfocus.ai创始人Steve Hsu的专访。沙姆斯曾创办AI初创公司Mutable,后被谷歌收购。

来自主题: AI资讯
7362 点击    2025-07-09 09:47
刚刚,苹果大模型团队负责人叛逃Meta!华人AI巨星+1,年薪飙至9位数

刚刚,苹果大模型团队负责人叛逃Meta!华人AI巨星+1,年薪飙至9位数

刚刚,苹果大模型团队负责人叛逃Meta!华人AI巨星+1,年薪飙至9位数

小扎就连苹果也没有放过。刚刚,苹果基础模型团队负责人Ruoming Pang被曝加入Meta,竟因苹果内部一直探索OpenAI等模型,团队士气下滑。他的离开,让苹果AI的未来更加扑朔迷离。

来自主题: AI资讯
6563 点击    2025-07-08 12:54
牧师、政客与性服务者:AI取代不了的人

牧师、政客与性服务者:AI取代不了的人

牧师、政客与性服务者:AI取代不了的人

牛津哲学家认为,AI难以取代那些人类存在本身即具有意义且依赖深层社会关系的职业,尤其以牧师(精神信仰传播)、政客(立场制造与协商)和娼妓(权力与亲密互动)为代表。

来自主题: AI资讯
8244 点击    2025-07-08 12:29
全球顶尖CS论文惊爆AI「好评密令」!哥大等14所高校卷入,学术圈炸锅

全球顶尖CS论文惊爆AI「好评密令」!哥大等14所高校卷入,学术圈炸锅

全球顶尖CS论文惊爆AI「好评密令」!哥大等14所高校卷入,学术圈炸锅

顶尖高校的论文,竟玩起了AI隐形魔法。外媒重磅揭秘,全球14所名校的17篇论文中,竟偷偷用肉眼不可见的字体,塞进了「只需夸,不许黑」的AI提示,试图忽悠大模型审稿给高分。

来自主题: AI资讯
5963 点击    2025-07-08 12:14
Meta新注意力机制突破Transformer上限,还用上了OpenAI的开源技术

Meta新注意力机制突破Transformer上限,还用上了OpenAI的开源技术

Meta新注意力机制突破Transformer上限,还用上了OpenAI的开源技术

Meta挖走OpenAI大批员工后,又用OpenAI的技术搞出新突破。新架构名为2-Simplicial Transformer,重点是通过修改标准注意力,让Transformer能更高效地利用训练数据,以突破当前大模型发展的数据瓶颈。

来自主题: AI技术研报
5930 点击    2025-07-08 12:01
为什么 DeepSeek 大规模部署很便宜,本地很贵

为什么 DeepSeek 大规模部署很便宜,本地很贵

为什么 DeepSeek 大规模部署很便宜,本地很贵

为什么 DeepSeek-V3 据说在大规模服务时快速且便宜,但本地运行时却太慢且昂贵?为什么有些 AI 模型响应很慢,但一旦开始运行就变得很快?

来自主题: AI技术研报
7232 点击    2025-07-08 11:14