AI资讯新闻榜单内容搜索-研究

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 研究
大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大语言模型(LLM)正从工具进化为“裁判”(LLM-as-a-judge),开始大规模地评判由AI自己生成的内容。这种高效的评估范式,其可靠性与人类判断的一致性,却很少被深入验证。

来自主题: AI技术研报
6757 点击    2025-08-17 13:16
AI顶会反噬整个学术圈!「不发表就会死」,NeurIPS爆仓,博士年肝4.5篇大崩溃

AI顶会反噬整个学术圈!「不发表就会死」,NeurIPS爆仓,博士年肝4.5篇大崩溃

AI顶会反噬整个学术圈!「不发表就会死」,NeurIPS爆仓,博士年肝4.5篇大崩溃

就在刚刚,NUS研究者呼吁:NeurIPS、ICML、CVPR三大顶会,正在反噬整个AI学术圈!平均每个研究者每年被逼狂发4.5篇论文,已经身心俱疲。总之,顶会模型已经濒临崩溃,是时候踩刹车了!

来自主题: AI技术研报
6647 点击    2025-08-17 13:03
GPT-5超越人类医生!推理能力比专家高出24%,理解力强29%

GPT-5超越人类医生!推理能力比专家高出24%,理解力强29%

GPT-5超越人类医生!推理能力比专家高出24%,理解力强29%

GPT-5比人类医生还会看X光片?! 最新研究显示,GPT-5对医学影像的推理和理解准确率分别比人类专家高出24.23%和29.40%。

来自主题: AI资讯
8372 点击    2025-08-16 16:03
腾讯AI团队最新研究戳穿AI“智力”泡沫:百万上下文正在误导所有人

腾讯AI团队最新研究戳穿AI“智力”泡沫:百万上下文正在误导所有人

腾讯AI团队最新研究戳穿AI“智力”泡沫:百万上下文正在误导所有人

AI领域一度陷入“上下文窗口”的军备竞赛,从几千token扩展到数百万token。这相当于给了AI一个巨大的图书馆。但这些“百万上下文”的顶级模型,它究竟是真的“理解”了,还是只是一个更会“背书”的复读机?

来自主题: AI资讯
7422 点击    2025-08-16 15:09
Cohere融资36亿,AMD英伟达都投了!前Meta研究副总裁出任首席AI官

Cohere融资36亿,AMD英伟达都投了!前Meta研究副总裁出任首席AI官

Cohere融资36亿,AMD英伟达都投了!前Meta研究副总裁出任首席AI官

加拿大AI新贵Cohere获5亿美元融资、估值68亿美元,前Meta FAIR副总裁、PyTorch与Llama重要推手Joelle Pineau加盟出任首席AI官,或将开启企业AI新战局。

来自主题: AI资讯
7909 点击    2025-08-15 14:21
LeetCode刷够100小时,学会找人内推,OpenAI员工下场教你拿Offer

LeetCode刷够100小时,学会找人内推,OpenAI员工下场教你拿Offer

LeetCode刷够100小时,学会找人内推,OpenAI员工下场教你拿Offer

OpenAI 在 AI 领域引领了一波又一波浪潮,想必很多人好奇,这些创新背后的研究人员是如何通过面试的? 尤其是现在,OpenAI 已经成为全球最受瞩目的 AI 公司之一,吸引了无数顶尖人才投递简历。想要加入这个团队,着实不容易。

来自主题: AI资讯
7432 点击    2025-08-15 12:43
潘建伟团队突破量子操控极限!AI助力2024个原子60毫秒精准重排

潘建伟团队突破量子操控极限!AI助力2024个原子60毫秒精准重排

潘建伟团队突破量子操控极限!AI助力2024个原子60毫秒精准重排

量子计算领域新里程碑,刷新世界纪录! 潘建伟团队利用AI技术,在60毫秒内成功构建多达2024个原子的无缺陷二维和三维原子阵列,刷新了中性原子体系无缺陷原子阵列规模的世界纪录。

来自主题: AI资讯
7831 点击    2025-08-15 11:49
字节新出的「PromptPilot」太好用了!!

字节新出的「PromptPilot」太好用了!!

字节新出的「PromptPilot」太好用了!!

假如你还没有尝试用AI来提升效率,那一定要抽点时间来研究下,你会打开新世界的大门! 如果你用过,但觉得AI并没有传说中的那么神奇,不妨看看今天的文章,或许能帮助你更得心应手的驾驭AI。

来自主题: AI资讯
7135 点击    2025-08-14 10:52
华人团队终结Token危机:扩散模型数据潜力超自回归三倍

华人团队终结Token危机:扩散模型数据潜力超自回归三倍

华人团队终结Token危机:扩散模型数据潜力超自回归三倍

Token危机真的要解除了吗? 最新研究发现,在token数量受限的情况下,扩散语言模型的数据潜力可达自回归模型的三倍多。

来自主题: AI资讯
8202 点击    2025-08-14 10:40
谷歌领投2000万美金,OpenAI、DeepMind天使投资人也集体下注:这家公司要做AI时代的"通用集成层"

谷歌领投2000万美金,OpenAI、DeepMind天使投资人也集体下注:这家公司要做AI时代的"通用集成层"

谷歌领投2000万美金,OpenAI、DeepMind天使投资人也集体下注:这家公司要做AI时代的"通用集成层"

我最近深入研究了一家名为 StackOne 的伦敦创业公司,他们刚刚完成了由 GV(Google Ventures)领投的 2000 万美元 A 轮融资,这不仅仅是一个简单的融资消息,而是整个企业软件生态系统即将迎来根本性变革的信号。

来自主题: AI资讯
7610 点击    2025-08-13 17:41