AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: 模型
LLM「想太多」有救了!高效推理让大模型思考过程更精简

LLM「想太多」有救了!高效推理让大模型思考过程更精简

LLM「想太多」有救了!高效推理让大模型思考过程更精简

大模型虽然推理能力增强,却常常「想太多」,回答简单问题也冗长复杂。Rice大学的华人研究者提出高效推理概念,探究了如何帮助LLM告别「过度思考」,提升推理效率。

来自主题: AI技术研报
6268 点击    2025-04-06 14:59
LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半,一张H100就能跑,还有两万亿参数超大杯

LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半,一张H100就能跑,还有两万亿参数超大杯

LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半,一张H100就能跑,还有两万亿参数超大杯

AI不过周末,硅谷也是如此。大周日的,Llama家族上新,一群LIama 4就这么突然发布了。这是Meta首个基于MoE架构模型系列,目前共有三个款:Llama 4 Scout、Llama 4 Maverick、Llama 4 Behemoth。

来自主题: AI资讯
8789 点击    2025-04-06 12:15
250多篇论文,上海AI Lab综述推理大模型高效思考

250多篇论文,上海AI Lab综述推理大模型高效思考

250多篇论文,上海AI Lab综述推理大模型高效思考

最近,像 OpenAI o1/o3、DeepSeek-R1 这样的大型推理模型(Large Reasoning Models,LRMs)通过加长「思考链」(Chain-of-Thought,CoT)在推理任务上表现惊艳。

来自主题: AI技术研报
7198 点击    2025-04-05 14:45
多榜单登顶!华为 & 哈工深团队提出 AdaReTaKe,突破长视频理解极限

多榜单登顶!华为 & 哈工深团队提出 AdaReTaKe,突破长视频理解极限

多榜单登顶!华为 & 哈工深团队提出 AdaReTaKe,突破长视频理解极限

随着视频内容的重要性日益提升,如何处理理解长视频成为多模态大模型面临的关键挑战。长视频理解能力,对于智慧安防、智能体的长期记忆以及多模态深度思考能力有着重要价值。

来自主题: AI技术研报
6188 点击    2025-04-05 14:07
Midjourney V7全面测评:50组多风格提示词实测,是否还有领先优势?

Midjourney V7全面测评:50组多风格提示词实测,是否还有领先优势?

Midjourney V7全面测评:50组多风格提示词实测,是否还有领先优势?

原本说好2月底就上的Midjourney V7,今天终于来了!生图模型卷到现在,不论是国内还是国外产品都有太多优秀模型,用户的选择可以更加多元化,即使如此,我们依然期待Midjourney独特的审美、卓越的质感、和有更多可能的上限,仍然能带给我们期待和惊喜。(叠甲:没有说其他模型不好的意思,大家都在进步都在变强!)

来自主题: AI资讯
8037 点击    2025-04-05 01:06
浙大校友重磅革新Transformer!多token注意力让LLM开挂,错误率归0

浙大校友重磅革新Transformer!多token注意力让LLM开挂,错误率归0

浙大校友重磅革新Transformer!多token注意力让LLM开挂,错误率归0

简单的任务,传统的Transformer却错误率极高。Meta FAIR团队重磅推出多token注意力机制(MTA),精准捕捉复杂信息,带来模型性能飞升!

来自主题: AI技术研报
5621 点击    2025-04-04 14:14