AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
5秒出4张2K大图!阿里提出2步生成方案,拉爆AI生图进度条

5秒出4张2K大图!阿里提出2步生成方案,拉爆AI生图进度条

5秒出4张2K大图!阿里提出2步生成方案,拉爆AI生图进度条

AI生成一张图片,你愿意等多久?在主流扩散模型还在迭代中反复“磨叽”、让用户盯着进度条发呆时,阿里智能引擎团队直接把进度条“拉爆”了——5秒钟,到手4张2K级高清大图。

来自主题: AI技术研报
9448 点击    2026-01-31 14:12
VLM剪枝新SOTA:无需重训练,注意力去偏置超越6大主流方案

VLM剪枝新SOTA:无需重训练,注意力去偏置超越6大主流方案

VLM剪枝新SOTA:无需重训练,注意力去偏置超越6大主流方案

近年来,Vision-Language Models(视觉—语言模型)在多模态理解任务中取得了显著进展,并逐渐成为通用人工智能的重要技术路线。

来自主题: AI技术研报
6178 点击    2026-01-31 12:30
天下苦CUDA久矣,又一国产方案上桌了

天下苦CUDA久矣,又一国产方案上桌了

天下苦CUDA久矣,又一国产方案上桌了

国产算力基建跑了这么多年,大家最关心的逻辑一直没变:芯片够不够多?但对开发者来说,真正扎心的问题其实是:好不好使?

来自主题: AI资讯
6948 点击    2026-01-31 12:27
顶尖模型离“科学家”还差得远?AI4S亟待迈向2.0时代

顶尖模型离“科学家”还差得远?AI4S亟待迈向2.0时代

顶尖模型离“科学家”还差得远?AI4S亟待迈向2.0时代

周伯文还详细介绍了上海 AI 实验室近年来开展的前沿探索与实践,包括驱动 “通专融合” 发展的技术架构 ——“智者”SAGE(Synergistic Architecture for Generalizable Experts),其包含基础、融合与进化三个层次,并可双向循环实现全栈进化;支撑 AGI4S 探索的两大基础设施“书生”科学多模态大模型 Intern-S1、“

来自主题: AI资讯
9432 点击    2026-01-30 19:13
LLM-in-Sandbox:给大模型一台电脑,激发通用智能体能力

LLM-in-Sandbox:给大模型一台电脑,激发通用智能体能力

LLM-in-Sandbox:给大模型一台电脑,激发通用智能体能力

大模型的能力正在被不同的范式逐步解锁:In-Context Learning 展示了模型无需微调即可泛化到新任务;Chain-of-Thought 通过引导模型分步推理来提升复杂问题的求解能力;近期,智能体框架则赋予模型调用工具、多轮交互的能力。

来自主题: AI技术研报
10010 点击    2026-01-30 16:05
大模型学会拖进度条看视频了!阿里新研究让视频推理告别脑补,实现证据链思考 | ICLR 2026

大模型学会拖进度条看视频了!阿里新研究让视频推理告别脑补,实现证据链思考 | ICLR 2026

大模型学会拖进度条看视频了!阿里新研究让视频推理告别脑补,实现证据链思考 | ICLR 2026

为什么让多模态大模型“一步一步思考”(”Let’s think step by step”)来回答视频问题,效果有时甚至还不如让它“直接回答”?

来自主题: AI技术研报
8942 点击    2026-01-30 09:56
先建“语义基座”,再谈运维智能!阿里云以 Operation Intelligence 定义 AIOps 新范式

先建“语义基座”,再谈运维智能!阿里云以 Operation Intelligence 定义 AIOps 新范式

先建“语义基座”,再谈运维智能!阿里云以 Operation Intelligence 定义 AIOps 新范式

大模型的出现,给许多行业带来了颠覆性的改变,运维这个向来被视为稳定、保守的领域也不例外。虽然“AIOps”这个概念早在 2016 年由 Gartner 提出,但早期的智能运维更多是利用大数据和机器学习对传统运维流程进行效率上的提升。

来自主题: AI资讯
7703 点击    2026-01-29 15:21
Agent学会“预测同伴”,神经网络里涌现出了类社会位置细胞

Agent学会“预测同伴”,神经网络里涌现出了类社会位置细胞

Agent学会“预测同伴”,神经网络里涌现出了类社会位置细胞

近日,香港城市大学博士生方政儒和所在团队让一群智能体在虚拟迷宫里共同探索,只给它们一个极其简单的目标——那就是学会预测同伴下一秒会看到什么以及会走到哪里。结果发现这些智能体不仅学会了高效合作,还在自己的“大脑”里自发形成了类似动物大脑中的“地图细胞”,甚至发明了一套只有它们才懂的秘密语言。

来自主题: AI资讯
9445 点击    2026-01-29 14:57
JustGRPO:扩散语言模型的极简主义回归

JustGRPO:扩散语言模型的极简主义回归

JustGRPO:扩散语言模型的极简主义回归

扩散语言模型(Diffusion LLMs, dLLMs)因支持「任意顺序生成」和并行解码而备受瞩目。直觉上,打破传统自回归(AR)「从左到右」的束缚,理应赋予模型更广阔的解空间,从而在数学、代码等复杂任务上解锁更强的推理潜力。

来自主题: AI技术研报
10143 点击    2026-01-29 14:55