AI资讯新闻榜单内容搜索-不

ICCV 2025 | 扩散模型生成手写体文本行的首次实战，效果惊艳还开源

AI 会写字吗？在写字机器人衍生换代的今天，你或许并不觉得 AI 写字有多么困难。

来自主题: AI技术研报

8373 点击 2025-10-21 09:58

AI视频领域杀疯了！发布Vidu Q2图生视频不到2周，Vidu又又又更新了，而且直接甩出三张王牌。首先是AI创作者们等待良久的Vidu Q2参考生功能终于要正式发布了。此外，Vidu视频延长功能一来就亮绝杀，最高可延长至五分钟。

来自主题: AI资讯

9117 点击 2025-10-21 09:49

今天，网络文学行业面临着一个根本性问题：对于文学创作，AI 未来究竟是创作者，还是工具？10 月 16 日，在武汉光谷举行的 2025 阅文创作大会上，成立十周年的阅文给出了一个清晰而审慎的答案。会上，阅文密集发布了三款 AI 应用：「妙笔通鉴」、「版权助手」和「漫剧助手」。

来自主题: AI资讯

10038 点击 2025-10-20 15:43

随着大型语言模型（LLM）朝着通用能力迈进，并以通用人工智能（AGI）为最终目标，测试其生成问题的能力也正变得越来越重要。尤其是在将 LLM 应用于高级编程任务时，因为未来 LLM 编程能力的发展和经济整合将需要大量的验证工作。

来自主题: AI技术研报

8804 点击 2025-10-20 15:13

多模态大模型在根据静态截图生成网页代码（Image-to-Code）方面已展现出不俗能力，这让许多人对AI自动化前端开发充满期待。

来自主题: AI技术研报

8330 点击 2025-10-20 14:57

在机器人学习领域，提升基于生成式模型的控制策略（Policy）的性能通常意味着投入巨额成本进行额外的数据采集和模型训练，这极大地限制了机器人能力的快速迭代与升级。面对模型性能的瓶颈，如何在不增加训练负担的情况下，进一步挖掘并增强现有策略的潜力？

来自主题: AI技术研报

8114 点击 2025-10-20 14:52

1.58bit量化，内存仅需1/10，但表现不输FP16？微软最新推出的蒸馏框架BitNet Distillation（简称BitDistill），实现了几乎无性能损失的模型量化。

来自主题: AI技术研报

7183 点击 2025-10-20 14:35

给全球六大LLM各发1万美金，丢进同一真实市场实盘厮杀，会发生什么？这场大战从18日开始，截止目前，DeepSeek V3.1盈利超3500美元，Grok 4实力次之。不堪一提的是，Gemini 2.5 Pro成为赔得最惨的模型。

来自主题: AI资讯

10336 点击 2025-10-20 14:04

近日，来自阿联酋穆罕默德·本·扎耶德人工智能大学 MBZUAI 和保加利亚 INSAIT 研究所的研究人员发现一个针对大模型单次推理的“法诺式准确率上限”，借此不仅揭示了单次生成范式的根本性脆弱点，也揭示了“准确率悬崖”这一现象。

来自主题: AI技术研报

8804 点击 2025-10-20 14:02

Meta开源DepthLM，首证视觉语言模型无需改架构即可媲美纯视觉模型的3D理解能力。通过视觉提示、稀疏标注等创新策略，DepthLM精准完成像素级深度估计等任务，解锁VLM多任务处理潜力，为自动驾驶、机器人等领域带来巨大前景。

来自主题: AI技术研报

8138 点击 2025-10-20 12:19