AI资讯新闻榜单内容搜索-小模型

小模型层数好玄学：12/32/64层效果好，16/24/48/层效果糟

小模型身上的“秘密”这下算是被扒光了！

来自主题: AI技术研报

7965 点击 2026-01-12 10:30

一口气集齐老黄苏妈英特尔，还得是AI，还得是联想

联想给出的公式是，混合AI=个人智能+企业智能+公共智能。这种模式下，AI智能体应用不再依赖于单一的云端模型，而是云端大模型与本地定制化小模型的深度融合。

来自主题: AI资讯

8971 点击 2026-01-09 14:41

信息论证明，小模型跑在本地才是Agent的终极解法｜斯坦福重磅

在近一年里，Agentic System（代理系统/智能体系统）正变得无处不在。从Open AI的Deep Research到Claude Code，我们看到越来越多的系统不再依赖单一模型，而是通过多模型协作来完成复杂的长窗口任务。

来自主题: AI技术研报

9048 点击 2026-01-04 10:20

独家 | 清华00后博士融资数千万，打造全球现象级端侧算力引擎，性能领跑行业

。过去的行业共识是：端侧只能跑小模型，性能与体验必须妥协；真正的能力仍得依赖云端最强模型。万格智元要打破的，正是这条旧认知。公司正在打造的cPilot端侧算力引擎，选择了一条更难、却更接近未来的路径：通过自研的非GPU推理引擎，让300亿、500亿等超大模型在性能有限制的消费硬件上高效推理

来自主题: AI资讯

10660 点击 2025-12-26 15:49

「背叛」Scaling Law？Transformer作者撬动美国开源AI革命，Essential AI Labs开源Rnj-1模型

AI不应是巨头游戏，模型也不是越大越聪明。近日，「Transformer八子」中的Ashish Vaswani和Parmar共同推出了一个8B的开源小模型，剑指Scaling Law软肋，为轻量化、开放式AI探索了新方向。

来自主题: AI资讯

8679 点击 2025-12-20 10:31

8B模型任务击败GPT-5？阶跃星辰开源Deep Think新框架，小模型解锁百万Token测试时计算

8B 模型在数学竞赛任务上超越 GPT-5！

来自主题: AI技术研报

10372 点击 2025-12-15 14:54

Jina-VLM：可在笔记本上跑的多语言视觉小模型

今天我们正式发布 Jina-VLM，这是一款 2.4B 参数量的视觉语言模型（VLM），在同等规模下达到了多语言视觉问答（Multilingual VQA）任务上的 SOTA 基准。Jina-VLM 对硬件需求较低，可在普通消费级显卡或 Macbook 上流畅运行。

来自主题: AI资讯

8427 点击 2025-12-09 14:48

6B文生图模型，上线即登顶抱抱脸

6B小模型，首日下载量高达50万次，上线不到两天直接把HuggingFace两个榜单都冲了个第一。

来自主题: AI技术研报

7404 点击 2025-12-01 15:13

NeurIPS 2025 | 英伟达发布Nemotron-Flash：以GPU延迟为核心重塑小模型架构

导读过去两年，小语言模型（SLM）在业界备受关注：参数更少、结构更轻，理应在真实部署中 “更快”。但只要真正把它们跑在 GPU 上，结论往往令人意外 —— 小模型其实没有想象中那么快。

来自主题: AI技术研报

8335 点击 2025-12-01 10:09

念首诗，就能让AI教你造核弹！Gemini 100%中招

最新研究发现，只要把恶意指令写成一首诗，就能让Gemini和DeepSeek等顶尖模型突破安全限制。这项针对25个主流模型的测试显示，面对「诗歌攻击」，百亿美金堆出来的安全护栏瞬间失效，部分模型的防御成功率直接归零。最讽刺的是，由于小模型「读不懂」诗里的隐喻反而幸免于难，而「有文化」的大模型却因为过度解读而全线破防。

来自主题: AI资讯

8809 点击 2025-11-25 15:31