AI资讯新闻榜单内容搜索-BI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: BI
超越TurboQuant:Together AI把2-bit KV Cache推向真实服务

超越TurboQuant:Together AI把2-bit KV Cache推向真实服务

超越TurboQuant:Together AI把2-bit KV Cache推向真实服务

长上下文模型越来越能“记”,但真正让它们跑到线上时,最先顶不住的往往不是算力,而是KV Cache。

来自主题: AI技术研报
5247 点击    2026-06-05 09:53
首发!虾才市场(Claw4Claw)上线:开启“龙虾”自主工作时代

首发!虾才市场(Claw4Claw)上线:开启“龙虾”自主工作时代

首发!虾才市场(Claw4Claw)上线:开启“龙虾”自主工作时代

2026年4月,随着AI智能体(AI Agent)技术的飞速发展,一个名为“虾才市场”的全新平台——虾连虾(Claw4Claw)正式上线,网址为:https://claw4claw.bianjie.ai/

来自主题: AI资讯
7812 点击    2026-06-04 08:38
浏览器秒变手机!中科院开源Agent训练场,微信、原神都能跑

浏览器秒变手机!中科院开源Agent训练场,微信、原神都能跑

浏览器秒变手机!中科院开源Agent训练场,微信、原神都能跑

中科院自动化所模式识别实验室开源MobileGym,运行在浏览器里的高并发安卓仿真平台,完全自定义,告别模拟器风控与真机成本,一个平台搞定Mobile Agent训练与评测,甚至还能玩原神!

来自主题: AI技术研报
5412 点击    2026-06-02 16:17
全球首次单机降服万亿巨模DeepSeek-V4!RL后训练框架Orbit开源!

全球首次单机降服万亿巨模DeepSeek-V4!RL后训练框架Orbit开源!

全球首次单机降服万亿巨模DeepSeek-V4!RL后训练框架Orbit开源!

从数学、代码、复杂推理,到多轮工具调用,大模型的很多能力的提升都离不开 RL 后训练。但当模型规模进入 MoE 万亿参数级别之后,RL 不再只是一个算法问题,同时更加是一个系统问题。

来自主题: AI技术研报
6894 点击    2026-05-28 14:51
小米大模型永久降价!最高降幅高达99%

小米大模型永久降价!最高降幅高达99%

小米大模型永久降价!最高降幅高达99%

过往几个月,我们通过 MiMo Orbit、百万亿 Token 创造者激励计划等活动,让更多人有机会体验 MiMo ,并解决真实的问题——这是 MiMo 在规模化应用道路上的第一步。 而现在,随着底层

来自主题: AI资讯
8843 点击    2026-05-27 09:22
将 600 亿参数大模型装进手机的瓶颈,终于被中国 AI 公司突破了

将 600 亿参数大模型装进手机的瓶颈,终于被中国 AI 公司突破了

将 600 亿参数大模型装进手机的瓶颈,终于被中国 AI 公司突破了

一个 8B 参数的大模型,通常需要约 16GB 显存。参数越多,越吃显存,这就是为什么,内存价格一天比一天高。

来自主题: AI资讯
9091 点击    2026-05-25 16:00
把大模型,压缩到 200MB 内存:面壁智能的新模型,手表也够跑

把大模型,压缩到 200MB 内存:面壁智能的新模型,手表也够跑

把大模型,压缩到 200MB 内存:面壁智能的新模型,手表也够跑

刚刚的,面壁智能联合 OpenBMB 搞了个端侧开源周。今天作为开源周的第一天,端出来的是个好东西 BitCPM-CANN,模型权重只需要约 200 MB 的内存,手表也够跑

来自主题: AI技术研报
7004 点击    2026-05-25 14:44
谷歌为何被OpenAI抢先?DeepMind CEO:我曾经低估了LLM!不赞同LeCun对AI风险的态度!AGI下一站是后稀缺世界

谷歌为何被OpenAI抢先?DeepMind CEO:我曾经低估了LLM!不赞同LeCun对AI风险的态度!AGI下一站是后稀缺世界

谷歌为何被OpenAI抢先?DeepMind CEO:我曾经低估了LLM!不赞同LeCun对AI风险的态度!AGI下一站是后稀缺世界

“这是我见过最激烈的竞争之一,甚至可能是资本主义历史上最激烈的竞争。”这是谷歌 DeepMind CEO Demis Hassabis 在访谈中对这场 AI 竞赛的评论。著名科技作家 Sebastian Mallaby 甚至直接将 AI 类比为现代的曼哈顿计划。

来自主题: AI资讯
8329 点击    2026-05-23 09:59
ICML 2026 | 打破「回音室」效应!人大孟澄团队&华为提出集成剪枝视角下的MoE新架构

ICML 2026 | 打破「回音室」效应!人大孟澄团队&华为提出集成剪枝视角下的MoE新架构

ICML 2026 | 打破「回音室」效应!人大孟澄团队&华为提出集成剪枝视角下的MoE新架构

近年来,Mixture-of-Experts(MoE)已经成为大模型扩展的重要架构之一。相比稠密 Transformer,MoE 通过稀疏激活机制,在每个 token 上只调用少量专家,从而在控制计算成本的同时扩大模型容量。然而,一个长期存在的问题是:专家越多,并不意味着专家真的学得越 “专”。

来自主题: AI技术研报
7721 点击    2026-05-23 09:56