AI资讯新闻榜单内容搜索-MoR

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: MoR
「有望成为Transformer杀手」,谷歌DeepMind新架构MoR实现两倍推理速度

「有望成为Transformer杀手」,谷歌DeepMind新架构MoR实现两倍推理速度

「有望成为Transformer杀手」,谷歌DeepMind新架构MoR实现两倍推理速度

大型语言模型已展现出卓越的能力,但其部署仍面临巨大的计算与内存开销所带来的挑战。随着模型参数规模扩大至数千亿级别,训练和推理的成本变得高昂,阻碍了其在许多实际应用中的推广与落地。

来自主题: AI技术研报
5322 点击    2025-07-18 11:58
Transformer终结者!谷歌DeepMind全新MoR架构问世,新一代魔王来了

Transformer终结者!谷歌DeepMind全新MoR架构问世,新一代魔王来了

Transformer终结者!谷歌DeepMind全新MoR架构问世,新一代魔王来了

Transformer杀手来了?KAIST、谷歌DeepMind等机构刚刚发布的MoR架构,推理速度翻倍、内存减半,直接重塑了LLM的性能边界,全面碾压了传统的Transformer。网友们直呼炸裂:又一个改变游戏规则的炸弹来了。

来自主题: AI技术研报
7326 点击    2025-07-17 17:00
大模型「越用越快」!SpeedupLLM首次验证,大降56%推理预算

大模型「越用越快」!SpeedupLLM首次验证,大降56%推理预算

大模型「越用越快」!SpeedupLLM首次验证,大降56%推理预算

LLM用得越久,速度越快!Emory大学提出SpeedupLLM框架,利用动态计算资源分配和记忆机制,使LLM在处理相似任务时推理成本降低56%,准确率提升,为AI模型发展提供新思路。

来自主题: AI技术研报
4648 点击    2025-07-10 12:30
不再担心AI“健忘”,北邮团队开源大模型记忆操作系统

不再担心AI“健忘”,北邮团队开源大模型记忆操作系统

不再担心AI“健忘”,北邮团队开源大模型记忆操作系统

随着大模型应用场景的不断拓展,其在处理长期对话时逐渐暴露出的记忆局限性日益凸显,主要表现为固定长度上下文窗口导致的“健忘”问题。

来自主题: AI资讯
7886 点击    2025-06-18 16:32
深度|吴恩达:语音是一种更自然、更轻量的输入方式,尤其适合Agentic应用;未来最关键的技能,是能准确告诉计算机你想要什么

深度|吴恩达:语音是一种更自然、更轻量的输入方式,尤其适合Agentic应用;未来最关键的技能,是能准确告诉计算机你想要什么

深度|吴恩达:语音是一种更自然、更轻量的输入方式,尤其适合Agentic应用;未来最关键的技能,是能准确告诉计算机你想要什么

我们常把LangGraph、RAG、memory、evals等工具比作乐高积木,经验丰富的人知道如何搭配使用,就能迅速解决问题

来自主题: AI资讯
6419 点击    2025-06-17 10:24
Agent不长记性咋整?试试G-Memory,可进化的有组织“集体大脑”

Agent不长记性咋整?试试G-Memory,可进化的有组织“集体大脑”

Agent不长记性咋整?试试G-Memory,可进化的有组织“集体大脑”

自Agent火了以后,有关"记忆"的框架如雨后春笋般涌现,但绝大多数仍是为"单兵作战"设计,难以适应需要复杂协作、信息交互量暴增10倍的多智能体系统(MAS)

来自主题: AI资讯
7247 点击    2025-06-16 09:48
华人团队 Genspark 被 Claude 选入优秀案例

华人团队 Genspark 被 Claude 选入优秀案例

华人团队 Genspark 被 Claude 选入优秀案例

AI 搜索 Agent 产品 Genspark 近期被 Anthropic 官方点名了。「Less structure, more intelligence.」是 AI 搜索 Agent 产品 Genspark 一直以来坚持的基本原则。Genspark 团队认为,过度结构化的工作流程会限制创造力和深度,赋予专业 Agent 更多自主权,自由选择并灵活运用多种工具来处理问题,反而能释放出更强的能力。

来自主题: AI资讯
3834 点击    2025-06-12 19:06