AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: 模型
YOLO已经悄悄来到v12,首个以Attention为核心的YOLO框架问世

YOLO已经悄悄来到v12,首个以Attention为核心的YOLO框架问世

YOLO已经悄悄来到v12,首个以Attention为核心的YOLO框架问世

YOLO 系列模型的结构创新一直围绕 CNN 展开,而让 transformer 具有统治优势的 attention 机制一直不是 YOLO 系列网络结构改进的重点。这主要的原因是 attention 机制的速度无法满足 YOLO 实时性的要求。

来自主题: AI技术研报
8005 点击    2025-02-22 14:14
一次推理解决复合问题:基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA

一次推理解决复合问题:基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA

一次推理解决复合问题:基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA

在大语言模型领域中,预训练 + 微调范式已经成为了部署各类下游应用的重要基础。在该框架下,通过使用搭低秩自适应(LoRA)方法的大模型参数高效微调(PEFT)技术,已经产生了大量针对特定任务、可重用的 LoRA 适配器。

来自主题: AI技术研报
6771 点击    2025-02-22 13:57
牵手顶级大三甲,华为的AI医疗野心藏不住了!

牵手顶级大三甲,华为的AI医疗野心藏不住了!

牵手顶级大三甲,华为的AI医疗野心藏不住了!

2月18日,上海交通大学医学院附属瑞金医院举办了“2025医疗人工智能与精准诊疗发展论坛”,瑞金医院携手华为共同发布瑞智病理大模型RuiPath。

来自主题: AI资讯
8227 点击    2025-02-22 13:20
生物版 Deepseek 来了!史上最大开源 AI 生物学模型,400 亿参数引爆学界

生物版 Deepseek 来了!史上最大开源 AI 生物学模型,400 亿参数引爆学界

生物版 Deepseek 来了!史上最大开源 AI 生物学模型,400 亿参数引爆学界

生物学大模型又迎新里程碑!2025 年 2 月 19 日,来自 Arc Institute、英伟达、斯坦福大学、加州大学伯克利分校和加州大学旧金山分校的科学家们,联合发布了生物学大模型 Evo2。

来自主题: AI资讯
7734 点击    2025-02-22 11:54
AI教育的“诺曼底时刻”:DeepSeek如何重塑教育生态?

AI教育的“诺曼底时刻”:DeepSeek如何重塑教育生态?

AI教育的“诺曼底时刻”:DeepSeek如何重塑教育生态?

“你家娃的寒假作业搞定了吗?”眼瞅着假期余额不足,家长们又开始在朋友圈里哀嚎:“作业还没写完!”没错,一年一度的“赶作业大战”又上演了,只不过今年,剧情有点不一样——娃们不再抓耳挠腮、苦哈哈地熬夜赶工,而是悄悄掏出了“神器”:DeepSeek等AI工具!

来自主题: AI资讯
6749 点击    2025-02-22 10:23
蚕食人类权力不用AGI降临!「温水煮青蛙」足以让AI渐进式失控

蚕食人类权力不用AGI降临!「温水煮青蛙」足以让AI渐进式失控

蚕食人类权力不用AGI降临!「温水煮青蛙」足以让AI渐进式失控

随着人工智能的加速发展,我们常常担心AI会突然失控、超越人类控制。然而,最新研究指出,这种「突然失控」的场景或许并非最令人担忧的;AI在各个领域逐步取代人类,导致人类权力和影响力的缓慢流失,可能才是更隐蔽、更难以应对的渐变式风险。

来自主题: AI技术研报
4813 点击    2025-02-21 16:24
谷歌超硬核教科书来了!Jeff Dean带货揭Gemini训练秘籍:在TPU上scaling

谷歌超硬核教科书来了!Jeff Dean带货揭Gemini训练秘籍:在TPU上scaling

谷歌超硬核教科书来了!Jeff Dean带货揭Gemini训练秘籍:在TPU上scaling

谷歌团队发布LLM硬核技术教科书,从「系统视图」揭秘LLM Scaling的神秘面纱。Jeff Dean强调书中藏着谷歌最强AI模型Gemini训练的更多信息。

来自主题: AI技术研报
9304 点击    2025-02-21 15:52
大模型扩展新维度:Scaling Down、Scaling Out

大模型扩展新维度:Scaling Down、Scaling Out

大模型扩展新维度:Scaling Down、Scaling Out

近年来, Scaling Up 指导下的 AI 基础模型取得了多项突破。从早期的 AlexNet、BERT 到如今的 GPT-4,模型规模从数百万参数扩展到数千亿参数,显著提升了 AI 的语言理解和生成等能力。然而,随着模型规模的不断扩大,AI 基础模型的发展也面临瓶颈:高质量数据的获取和处理成本越来越高,单纯依靠 Scaling Up 已难以持续推动 AI 基础模型的进步。

来自主题: AI技术研报
9303 点击    2025-02-21 15:43
机器人视觉控制新范式!ByteDance Research新算法实现通过性能SOTA

机器人视觉控制新范式!ByteDance Research新算法实现通过性能SOTA

机器人视觉控制新范式!ByteDance Research新算法实现通过性能SOTA

世界模型(World Model)作为近年来机器学习和强化学习的研究热点,通过建立智能体对其所处环境的一种内部表征和模拟,能够加强智能体对于世界的理解,进而更好地进行规划和决策。

来自主题: AI技术研报
6611 点击    2025-02-21 14:28