AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
填补空白!首个提升大模型工作流编排能力的大规模数据集开源

填补空白!首个提升大模型工作流编排能力的大规模数据集开源

填补空白!首个提升大模型工作流编排能力的大规模数据集开源

Manus 爆火出圈,引发 Agent 热潮!从自行理解任务、拆解步骤到选择工具并执行,这需要 Agent 具备强大的复杂工作流编排和任务处理能力,而工作流也是智能体的核心技术之一。

来自主题: AI技术研报
9969 点击    2025-03-12 14:18
砍掉99%采样成本!腾讯AI Lab提出大模型无监督训练新技术

砍掉99%采样成本!腾讯AI Lab提出大模型无监督训练新技术

砍掉99%采样成本!腾讯AI Lab提出大模型无监督训练新技术

只要微调模型生成的前8-32个词,就能让大模型推理能力达到和传统监督训练一样的水平?

来自主题: AI技术研报
7912 点击    2025-03-12 13:41
DeepSeek事件「慢思考」——论开源创新的战略价值兼评美国AI扩散框架新规

DeepSeek事件「慢思考」——论开源创新的战略价值兼评美国AI扩散框架新规

DeepSeek事件「慢思考」——论开源创新的战略价值兼评美国AI扩散框架新规

乙巳新春,中国的推理大模型DeepSeek R1火爆全球。作为一款在推理能力上媲美OpenAI的o1且收费标准远低于o1的国产大模型,DeepSeek一时间在国内刮起一股扑面而来的全民AI风潮,并不令人意外,但这款来自大厂体系外创业团队的开源大模型,经由数位外国商界领袖与技术大佬口碑相传并最终形成在外国新闻媒体上“刷屏”的效果,则是非常耐人寻味了。

来自主题: AI监管政策
11309 点击    2025-03-11 23:53
1000 token/s的「扩散LLM」凭什么倒逼AI走出舒适区?

1000 token/s的「扩散LLM」凭什么倒逼AI走出舒适区?

1000 token/s的「扩散LLM」凭什么倒逼AI走出舒适区?

ChatGPT 平地一声雷,打乱了很多人、很多行业的轨迹和节奏。这两年模型发布的数量更是数不胜数,其中文本大模型就占据了 AIGC 赛道的半壁江山。关注我的家人们永远都是抢占 AI 高地的冲锋者。

来自主题: AI技术研报
8696 点击    2025-03-11 11:36
从DeepSeek聊到AGI,Lex Fridman这期播客值得一听——投资笔记第208期

从DeepSeek聊到AGI,Lex Fridman这期播客值得一听——投资笔记第208期

从DeepSeek聊到AGI,Lex Fridman这期播客值得一听——投资笔记第208期

一期长达5小时的播客,究竟谁在听?MIT人工智能研究员、知名播客主持人及科技传播者Lex Fridman的对谈节目《Lex Fridman Podcast》近期推出了有关DeepSeek的一期内容: 截至3月7日,这一期节目在YouTube上获得了178万播放量和2.5万like(点赞),对DeepSeek所代表的AI大模型革新的解读,获得了大量科技界、商界从业者的关注。

来自主题: AI资讯
7568 点击    2025-03-11 09:42
已节省数百万GPU小时!字节再砍MoE训练成本,核心代码全开源

已节省数百万GPU小时!字节再砍MoE训练成本,核心代码全开源

已节省数百万GPU小时!字节再砍MoE训练成本,核心代码全开源

字节对MoE模型训练成本再砍一刀,成本可节省40%! 刚刚,豆包大模型团队在GitHub上开源了叫做COMET的MoE优化技术。

来自主题: AI技术研报
7871 点击    2025-03-10 21:57