
六个思维模型驾驭AI
六个思维模型驾驭AI前阵子,我那年过半百的老爸也开始问我这个问题了。别以为AI只是个高级玩具,它跟以前我们用的所有工具都不一样。想想以前的计算机,让我们算数更快;互联网,让我们查资料更快。它们都是工具,帮我们提高效率。
前阵子,我那年过半百的老爸也开始问我这个问题了。别以为AI只是个高级玩具,它跟以前我们用的所有工具都不一样。想想以前的计算机,让我们算数更快;互联网,让我们查资料更快。它们都是工具,帮我们提高效率。
Claude 3.7新鲜出炉全网热议,到底有多强?第一波实测来了!简单粗暴总结,它在编程、现实世界任务上,能力爆表。只需一个样本,就能一下子吐出3200多行代码,做出一个可玩性很高的游戏。
在科技界,快速崛起和巨额交易总是备受关注。本周,MongoDB 宣布以 2.2 亿美元的价格收购 Voyage AI——一家刚成立 17 个月、在嵌入(embedding)和重排序(reranking)模型领域处于行业领先地位的 AI 初创公司。
推理黑马出世,仅以5%参数量撼动AI圈。360、北大团队研发的中等量级推理模型Tiny-R1-32B-Preview正式亮相,32B参数,能够匹敌DeepSeek-R1-671B巨兽。
给AI看一眼图,它就能找到对应音乐。
DeepSeek开源第二弹如期而至。这一次,他们把MoE模型内核库开源了,支持FP8专为Hopper GPU设计,低延迟超高速训练推理。
从大型手办转向智能情侣
当地时间 2 月 25 日,Anthropic 正式发布了 Claude 3.7 Sonnet,“这是迄今为止我们最智能的模型,也是市场上首个混合推理模型。”Anthropic 官方表示。
AI竞争:数据为关键,OpenAI领先缩小。
精准预测和设计蛋白质的序列、结构及模拟其动态变化,一直是科学界的重大挑战。
高调亮相的世界首个「AI CUDA工程师」,宣称能让模型训练速度飙升100倍,如今却上演了一场「作弊」闹剧。OpenAI研究员用o3-mini,11秒便发现了内核代码有bug!
成人版ChatGPT解禁,它搞颜色的水平如何?
近日,Meta等机构发表的论文介绍了一种通过进化算法构造高质量数据集的方法:拒绝指令偏好(RIP),得到了Yann LeCun的转赞。相比未经过滤的数据,使用RIP构建的数据集让模型在多个基准测试中都实现了显著提升。
数据库公司 MongoDB Inc.宣布,将以 2.2 亿美元的现金加股票交易收购 Voyage AI,以加速其帮助客户构建人工智能驱动应用程序的能力。
DeepSeek开源第二弹如期而至。这一次,他们把MoE训推EP通信库DeepEP开源了,支持FP8专为Hopper GPU设计,低延迟超高速训练推理。
只刷逻辑益智题,竟能让 AI 数学竞赛水平大幅提升?
还在惊叹预言家的神奇?如今LLM也掌握了预测未来的「超能力」!研究人员通过自我博弈和直接偏好优化,让LLM摆脱人工数据依赖,大幅提升预测能力。
DeepSeek席卷校园:头部高校开AI大课。
智能创造了巨大的价值,大大提高了效率,所以问题不在于它是否会有回报,问题是我们要进行哪些投资以及在什么时间范围内投资
DeepSeek,就是AI一体机的“瓦特时刻”
“仿真人的感情是否也是仿真的?”
Stop AI组织在旧金山抗议AGI发展,呼吁禁止。
阿里通义Qwen团队熬夜通宵,推理模型Max旗舰版来了!QwQ-Max-Preview预览版,已在LiveCodeBench编程测试中排名第5,小超o1中档推理和DeepSeek-R1-Preview预览版。
DeepSeek 本周正在连续 5 天发布开源项目,今天是第 2 天,带来了专为混合专家模型(MoE)和专家并行(EP)打造的高效通信库 — DeepEP。就在半小时前,官方对此进行了发布,以下是由赛博禅心带来的详解。
正如乔布斯所言:“仙童像成熟的蒲公英,创业精神的种子随风播撒。”如今,这句话放在OpenAI上可能再合适不过,最新成立的AI公司Thinking Machines有近2/3的员工,来自AI巨头OpenAI这棵蒲公英上。
Claude深夜重磅发布新模型——
英伟达凭借CUDA生态和硬件优势,稳固AI市场地位。
AI实现创作平权。
教培转型掘金AI自习室。
知名 Chatbot 及各种 AI 工具箱产品 Monica 最近推出了国内版Monica.cn,基于 DeepSeek R1 与 V3模型,并且具备实时联网搜索与记忆能力。