
全网都在等梁文锋
全网都在等梁文锋这组充满悬念的组合引发科技圈热议,业内普遍推测DeepSeek R2模型已进入发布倒计时。凤凰网科技从知情人士处获悉,目前网传信息的真实性含量很低。
这组充满悬念的组合引发科技圈热议,业内普遍推测DeepSeek R2模型已进入发布倒计时。凤凰网科技从知情人士处获悉,目前网传信息的真实性含量很低。
Mona(Multi-cognitive Visual Adapter)是一种新型视觉适配器微调方法,旨在打破传统全参数微调(full fine-tuning)在视觉识别任务中的性能瓶颈。
现如今,微调和强化学习等后训练技术已经成为提升 LLM 能力的重要关键。
其实……不用大段大段思考,推理模型也能有效推理!
近日,美国 AI 初创公司 Anthropic(Claude 背后公司)就美国商务部的《人工智能扩散框架》临时最终规则提交意见书,呼吁加强对高端AI 芯片的出口控制。更具争议性的是,Anthropic 在博客中声称,中国已建立起高度成熟的芯片走私网络,涉及金额高达数亿美元。
Anthropic 刚推出了 Integrations 和 Advanced Research 模式更新。这不仅是 Claude 在 DeepResearch 发展历程中的关键里程碑,更是 AI 协作和研究领域的一次重大飞跃
“与AI健康APP签订长寿协议?”这或许听起来不可思议,但确实是AI健康应用Cudis在海外抛出的最新概念。2024年9月,Cudis获得了由Draper Associates领投的500万美元种子资金,同年12月,其推出了一款官方定价为349美元的智能戒指Cudis 002。
这段时间 “Agent” 成了热词,开会、聊天、朋友圈,大家都在聊。但每个人说的 “Agent” 其实都不一样,听多了反而更迷糊:究竟什么是 Agent?和我们熟悉的生成式 AI 有什么不同?这是我目前见过最清晰解释 Agent 的文章。
当AI闯入营销界,会掀起怎样的风暴?哥大辍学天才Kennan打造的Icon,以1美元成本颠覆6000亿广告市场,30天狂揽500万美元ARR,用技术改写行业。
最近,Google 官方发布了一份长达 69 页的【Prompt Engineering 白皮书】,可以说是目前最系统、最权威的“AI 沟通指南”了。我们也是第一时间翻译好了这本书,准备【免费】送给大家!
本周国内 AI 智能体市场依旧精彩纷呈,短短几天内多款智能体产品新推出市场,其中尤以Fellou和扣子空间最受关注。有意思的是,虽然这两个智能体产品的架构和定位截然不同,产品团队更有天壤之别,但由于操作界面类似,因此作为像我这样的普通用户而言,在体验前是很难说出两者的区别在什么地方。
4月29日,智元机器人联合创始人兼首席技术官彭志辉,在上海“模速空间”汇报了智元机器人为代表的中国具身智能技术。 彭志辉在汇报中提到了智元机器人把人工智能和机器人技术融合创新,让机器人拥有了“大脑”,会利用人类动作视频来学习,已经学会了一些基本技能,比如自主擦桌子、倒茶、叠衣服等。 作
DeepSeek放大招!新模型专注数学定理证明,大幅刷新多项高难基准测试。在普特南测试上,新模型DeepSeek-Prover-V2直接把记录刷新到49道。目前的第一名在657道题中只做出10道题,为Kimi与AIME2024冠军团队Numina合作成果Kimina-Prover。
原本的我:我把话撂这儿了,就是DeepSeek R2来了,我都不更!有事假期结束再说。 看完豆包Case的我:哎嘿真香~不是我卷朋友们,实在是它这波真的很强,非常强,4o在我这里暂时都没那么香了。废话咱就不多说了,还是先简介然后上案例!
4月29日,习近平总书记在上海考察时,在中共中央政治局委员、上海市委书记陈吉宁和市长龚正陪同下,来到位于徐汇区的上海“模速空间”大模型创新生态社区调研。
刚刚,LMArena陷入了巨大争议,斯坦福MIT和Ai2等的研究者联手发论文痛斥,这个排行榜已经被Meta等公司利用暗中操作排名!Karpathy也下场帮忙锤了一把。而LMArena官方立马回应:论文存在多处错误,指控不实。
2025年4月29日凌晨,距离通义千问Qwen3正式发布还有5小时,X和GitHub上的开发者们已经搬好小板凳蹲守发布。开源社区的技术爱好者们熬夜刷新,等待第一时间测试和体验这款备受期待的中国大模型新作。
来自英伟达和UIUC的华人团队提出一种高效训练方法,将LLM上下文长度从128K扩展至惊人的400万token SOTA纪录!基于Llama3.1-Instruct打造的UltraLong-8B模型,不仅在长上下文基准测试中表现卓越,还在标准任务中保持顶尖竞争力。
我又发现好东西了!前几天在 Artificial Analysis 上发现了一个新模型:17B 参数的国产模型 HiDream-I1排到第二名,和 GPT-4o 得分非常接近!
每年毕业季,翟天临都会被拉出来“鞭尸”,眼看查重标准变得越来越严格,准毕业生们一个个都带上了痛苦面具。“到底是谁发表了我的论文!”不过今年除了往年经常讨论的查重率,又多了一个新的AIGC查重,这对于正在查重降重的学生们来说,无疑又是一个新的噩耗。
就在刚刚,DeepSeek-Prover-V2技术报告也来了!34页论文揭秘了模型的训练核心——递归+强化学习,让数学推理大提升。有人盛赞:DeepSeek已找到通往AGI的正确路径!
由智谱和清华大学联合举办的“地狱级”黑客松 -《2024金融行业·大模型挑战赛》。该黑客松颇为艰困,完全复刻了金融行业二级市场的真实需求。而经过数月奋战,我,作为一名金融市场“门外汉”,在1300+名选手中“杀出一条血路”,最终获得了全国第七名以及10,000元的奖金。
近日,以色列宣布与以色列AI“数字化身”制作平台eSelf、以色列最大的K12教科书出版商CET(Center for Educational Technology)合作,在全国范围内铺开AI辅导。
渤海湾畔,天津空港经济区内,春风正轻拂天津市第一中学滨海学校(以下简称为「天津一中滨海学校」)。在这座雅名「葵园」的学校里,师生们正雀跃着走进两间由联想开天打造的「未来教室」,「信创+AI」教育的全新生态,也在春日中悄然萌发。
宇曜科技Matter-seek:用AI重构材料科学研发新范式。在高端制造领域,新材料研发的滞后性正成为制约产业升级的隐形瓶颈——光刻胶、航空发动机高温合金等核心材料长期依赖进口,单一材料研发周期动辄十年起步,失败率居高不下。宇曜(北京)科技有限公司推出的Matter-seek人工智能新材料研发平台,正试图用“数据引擎+层级神经网络”的技术组合,打破这一僵局。
北京时间4月29日,据《华尔街日报》报道,OpenAI CEO萨姆·奥特曼(Sam Altman)曾表示,OpenAI与微软拥有堪称“科技界最好的合作关系”。然而,这段硅谷“联姻”已经岌岌可危。
连证件照都能在家用AI搞定,介么不是魔法嘛!这就是Aragon AI,一款利用AI生成专业证件照的软件,让人不出家门就能得到逼真的证件照。
Meta首届LlamaCon开发者大会开幕,扎克伯格在期间接受采访,回应大模型相关的一切。包括Llama4在大模型竞技场表现不佳的问题:
可灵的下一步:优先保证模型效果、聚焦专业生产者做渗透。,快手在今日成立了可灵 AI 事业部。该事业部下设可灵 AI 产品部、运营部和技术部,负责可灵、可图等系列大模型业务,快手高级副总裁盖坤担任可灵 AI 事业部负责人,继续兼任社区科学线负责人。
想象一下,你的智能体只需接收一条自然语言指令,就能在 600+ 工具中自动筛选出最合适的 API 组合来完成整个任务流程,无需逐个集成、无需硬编码。这不再是未来畅想,而是 ACI.dev 开源 MCP 中枢(Unified MCP Server)已经实现的现实。