
告别Transformer!北大、北邮、华为开源纯卷积DiC:3x3卷积实现SOTA性能,比DiT快5倍!
告别Transformer!北大、北邮、华为开源纯卷积DiC:3x3卷积实现SOTA性能,比DiT快5倍!当整个 AI 视觉生成领域都在 Transformer 架构上「卷生卷死」时,一项来自北大、北邮和华为的最新研究却反其道而行之,重新审视了深度学习中最基础、最经典的模块——3x3 卷积。
当整个 AI 视觉生成领域都在 Transformer 架构上「卷生卷死」时,一项来自北大、北邮和华为的最新研究却反其道而行之,重新审视了深度学习中最基础、最经典的模块——3x3 卷积。
奥特曼宣布无限期推迟OpenAI开源模型发布。与此同时,竞争对手正高调上新,开源赛道硝烟四起。这次跳票不仅令开发者和科技爱好者失望,也让外界再次质疑OpenAI在「Open」与商业利益之间的身份撕裂与信任危机。
这是一个「卖身不卖队」的故事。Windsurf与Google的24亿美元交易细节曝光,创始人和精英团队分钱走人,数百名员工却被留在了一个即将被Google碾压的空壳公司里。
一起500万美元遗产欺诈案,就这样被ChatGPT揭露了?!相关帖子正在美版贴吧Reddit建起高楼。
马上周末了,分享一点轻松的内容给大家,放松放松 从贵州荔波县开车到广西天峨县一路上都在放周董的歌,边放边唱~《稻香》、《简单爱》、《枫》、《花海》、《暗号》、《爱在西元前》等几十首,我都超爱 刚刚停好车,就发现周董居然发布了他第一条抖音仅发布了5个小时,点赞已近700w(我预言今天应该会涨到千万赞)
中国有句古话,“三岁看大,七岁看老”——现在,AI技术把这句话变得更直观了。
你有没有想过,为什么硅谷的每个人都在想着用AI替代招聘官?风投们已经向那些承诺能完全自动化招聘过程的公司砸了数十亿美元,从AI简历筛选器到能独立面试的聊天机器人,再到声称能在无人干预情况下找到完美候选人的算法。
Grok 4 发出之后,风评非常两级。有人大喷特喷,觉得它又贵又不好用。有的则啧啧称神,断言「AGI 已经实现啦」。
随着大模型的崛起,AI编程领域正在发生翻天覆地的变化。各种编程大模型、编程工具涌现,通过自动补全代码、自动 debug 等实用的功能为开发者的日常工作提供极大便利,并在一定程度上提升了开发效率。
在这篇文章中,它详细展示了如何构建一个有效的多智能体研究系统,这是一个架构,其中主代理(The Lead Agent)会生成和协调子代理(Subagents),以并行方式探索复杂查询,内容涵盖系统架构、提示工程以及评估方法等。
雷峰网独家获悉,原EDA公司瞬曜电子创始团队正在二次创业,从上海迁移到深圳,创办AI硬件公司美好憧憬科技有限公司(以下简称美憬科技),团队成员包括胡晨辉、傅勇等人。
根据彭博社查阅的内部备忘录,Meta 已完成收购专注于语音技术的小型人工智能初创公司 PlayAI 的交易。
印度和巴基斯坦用 5 天时间告诉我们——当你的上游不给你放水时,除了干一仗没有别的选择。Cursor 最近上演了一场闹剧,偷偷摸摸又扭扭捏捏地涨价,在被用户集火以后又选择了滑跪道歉。
你有没有想过,传统的软件界面设计可能正在走向终结?当我听完 Cursor 设计主管 Ryo Lu 的这次访谈后,我意识到我们正站在一个历史性的转折点上。那些我们习以为常的界面元素——按钮、菜单、表单——可能即将被一种全新的交互方式所取代。
还在质疑AI生物制药「纸上谈兵」?Chai-2已经把抗体设计成功率从0.1%提升到16%,而且还是零样本!不仅是技术奇迹,这更是范式革命:下一代药神,可能不是生物学博士,而是提示词工程师。
在大模型狂飙的时代,AI 创业被裹挟进一种“技术正统性”的焦虑:要不要训练模型?有没有算力资源?底层自研是不是护城河?但 Yiran,一位本科学钢琴、靠一段自动发邮件脚本开启创业旅程的 00 后女性创业者,选择了另一种路径——她不训练模型,不押技术论文,而是把 AI 做成一个真正能“成事”的销售助理。
AI 终于可以当「第一作者」了。斯坦福大学近日宣布,将于 2025 年举办一个史无前例的学术会议 —— 科学 AI 智能体开放会议(Agents4Science 2025),全称 Open Conference of AI Agents for Science。 它的投稿要求堪称颠覆:第一作者必须是 AI。
今年最火的视频 AI 视频模型 Veo3 ,最近又迎来更新,能让图片开口说话了。Google CEO Sundar Pichai 发 X 说,自从五月 Google 开发者大会以来,用户已经使用 Veo 3 创建了超过 4000 万的视频。
近年来,多模态大模型(MLLMs)发展迅猛,从看图说话到视频理解,似乎无所不能。
华南理工大学计算机学院AI安全团队长期深耕于人工智能安全,近期联合约翰霍普金斯大学和加州大学圣地亚戈分校聚焦于联邦学习中防范恶意投毒攻击,产出工作连续发表于AI顶刊TPAMI 2025和网络安全顶刊TIFS 2025。
最近,Mamba 作者之一 Albert Gu 又发新研究,他参与的一篇论文《 Dynamic Chunking for End-to-End Hierarchical Sequence Modeling 》提出了一个分层网络 H-Net,其用模型内部的动态分块过程取代 tokenization,从而自动发现和操作有意义的数据单元。
随着 OpenAI 推出 GPT-4o 的图像生成功能,AI 生图能力被拉上了一个新的高度,但你有没有想过,这光鲜亮丽的背后也隐藏着严峻的安全挑战:如何区分生成图像和真实图像?
「停止研究 RL 吧,研究者更应该将精力投入到产品开发中,真正推动人工智能大规模发展的关键技术是互联网,而不是像 Transformer 这样的模型架构。」
本文介绍并开发了一种自回归生成多视图图像的方法 MVAR 。其目的是确保在生成当前视图的过程中,模型能够从所有先前的视图中提取有效的引导信息,从而增强多视图的一致性。
马斯克憾失女将!Linda Yaccarino突然宣布辞去𝕏的CEO职务。她的离职,正逢Grok深陷争议漩涡。在职期间,马斯克反复无常,而她无力回天、黯然离场。
7月11日晚间,阿里通义千问团队宣布,对其人工智能聊天产品Qwen Chat进行重大更新,在优化用户交互体验的同时,还新增了多项实用功能。7月11日晚间,阿里通义千问团队宣布,对其人工智能聊天产品Qwen Chat进行重大更新,在优化用户交互体验的同时,还新增了多项实用功能。
据外媒7月11日报道,该平台采用了Paradox.ai开发的AI聊天机器人“Olivia”(奥利维亚),用于收集求职者的个人信息,包括姓名、电话、邮箱、住址等敏感数据。然而,平台的安全防护存在严重缺陷。
独家获悉,全球跨境支付与金融平台Airwallex(空中云汇)近日完成3亿美元F轮融资。投资方包括Square Peg、DST Global、Blackbird、Airtree、Salesforce Ventures等风投机构,还有多家养老基金,Visa Ventures作为战略投资者参与。
GPT-4o引爆全球「吉卜力风格」风潮后,其核心成员——华南理工学霸Lu Liu与伯克利博士Allan Jabri——双双跳槽Meta,两人曾在OpenAI主导多模态AI研究,与奥特曼同台展示关键功能。此次挖角再次凸显OpenAI内部动荡后的人才流失危机。
从今年4月底Manus完成了Benchmark领投的新一轮融资之后,市场上一直在关注Manus的Reverse CFIUS问题——很多人都等着看美国监管部门会不会枪打出头鸟,让Manus成为其第一个实际判罚案例