
智元机器人北大实习生推出OmniManip,引入自我校正机制,缓解大模型幻觉
智元机器人北大实习生推出OmniManip,引入自我校正机制,缓解大模型幻觉2024年,智元机器人与北大成立联合实验室,8月发布“远征”与“灵犀”两大系列共五款商用人形机器人新品,10月旗下灵犀X1人形机器人官宣开源,12月宣布正式开启通用机器人量产,不断拓展应用场景。
2024年,智元机器人与北大成立联合实验室,8月发布“远征”与“灵犀”两大系列共五款商用人形机器人新品,10月旗下灵犀X1人形机器人官宣开源,12月宣布正式开启通用机器人量产,不断拓展应用场景。
人类仅剩2-3年时间了!Anthropic首席执行官Dario Amodei独家采访,一口气爆料一连串AI重磅消息,并在最后给出了对于职场年轻人的建议。
北京大学信息工程学院田永鸿教授、陈杰副教授,联合广州国家实验室周鹏研究员指导博士生聂志伟、硕士生刘旭东等,提出了一种进化驱动的病毒变异驱动力预测框架 E2VD,可以对新冠病毒、流感病毒、寨卡病毒、艾滋病病毒进行预测。
就在刚刚,腾讯混元3D全新版本上线了。这一周内我在混元3D、Tripo3D、Meshy这三家AI 3D里跑了上百次案例,在文生3D、图生3D、纹理材质生成、3D工作流四个维度,让小白也能最大程度体验到AI 3D能做到什么,以及将如何影响AI生图、AI视频的工作流。
春节前夕,腾讯又发AI大礼包。
口音测试风靡,幕后公司起飞。
没错,OpenAI的智能体时代真的要来了!
就在刚刚,Verses团队研发的Genius智能体,在Pong中超越了人类顶尖玩家!而且它仅仅训练2小时,用了1/10数据,就秒杀了其他顶级AI模型。
大模型应用落地元年,谁家业务更值得关注?
提一个冷知识。
在AI时代,所见并非所得。
下一代 AI 的发展,似乎遇到了难以逾越的瓶颈。去年 12 月,OpenAI 在 ChatGPT 两周年期间连续发布了 12 天,我们期待的新一代大模型 GPT-5 却从头到尾没有踪影。
当人们已经快要对人工智能产生审美疲劳的时候,这段由ChatGPT掀起的新一波技术革命浪潮不过才进入了第二年。以它为代表的生成式AI(GenAI)不断进化出新的功能,从文本到视频,GenAI的“创造力”使得它对内容领域的冲击特别明显。
人大清华团队提出Search-o1框架,大幅提升推理模型可靠性。尤其是「文档内推理」模块有效融合了知识学习与推理过程,在「搜索+学习」范式基础上,使得模型的推理表现与可靠性都更上一层楼。
代理型人工智能具有显著的潜力。
特朗普刚一上任,就和OpenAI联手了整了个大的:「星际之门计划」正式启动!4年,5000亿美金,美国的AI曼哈顿计划,今日正式开启。
WaveForms致力于开发音频大模型(LLMs),通过创新的端到端音频处理技术,实现更加实时、类人化且情感智能化的语音交互。与传统语音模型不同,WaveForms的音频模型不是语音转文本再转语音,而是能够直接处理音频,实现更自然的对话和情感互动。
自由画布类 AIGC 工具:从近期新品(更新)窥见发展趋势——自律才能给我自由。图像 & 视频多主体一致功能:模型上下文能力的重要体现,未来各家模型的标配。指定 AI 生图里的文字,我找到了 9 种解决方案,其中有 2 种快过时了
早上MiniMax上线TTS,字节上线AI编程Trae;下午字节全量上线豆包实时语音;晚上DeepSeek开源R1性能直接对标OpenAI o1,然后Kimi的k1.5直接正面硬刚。昨天的余温还没过,今天下午,腾讯混元又悄悄开了个闭门发布会,作为混元的老基友,我自然是受邀参加期期不落。
才一上任,特朗普就宣布撤销拜登的AI行政禁令!马斯克、小扎、劈柴、贝索斯、库克等大佬悉数出现在就职典礼上。今天起,历史上最贵「内阁」开始运转,新总统承诺减少监管,加大AI基础设施投入,美国科技巨头的春天来了?
模型蒸馏也有「度」,过度蒸馏,只会导致模型性能下降。最近,来自中科院、北大等多家机构提出全新框架,从两个关键要素去评估和量化蒸馏模型的影响。结果发现,除了豆包、Claude、Gemini之外,大部分开/闭源LLM蒸馏程度过高。
在人工智能基础模型技术飞速发展的今天,SAR 图像解译领域技术创新与发展生态亟待突破。为了解决上述技术挑战,国防科技大学电子科学学院刘永祥&刘丽教授团队提出首个公开发表的SAR图像目标识别基础模型SARATR-X 1.0。
该技术报告的主要作者 Lu Wang, Fangkai Yang, Chaoyun Zhang, Shilin He, Pu Zhao, Si Qin 等均来自 Data, Knowledge, and Intelligence (DKI) 团队,为微软 TaskWeaver, WizardLLM, Windows GUI Agent UFO 的核心开发者。
线性资本和 Linkloud 创始人高宁进行了一场深度对谈,高宁分享了他在最近两年做出海社区的体会,与众多在创业第一天想做全球市场生意的创业者打交道的观察,以及对个别海外发展成功案例的总结。
新年伊始,AI专家Gary Marcus发布长文,公布了他对2025年AI发展最新的25项预测,包括AGI、生成式AI、自动驾驶、人形机器人、视频生成、智能体等多个方向。虽然在2024年对OpenAI估值预测出错,但在最新的预测中仍不看好OpenAI。
在产业界兜兜转转几年后,颜水成再次选择回归学界—— 重返新加坡国立大学NUS,担任计算机系特聘教授。没错,就是他第一个教职所在地,也是他声名鹊起的地方。
我亲眼见证了数据量的爆炸式增长以及行业的巨额投入。当时就很明显,AI是推动这些数据增长背后的关键动力。那是一个非常有趣的时刻——Meta正在完成“移动优先”的过渡,开始迈向“AI 优先”。
昨天晚上,DeepSeek 又开源了 DeepSeek-R1 模型(后简称 R1),再次炸翻了中美互联网: R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。 R1 上线 API,对用户开放思维链输出 R1 在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版,小模型则超越 OpenAI o1-mini
中国版o1刷屏全网。DeepSeek R1成为世界首个能与o1比肩的开源模型,成功秘诀竟是强化学习,不用监督微调。AI大佬们一致认为,这就是AlphaGo时刻。
据 TechCrunch 报道,OpenAI 可能即将发布一款 AI 工具,可以控制用户的电脑并代表用户执行操作。