
训练数据爆减至1/1200!清华&生数发布国产视频具身基座模型,高效泛化复杂物理操作达SOTA水平
训练数据爆减至1/1200!清华&生数发布国产视频具身基座模型,高效泛化复杂物理操作达SOTA水平机器人能通过普通视频来学会实际物理操作了! 来看效果,对于所有没见过的物品,它能精准识别并按照指令完成动作。
机器人能通过普通视频来学会实际物理操作了! 来看效果,对于所有没见过的物品,它能精准识别并按照指令完成动作。
AI Coding太火,微软也坐不住了。 GitHub放大招,新工具GitHub Spark只需自然语言,就能把你的想法变成APP。
近期,夸克技术团队和浙江大学联合开源了OmniAvatar,这是一个创新的音频驱动全身视频生成模型,只需要输入一张图片和一段音频,OmniAvatar即可生成相应视频,且显著提升了画面中人物的唇形同步细节和全身动作的流畅性。此外,还可通过提示词进一步精准控制人物姿势、情绪、场景等要素。
故事是这样的。 后天就WAIC了。 而这一周,我遇到了这两年来,我最痛苦的难题。 WAIC期间,我要参加的活动非常多,有15家厂商参与的大直播、有AR眼镜发布会、有论坛嘉宾、有专访等等等等。
大家好,我是歸藏(guizang),今天给大家带来 Lovart 的正式版一手介绍和体验。Lovart 我们介绍过很多次了,但是每次都会有新东西。 昨晚看到他们的推特,发现发了正式版,就赶紧试了一下。 今天这个设计 Agent 终于变成了一个完全体,而且这次的更新依然非常牛批。
任何足够先进的科技,都与魔法无异。—— 亚瑟・克拉克,科幻小说作家、发明家
瑞士投资机构Blue Earth Capital 牵头,必和必拓Ventures 及力拓集团参与投资。比尔・盖茨旗下的Ventures(BEV)也参与了此次融资。 总部位于卡尔加里的矿业科技初创公司GeologicAI已完成4400万美元的B轮融资。
2025年7月21日,斯坦福大学学习加速器(Stanford Accelerator for Learning)发布名为《AI+学习差异:设计无边界的未来》(AI+ Learning Differences: Designing a Future with No Boundaries)白皮书,强调AI可以成为支持有学习差异的学生的有力工具,但前提是其开发要以他们的需求和意见为核心。
Bing Search API 将于2025年8月下线,如果你正寻找替代方案,不妨试试秘塔。 过去一年,我们自建了数百亿规模的多语言索引库,并在“秘塔AI搜索”中每天承受千万级的调用实践。
大语言模型(Large Language Model, LLM)在复杂推理任务中表现卓越。借助链式思维(Chain-of-Thought, CoT),LLM 能够将复杂问题分解为简单步骤,充分探索解题思路并得出正确答案。LLM 已在多个基准上展现出优异的推理能力,尤其是数学推理和代码生成。