
空间智能新进展:教机器人组装宜家家具,首次实现操作步骤与真实视频对齐 | NeurIPS
空间智能新进展:教机器人组装宜家家具,首次实现操作步骤与真实视频对齐 | NeurIPS斯坦福吴佳俊团队,给机器人设计了一套组装宜家家具的视频教程!
斯坦福吴佳俊团队,给机器人设计了一套组装宜家家具的视频教程!
吴恩达发布的开源大模型套件aisuite,不到半天就斩获了1200+星标。
只需几秒钟,开源模型检索4500篇论文,比GPT-4o还靠谱!
11 月 16 日,久未露面的月之暗面创始人杨植麟突然现身,召开了一场媒体发布会。
红杉资本是全球最大的风险投资公司之一,在截至今年6月的12个月内,其2020年旗舰美国风险投资基金增长了24.6%,打破了对2020-2021年科技牛市高峰期投入资金的基金表现预期。
11月14日,Xsignal创始人刘震博士做客得到AI学习圈主理人快刀青衣直播间,为观众们带来最新的十月AI产品数据报告内容分享,两位老师从大数据视角切入,开启了一场有关“AI与大数据世界”的深度对谈,本文为直播内容的文字整理。
在 10 月 AI 产品榜全球访问量 Top100 榜单中,出现了一款之前没见过的产品 Submagic,该产品位列第 56,本月访问量达到 1262W,环比增幅达 119.87%。在最近已经有些固化、很少出现新产品的 AI 榜单,实属难得。
半小时内,两大巨头前后脚放出两大重磅更新,AI视频真是卷疯了!Runway放出生图模型Frames,一键让你拥有特定风格的世界。Luma则把文字、图像、视频全融合,只用自然交互就让脑海中画面成真。
不管是编写和调试代码,还是通过函数调用来使用外部工具,又或是控制机器人,都免不了需要 LLM 生成结构化数据,也就是遵循某个特定格式(如 JSON、SQL 等)的数据。 但使用上下文无关语法(CFG)来进行约束解码的方法并不高效。针对这个困难,陈天奇团队提出了一种新的解决方案:XGrammar。
本周一,知名 AI 学者、前谷歌大脑高级研究科学家 Yi Tay 在短短一年半的创业之后官宣回到谷歌,他显得很高兴。
在构建应用程序时,与多个提供商集成很麻烦,现在 aisuite 给解决了。 用相同的代码方式调用 OpenAI、Anthropic、Google 等发布的大模型,还能实现便捷的模型切换和对比测试。
Ai2和华盛顿大学联合Meta、CMU、斯坦福等机构发布了最新的OpenScholar系统,使用检索增强的方法帮助科学家进行文献搜索和文献综述工作,而且做到了数据、代码、模型权重的全方位开源。
如果给LLM做MBTI,会得到什么结果?UC伯克利的最新研究就发现,不同模型真的有自己独特的性格
自回归方法,在图像生成中观察到了 Scaling Law。 「Scaling Law 撞墙了?」这恐怕是 AI 社区最近讨论热度最高的话题。
北京大学研究团队开发的FAN模型能有效捕捉数据中的周期性模式,相比传统模型在多项任务中表现出色,同时降低了参数量和计算量,增强了对周期性特征的建模能力,应用潜力广泛。
各位大佬,激动人心的时刻到啦!Anthropic 开源了一个革命性的新协议——MCP(模型上下文协议),有望彻底解决 LLM 应用连接数据难的痛点!它的目标是让前沿模型生成更好、更相关的响应。以后再也不用为每个数据源写定制的集成代码了,MCP 一个协议全搞定!
AI在扮演完赛博伴侣,又准备去抢人类心理咨询师的饭碗了。
深圳龙华区一家服装厂里,一个新款服装的工单刚刚被派到了万仁艳的产线上。
下一个千亿美元市场,可能催生出3000亿美元独角兽。
AI剪辑,一条闷声赚大钱的赛道。
所有人都说,他的初创公司会失败。然而,一年后,它却蓬勃发展:拥有约 50 万注册用户,刚开始收费就有近 3000 名付费用户,以及 GPTs 商店中超过 200 万次对话,屡次被 OpenAI 推荐。
我就是个搞产品的,虽然过去也带过研发团队,但毕竟也不是专业程序员,过去很多时候,你确实会陷入到一个“我有一个想法,就差一个程序员”的怪圈里去,但因为现在有了AI,很多时候,你还真能自己的想法自己去实现了。
今天我们就来看看AI搜索赛道为什么能跑出估值超600亿的独角兽?
不知道从何时起,脑海里就有着阶跃星辰的多模态能力遥遥领先的印象。 无论去哪旅游,以前是用谷歌地图,现在基本都用「跃问」,看到长得奇特的建筑就拍来问问,还能跟 AI Chat 一下历史。 这不,最近来新加坡出差了,顺便旅旅游,就又用上了「跃问」。
成立一年半时间,银河通用累计融资超 12 亿元,创下了国内具身智能赛道的最高纪录;银河通用机器人产品总监朱辉认为,未来3-5年内,机器人将逐步进入到工厂、车厂中。
在人工智能领域,大语言模型(LLM)的向量嵌入能力一直被视为处理文本数据的利器。然而,斯坦福大学和Google DeepMind的研究团队带来了一个颠覆性发现:LLM的向量嵌入能力可以有效应用于回归任务。
让照片会“唱歌”,让人脸会“跳舞”。近期,一款名为Revive的AI图像应用登上欧洲多地娱乐免费榜Top50。上线两年左右的时间里,积累了近1700万用户,收入量也是高达1162万美元。
曾几何时,编程培训班被视为高薪职业的“入场券”;而如今,AI工具却能在几秒钟内完成初级程序员的工作。时代在变,新人程序员又该何去何从?
该项目由忆生科技联合香港大学、上海科技大学共同完成,是全球首个同时支持文本描述、图像、点云等多模态输入的计算机辅助设计(CAD)生成大模型。
Meta全新发布的基准Multi-IF涵盖八种语言、4501个三轮对话任务,全面揭示了当前LLM在复杂多轮、多语言场景中的挑战。所有模型在多轮对话中表现显著衰减,表现最佳的o1-preview模型在三轮对话的准确率从87.7%下降到70.7%;在非拉丁文字语言上,所有模型的表现显著弱于英语。