AI资讯新闻榜单内容搜索-GE

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GE
化解机器人的「幻觉」:北大发布OmniManip,VLM结合双闭环系统,3D理解能力大幅提升

化解机器人的「幻觉」:北大发布OmniManip,VLM结合双闭环系统,3D理解能力大幅提升

化解机器人的「幻觉」:北大发布OmniManip,VLM结合双闭环系统,3D理解能力大幅提升

近年来视觉语⾔基础模型(Vision Language Models, VLMs)在多模态理解和⾼层次常识推理上⼤放异彩,如何将其应⽤于机器⼈以实现通⽤操作是具身智能领域的⼀个核⼼问题。这⼀⽬标的实现受两⼤关键挑战制约:

来自主题: AI技术研报
8907 点击    2025-01-23 13:09
1M长上下文,满血版Gemini 2.0又一次登上Chatbot Arena榜首

1M长上下文,满血版Gemini 2.0又一次登上Chatbot Arena榜首

1M长上下文,满血版Gemini 2.0又一次登上Chatbot Arena榜首

就在国内各家大模型厂商趁年底疯狂卷的时候,太平洋的另一端也没闲着。 就在今天,谷歌发布了 Gemini 2.0 Flash Thinking 推理模型的加强版,并再次登顶 Chatbot Arena 排行榜。

来自主题: AI资讯
10641 点击    2025-01-22 18:40
李飞飞:语言之外,另一半的智能还有待实现

李飞飞:语言之外,另一半的智能还有待实现

李飞飞:语言之外,另一半的智能还有待实现

最近,斯坦福大学教授李飞飞接受了硅谷著名投资人 Reid Hoffman 和 Aria Finger 的联合播客专访。在这场对话中,李飞飞主要探讨了以下主题: ImageNet 的灵感源于难以避开模型的过拟合问题,李飞飞意识到与其苦心改进模型,不如用数据驱动。

来自主题: AI资讯
7724 点击    2025-01-22 18:36
这一年技术如何改变体育:AI、媒体、户外、人体科学

这一年技术如何改变体育:AI、媒体、户外、人体科学

这一年技术如何改变体育:AI、媒体、户外、人体科学

当人们已经快要对人工智能产生审美疲劳的时候,这段由ChatGPT掀起的新一波技术革命浪潮不过才进入了第二年。以它为代表的生成式AI(GenAI)不断进化出新的功能,从文本到视频,GenAI的“创造力”使得它对内容领域的冲击特别明显。

来自主题: AI资讯
8258 点击    2025-01-22 10:36
中科院北大等揭示「蒸馏真相」:除Claude豆包Gemini,其他很多模型都「蒸」过头

中科院北大等揭示「蒸馏真相」:除Claude豆包Gemini,其他很多模型都「蒸」过头

中科院北大等揭示「蒸馏真相」:除Claude豆包Gemini,其他很多模型都「蒸」过头

模型蒸馏也有「度」,过度蒸馏,只会导致模型性能下降。最近,来自中科院、北大等多家机构提出全新框架,从两个关键要素去评估和量化蒸馏模型的影响。结果发现,除了豆包、Claude、Gemini之外,大部分开/闭源LLM蒸馏程度过高。

来自主题: AI技术研报
6446 点击    2025-01-21 22:30
无直接数据可用,AI怎么学会「干活」?微软团队揭秘AI从语言到行动的进化之路

无直接数据可用,AI怎么学会「干活」?微软团队揭秘AI从语言到行动的进化之路

无直接数据可用,AI怎么学会「干活」?微软团队揭秘AI从语言到行动的进化之路

该技术报告的主要作者 Lu Wang, Fangkai Yang, Chaoyun Zhang, Shilin He, Pu Zhao, Si Qin 等均来自 Data, Knowledge, and Intelligence (DKI) 团队,为微软 TaskWeaver, WizardLLM, Windows GUI Agent UFO 的核心开发者。

来自主题: AI技术研报
7885 点击    2025-01-21 22:16
速递|OpenAI的Agent工具或即将发布

速递|OpenAI的Agent工具或即将发布

速递|OpenAI的Agent工具或即将发布

据 TechCrunch 报道,OpenAI 可能即将发布一款 AI 工具,可以控制用户的电脑并代表用户执行操作。

来自主题: AI资讯
3933 点击    2025-01-21 12:53
不到4小时,谷歌Gemini写完10万字商业战略书籍!人类全程没碰一个字

不到4小时,谷歌Gemini写完10万字商业战略书籍!人类全程没碰一个字

不到4小时,谷歌Gemini写完10万字商业战略书籍!人类全程没碰一个字

初创公司DeepWriter宣布:世界第一部完全由AI写作的10万字商业竞争书籍诞生了!全程没有人类参与工作,不到4小时,即可完成约10万单词的商业书籍创作。

来自主题: AI资讯
8728 点击    2025-01-21 08:11
人大、东北大学联合开发「图机器学习库」Jittor Geometric!性能超越PYG、DGL

人大、东北大学联合开发「图机器学习库」Jittor Geometric!性能超越PYG、DGL

人大、东北大学联合开发「图机器学习库」Jittor Geometric!性能超越PYG、DGL

ittor Geometric 1.0是由中国人民大学与东北大学联合开发的图机器学习库,基于国产Jittor框架,高效灵活,可助力处理复杂图结构数据,性能优于同类型框架,支持多种前沿图神经网络模型,已开源供用户使用。

来自主题: AI资讯
5718 点击    2025-01-21 07:50