翁荔,掌管OpenAI安全的北大校友,刚刚现身B站线下演讲
翁荔,掌管OpenAI安全的北大校友,刚刚现身B站线下演讲OpenAI研究副总裁(安全)翁荔(Lilian Weng),现身国内! 还首次在国内大型活动场合公开发表AI主题演讲。
OpenAI研究副总裁(安全)翁荔(Lilian Weng),现身国内! 还首次在国内大型活动场合公开发表AI主题演讲。
大型语言模型在学习概念时竟然会形成令人惊讶的几何结构,比如代码和数学特征会形成一个「叶(lobe)」,类似于我们在做磁共振功能成像时看到的大脑功能性脑叶。这说明什么呢?
Ferret-UI 2 是苹果研究团队最新发表的一款先进的多模态大型语言模型(MLLM),旨在实现跨多个平台的通用用户界面(UI)理解。
OmniParser 是由微软研究院提出的一个创新性工具,旨在通过解析用户界面截图来增强基于视觉的图形用户界面(GUI)代理的性能。
来自华东师范大学、南洋理工和中科院等高校的联合研究团队提出了一种新颖的人工智能教育框架“场景-对象-评估”(SOE),旨在利用大型语言模型(LLMs)构建能够模拟人类学生行为和个体差异的虚拟学生代理(LVSA)。
NotebookLM是谷歌开发的一款人工智能驱动的研究和写作工具,上传一个源文件,它会为用户生成一个音频概述或播客。这款产品的爆火很大一部分原因是简单的一键式体验,研发人员将交互按钮设计得十分简洁有趣,吸引更多用户尝试。
移动任务自动化利用AI精准捕捉并解析人类意图,进而在移动设备(手机、平板电脑、车机终端)上高效执行多样化任务,为那些因认知局限、身体条件限制或身处特殊情境下的用户提供前所未有的便捷与支持。
一个简单但具有挑战性的基准
近年来,大语言模型(Large Language Models, LLMs)的研究取得了重大进展,并对各个领域产生了深远影响。然而,LLMs的卓越性能来源于海量数据的大规模训练,这导致LLMs的训练成本明显高于传统模型。
清华大学推出的SonicSim平台和SonicSet数据集针对动态声源的语音处理研究提供了强有力的工具和数据支持,有效降低了数据采集成本,实验证明这些工具能有效提升模型在真实环境中的性能。