
智能体零样本解决未见过人类设计环境!全靠这个开放式物理RL环境空间
智能体零样本解决未见过人类设计环境!全靠这个开放式物理RL环境空间在机器学习领域,开发一个在未见过领域表现出色的通用智能体一直是长期目标之一。一种观点认为,在大量离线文本和视频数据上训练的大型 transformer 最终可以实现这一目标。
在机器学习领域,开发一个在未见过领域表现出色的通用智能体一直是长期目标之一。一种观点认为,在大量离线文本和视频数据上训练的大型 transformer 最终可以实现这一目标。
Jiaming Song详细介绍了Diffusion模型在视觉生成领域的前沿研究,强调其在提升生成视觉模型质量中的关键作用。他分享了自己从斯坦福大学的博士研究到加入NVIDIA和Luma AI的历程,展示了如何将贝叶斯非参数模型的知识应用到生成式AI中,推动了视觉模型在生成质量和速度上的显著提升。
截至目前,小红书已在大模型、AI 对话、AI 搜索、AI 绘图等 4 个领域进行了布局。陆续上线了 6 款产品,主要围绕搜索和创作这 2 个领域。但是处于对生态破坏以及 AI 落地的的不确定性,小红书并没有大肆宣扬自己的 AI 产品。
视觉模型仍是IDEA的研究重点——IDEA正式发布的最新通用视觉大模型DINO-X,可以拥有真正的物体级别理解能力。
用看漫画的方式,大幅提升视频大模型时序定位能力!
tokenizer对于图像、视频生成的重要性值得重视。
自从 OpenAI 发布 o1 模型以来,业界对其的追赶不断加速。
开源模型阵营又迎来一员猛将:Tülu 3。它来自艾伦人工智能研究所(Ai2),目前包含 8B 和 70B 两个版本(未来还会有 405B 版本),并且其性能超过了 Llama 3.1 Instruct 的相应版本!长达 73 的技术报告详细介绍了后训练的细节。
Claude 3.5 Sonnet 应该是目前公认综合能力最好的基础模型。
今年11月,文心的日均调用量达到15亿次,比三个月前的2倍还要多,API调用量的显著增长,更加给了李彦宏、给了百度信心。 在财报电话会议上,李彦宏主动爆料了新进展: 预计明年初,推出新版本的文心大模型。