Evaluation is All You Need!首个开源多模态大模型通用评测器LLaVA-Critic
Evaluation is All You Need!首个开源多模态大模型通用评测器LLaVA-Critic随着对现有互联网数据的预训练逐渐成熟,研究的探索空间正由预训练转向后期训练(Post-training),OpenAI o1 的发布正彰显了这一点。
随着对现有互联网数据的预训练逐渐成熟,研究的探索空间正由预训练转向后期训练(Post-training),OpenAI o1 的发布正彰显了这一点。
自从 Transformer 模型问世以来,试图挑战其在自然语言处理地位的挑战者层出不穷。 这次登场的选手,不仅要挑战 Transformer 的地位,还致敬了经典论文的名字。 再看这篇论文的作者列表,图灵奖得主、深度学习三巨头之一的 Yoshua Bengio 赫然在列。
o1 作为 OpenAI 在推理领域的最新模型,大幅度提升了 GPT-4o 在推理任务上的表现,甚至超过了平均人类水平。o1 背后的技术到底是什么?OpenAI 技术报告中所强调的强化学习和推断阶段的 Scaling Law 如何实现?
在用模拟环境训练机器人时,所用的数据与真实世界存在着巨大的差异。为此,李飞飞团队提出「数字表亲」,这种虚拟资产既具备数字孪生的优势,还能补足泛化能力的不足,并大大降低了成本。
11x.ai 开发的人工智能“数字员工”如 Alice 和 Jordan,能够自动化处理销售开发、客户服务等重复性任务,帮助企业提升效率,降低成本,释放人力专注于更具战略价值的工作。客户可以根据完成的任务量或实际取得的销售成果进行付费,提供更定制化的服务。
OpenAI好不容易开源了一次,却被曝出剽窃? 就在昨天,OpenAI应用AI研究员Shyamal Anadkat ,放出了全新多智能体框架——Swarm,瞬间在全网爆火。
微软发表了一篇播客,宣布在其Microsoft Cloud for Healthcare中推出新的医疗保健数据功能和AI工具,包括通过Azure AI Studio中的新医疗保健AI模型、Microsoft Fabric中的医疗保健数据功能、Copilot Studio中的医疗保健AI agents服务以及AI驱动的护理工作流程解决方案。
近日,Hugging Face更新了月度榜单,智源研究院的BGE模型登顶榜首,这是中国国产AI模型首次成为Hugging Face月榜冠军。BGE在短短一年时间内,总下载量已超数亿次,是目前下载量最多的国产AI系列模型。
本文是一篇发表在 NeurIPS 2024 上的论文,单位是香港大学、Sea AI Lab、Contextual AI 和俄亥俄州立大学。论文主要探讨了大型语言模型(LLMs)的词表大小对模型性能的影响。
据 Financial Times 消息,MiniMax 向投资者表示它在今年的净收入将达到 7000 万美元。公开信息显示,MiniMax 迄今已经完成了 4 轮融资,投资者包括阿里、腾讯、红杉中国、高瓴创投、IDG 资本等,其估值超过 25 亿美元(约合 177 亿元人民币)。