
Evaluation is All You Need!首个开源多模态大模型通用评测器LLaVA-Critic
Evaluation is All You Need!首个开源多模态大模型通用评测器LLaVA-Critic随着对现有互联网数据的预训练逐渐成熟,研究的探索空间正由预训练转向后期训练(Post-training),OpenAI o1 的发布正彰显了这一点。
随着对现有互联网数据的预训练逐渐成熟,研究的探索空间正由预训练转向后期训练(Post-training),OpenAI o1 的发布正彰显了这一点。
自从 Transformer 模型问世以来,试图挑战其在自然语言处理地位的挑战者层出不穷。 这次登场的选手,不仅要挑战 Transformer 的地位,还致敬了经典论文的名字。 再看这篇论文的作者列表,图灵奖得主、深度学习三巨头之一的 Yoshua Bengio 赫然在列。
是什么让纽约大学著名研究者谢赛宁三连呼喊「Representation matters」?他表示:「我们可能一直都在用错误的方法训练扩散模型。」即使对生成模型而言,表征也依然有用。基于此,他们提出了 REPA,即表征对齐技术,其能让「训练扩散 Transformer 变得比你想象的更简单。」
在 Claude AI 新模型发布之际,Anthropic 的CEO Dario Amodei 发表了一篇近2万字深度长文,探讨人工智能对人类的潜在积极影响。作为斯坦福大学神经科学博士,Amodei 以严谨的学术态度定义了"强人工智能"概念,并详细阐述了它在不同核心领域可能带来的积极变革。
微软发表了一篇播客,宣布在其Microsoft Cloud for Healthcare中推出新的医疗保健数据功能和AI工具,包括通过Azure AI Studio中的新医疗保健AI模型、Microsoft Fabric中的医疗保健数据功能、Copilot Studio中的医疗保健AI agents服务以及AI驱动的护理工作流程解决方案。
据The Information报道,Sierra,一家由前 Salesforce 联合首席执行官布雷特·泰勒共同创办的人工智能初创公司,正在筹集数亿美元的新资金,投资方为成长阶段的投资者 Greenoaks Capital,消息来自两位了解此交易的人士。
RAG(Retrieval-Augmented Generation)是一种结合信息检索与文本生成的技术,旨在提高大型语言模型(LLM)在回答复杂查询时的表现。它通过检索相关的上下文信息来增强生成答案的质量和准确性。解读RAG测评:关键指标与应用分析
Gradio 5 来了! 刚刚,Gradio 官方表示经过几个月的努力,他们宣布 Gradio 5 稳定版本正式发布!
本期AGI路线图中关键节点:DiT架构、Stable Diffusion 3.0、Flux.1、ControlNet、1024×1024分辨率、医学影像、英伟达Eagle模型、谷歌Med-Gemini系列模型、GPT-4o端到端、Meta Transfusion模型。
在人工智能领域掀起巨浪的 OpenAI o1 模型发布三周后,一支由高校年轻研究者组成的团队今天发布了题为 "o1 Replication Journey: A Strategic Progress Report (o1 探索之旅:战略进展报告)" 的研究进展报告。