NeurIPS Spotlight | 基于信息论,决策模型有了全新预训练范式统一框架
NeurIPS Spotlight | 基于信息论,决策模型有了全新预训练范式统一框架现如今,以 GPT 为代表的大语言模型正深刻影响人们的生产与生活,但在处理很多专业性和复杂程度较高的问题时仍然面临挑战。在诸如药物发现、自动驾驶等复杂场景中,AI 的自主决策能力是解决问题的关键,而如何进行决策大模型的高效训练目前仍然是开放性的难题。
现如今,以 GPT 为代表的大语言模型正深刻影响人们的生产与生活,但在处理很多专业性和复杂程度较高的问题时仍然面临挑战。在诸如药物发现、自动驾驶等复杂场景中,AI 的自主决策能力是解决问题的关键,而如何进行决策大模型的高效训练目前仍然是开放性的难题。
基于昇腾算力的矩阵运算改进求解器框架,大幅提升Local Optimum跳出能力。
在过去的两年里,风险投资圈,以及广泛的技术生态中,关于 AI 原生应用的发展前景展开了深入讨论。我们目睹了技术价值从底层基础设施,逐步向平台和应用层转移的趋势,看到了对 AI Agent 演进的强烈关注,以及关于各个垂直领域 AI 应用发展的众多深入研究。
“它前进着,又跨过了新的一级台阶,耳边仿佛传来由远及近的低语:前方,即是世界。”
12月14日,昇思人工智能框架峰会召开,现场18家单位发布基于昇思的原生开发大模型成果。伴随AI框架生态进入“深水区”,昇思朋友圈也在持续扩容,多家上市公司已成为昇思生态建设的主力军。
我们距离AGI还有多远?智能体、智能体自动化的5个级别与自主工作的6个level
开发AI应用的朋友们都有深刻的感受,在实际应用开发中,如何让LLM高效地使用外部工具,一直是困扰Prompt工程师的一个关键问题。最近,来自Faculty Science Ltd的研究团队提出的Language Hooks框架,为这个问题提供了一个令人耳目一新的解决方案。
大语言模型(LLMs)在推理任务上展现出了令人瞩目的能力,但其推理思维方式的单一性一直是制约性能提升的关键瓶颈。目前的研究主要关注如何通过思维链(Chain-of-Thought)等方法来提升推理的质量,却忽视了一个重要维度——推理类型的多样性。
Allen Institute for AI(AI2)发布了Tülu 3系列模型,一套开源的最先进的语言模型,性能与GPT-4o-mini等闭源模型相媲美。Tülu 3包括数据、代码、训练配方和评估框架,旨在推动开源模型后训练技术的发展。
Cell Reports Medicine近期的研究结合CT和病理图像,提出一种可解释的人工智能框架用于预测胃癌患者新辅助化疗的疗效。