CMU&清华新作:让LLM自己合成数据来学习,特定任务性能同样大幅提升
CMU&清华新作:让LLM自己合成数据来学习,特定任务性能同样大幅提升为了解决这个问题,一些研究尝试通过强大的 Teacher Model 生成训练数据,来增强 Student Model 在特定任务上的性能。然而,这种方法在成本、可扩展性和法律合规性方面仍面临诸多挑战。在无法持续获得高质量人类监督信号的情况下,如何持续迭代模型的能力,成为了亟待解决的问题。
为了解决这个问题,一些研究尝试通过强大的 Teacher Model 生成训练数据,来增强 Student Model 在特定任务上的性能。然而,这种方法在成本、可扩展性和法律合规性方面仍面临诸多挑战。在无法持续获得高质量人类监督信号的情况下,如何持续迭代模型的能力,成为了亟待解决的问题。
智东西7月31日消息,根据顶级学术期刊《自然》(Nature)昨日报道,生成式AI在学术写作中的使用已迎来爆发式增长。相关研究显示生物医学领域最大数据库PubMed上10%的论文摘要都有AI写作嫌疑,相当于每年15万篇论文中都有AI的参与。
面对LLM逐渐膨胀的参数规模,没有H100的开发者和研究人员们想出了很多弥补方法,「量化」技术就是其中的一种。这篇可视化指南用各种图解,将「量化」的基本概念和分支方法进行了全方位总结。
在本次直播对话中,我们邀请到了两位在AI for Science领域的杰出专家——深势科技生物医药工业软件负责人郑行和北京科学智能研究院算法研究员郑大也,一起聊了聊AI for Science的AI与传统AI的不同之处。
大型语言模型(LLM)展现出了令人印象深刻的智能水平。因此,确保其安全性显得至关重要。已有研究提出了各种策略,以使 LLM 与人类伦理道德对齐。然而,当前的先进模型例如 GPT-4 和 LLaMA3-70b-Instruct 仍然容易受到越狱攻击,并被用于恶意用途。
还记得 Meta 的「分割一切模型」吗?这个模型在去年 4 月发布,被很多人认为是颠覆传统 CV 任务的研究。
自 1974 年在科罗拉多州博尔德市首次举办以来,SIGGRAPH一直是展示计算机图形领域开创性研究的一个主要平台。
最近,刊登在Science上的一篇文章通过实验发现,GenAI的确可以激发文学创作过程的个人创意,但会加重集体写作的同质化程度,引发对集体创意多样性的担忧。这把「双刃剑」该如何使用?
19秒破解几何难题,谷歌AI夺得IMO银牌在业界掀起了巨震。就连菲尔兹奖得主陶哲轩,前IMO美国队负责人罗博深都对此大加赞赏。更有AI大佬高调预测,若谷歌继续加码研究,应该可以造出一个「AI陶哲轩」。
OpenAI首席执行官山姆·阿尔特曼称,向每个人发放基本收入是应对“人工智能将消除无数人类工作”这一理论必然性的“显而易见的结论”。这项具有里程碑意义的研究为“全民基本收入”的好处提供了更多数据,而“全民基本收入”是这位OpenAI 创始人为应对人工智能取代人类工作的未来而提出的解决方案。