快速入局生成式AI,企业为什么选择携手亚马逊云科技?
快速入局生成式AI,企业为什么选择携手亚马逊云科技?在 2023 年上半年,AI 圈内有一个热议观点:「所有产品都值得用大模型重做一次。」这个设想,曾引发了人们无限的想象。
在 2023 年上半年,AI 圈内有一个热议观点:「所有产品都值得用大模型重做一次。」这个设想,曾引发了人们无限的想象。
现在ChatGPT等大模型一大痛点:处理长文本算力消耗巨大,背后原因是Transformer架构中注意力机制的二次复杂度。
Inflection-2最新发布!性能碾压一众大厂模型,仅输一手GPT-4,还要集成到Pi?最近,InflectionAI发布了全新的一款AI模型。更炸裂的是InfectionAI对这款模型的评价——性能直超谷歌和Meta开发的两款模型,紧随OpenAI的GPT-4之后。
“欧洲版OpenAI”最新估值,逼近20亿美元!总部位于巴黎的大模型初创公司Mistral AI最新一轮融资,4.87亿美元。
屹立不倒的 Transformer 迎来了一个强劲竞争者。在别的领域,如果你想形容一个东西非常重要,你可能将其形容为「撑起了某领域的半壁江山」。但在 AI 大模型领域,Transformer 架构不能这么形容,因为它几乎撑起了「整个江山」。
增加数据量和模型的参数量是公认的提升神经网络性能最直接的方法。目前主流的大模型的参数量已扩展至千亿级别,「大模型」越来越大的趋势还将愈演愈烈。
依托清华大学神经工程实验室在神经科学和脑机解码领域的技术和经验积累,灵犀医学于2019年创立,如今已建立以百万病例EEG数据为基础的脑功能数据库。基于超大规模人体大脑数据训练神经动力学大模型,灵犀医学打造了针对癫痫、抑郁症、阿尔兹海默症等脑疾病的AI精准诊断和治疗平台。
清华大学新闻学院教授沈阳是国内研究人工智能、大模型最前沿的学者之一,最初我联系沈阳,是想听他讲讲团队的研究进展,谈谈对人类与人工智能之间关系的看法。没想到,电话那头,沈阳老师出乎意料的坦诚、开放,他主动分享了自己在信息时代是如何一步步自我迭代,并最终部分“AI化”的:
本文中,上海交大 & 上海 AI Lab 发布 Radiology Foundation Model (RadFM),开源 14B 多模态医疗基础模型,首次支持 2D/3D 放射影像输入。
Transformer大模型工作原理究竟是什么样的?一位软件工程师打开了大模型的矩阵世界。黑客帝国中,「矩阵模拟」的世界或许真的存在。