
全球首个开源多模态医疗基础模型:人工打分平均超越GPT-4V、支持2D/3D放射影像
全球首个开源多模态医疗基础模型:人工打分平均超越GPT-4V、支持2D/3D放射影像本文中,上海交大 & 上海 AI Lab 发布 Radiology Foundation Model (RadFM),开源 14B 多模态医疗基础模型,首次支持 2D/3D 放射影像输入。
本文中,上海交大 & 上海 AI Lab 发布 Radiology Foundation Model (RadFM),开源 14B 多模态医疗基础模型,首次支持 2D/3D 放射影像输入。
哈工深发布全新多模态大语言模型九天(JiuTian-LION),融合细粒度空间感知和高层语义视觉知识,在13个评测任务上实现了sota性能。
当地时间周六,The Information援引两位知情人士报道,谷歌已将人工智能模型Gemini的发布时间推迟到2024年1月份。
Zoom CTO黄学东发文,讨论了Zoom对于高效处理AI任务需求采用的技术——Zoom联邦AI。达到GPT-4性能的同时,Zoom AI只用了不到10%的成本。
今年 4 月 7 日,斯坦福大学发表的《Generative Agents: Interactive Simulacra of Human Behavior》论文出来之后的几天内,其中提到了一个很有趣的细节是信息的传递:一个 agent 想要举办情人节派对的消息会在小镇中逐渐扩散开来。
Meta谷歌接连放出重磅成果!Meta开源无缝交流语音翻译模型,谷歌放出无监督语音翻译重大突破Translation 3。
只需不到9行代码,就能在CPU上实现出色的LLM推理性能。英特尔® Extension for Transformer创新工具包中的LLM Runtime为诸多模型显著降低时延,且首个token和下一个token的推理速度分别提升多达40倍和2.68倍,还能满足更多场景应用需求。
,Stability AI 推出了新一代图像合成模型 Stable Diffusion XL Turbo,引发了一片叫好。人们纷纷表示,图像到文本生成从来没有这么轻松。
继OpenAI“宫斗”之后,人工智能(AI)领域的又一位明星初创公司——开发热门文本生成图片模型Stable Diffusion的Stability AI也出乱子了。
研究人员利用GPT4-Vision构建了一个大规模高质量图文数据集ShareGPT4V,并在此基础上训练了一个7B模型,在多项多模态榜单上超越了其他同级模型。