
国产「小钢炮」一夜干翻巨无霸GPT-4V、Gemini Pro!稳坐端侧多模态铁王座
国产「小钢炮」一夜干翻巨无霸GPT-4V、Gemini Pro!稳坐端侧多模态铁王座杀疯了!一夜之间,全球最强端侧多模态模型再次刷新,仅用8B参数,击败了多模态巨无霸Gemini Pro、GPT-4V。而且,其OCR长难图识别刷新SOTA,图像编码速度暴涨150倍。这是国产头部大模型公司献给开发者们最浪漫的520礼物。
杀疯了!一夜之间,全球最强端侧多模态模型再次刷新,仅用8B参数,击败了多模态巨无霸Gemini Pro、GPT-4V。而且,其OCR长难图识别刷新SOTA,图像编码速度暴涨150倍。这是国产头部大模型公司献给开发者们最浪漫的520礼物。
大语言模型可谓是迄今为止对人类行为最大的建模,如何借助大语言模型工具,让科技发展更好地应用到真实人类社会中去?从哈佛物理系到大语言模型结合社会学和经济学的研究,朱科航的思考路径,聚焦在对人类行为的深度学习和理解。在开始今天阅读之前,大家不妨先猜一猜,大语言模型之前人类应用最广的 TOP2 机器学习是什么?Enjoy
内容产业首当其冲。
从互联网背景突进AI领域的拓荒者会很像要穿越白垩纪流星撞地球的分割点,在地球被撞之前适合大个儿爬行动物,在这之后大个儿就不再是优势而是劣势了。只有持续进化才能在外部环境剧烈变化的环境生存下去。死抱着过去不放,很容易变成新的路径依赖。
前景光明,但每一步都如履薄冰。
中国和国际AI合作不断深化,特斯拉计划在中国建立数据中心,推进FSD全自动驾驶算法。 美国采取技术封锁措施,对中国等国家实施人工智能模型出口管制。
在智能涌现的当下,我们更应该期待,未来三星电视还会带来什么样的惊喜。
是因为「劳动节」吗?全世界所有的公司,都选择在 5 月第三周,将最新的 AI 产品和技术,集中释放。
ChatGPT以及硅谷AI大战终于升级,长出了“眼睛”和“嘴”。5月中旬,OpenAI和谷歌前后发布重磅AI多模态更新,从基于文字交互的ChatGPT全面升级,实现了“声音,文字和视觉”三者全面结合的人工智能新交互功能,而这,也标志着硅谷科技巨头的生成式AI之战正式进入到第二轮。新一轮竞争,只会更加激烈、更加全面。
奥特曼承诺的小作文,它来了,还一发发两篇!
AI领域本周都卷起来对话式交互。
“ROI是衡量AIGC应用价值的唯一标准。”
GPT-4o亮相没两天,背后Omni团队就被扒了个底朝天
本月初,来自 MIT 等机构的研究者提出了一种非常有潜力的 MLP 替代方法 ——KAN。
在线和离线对齐算法的性能差距根源何在?DeepMind实证剖析出炉
自从 Ilya 和 超级对齐负责人 Jan 离职后,OpenAI 内部还是心散了,后续也有越来越多的人离职,同时也引发了更多的矛盾。
还有约165个大模型尚未获得“过审”机会。
是ChatGPT for Robotics最早适配的机器人品牌。
火热和洗牌并行,AI赛道到了残酷较量的阶段。
一切都是为了布局具身智能!
Ilya Sutskever离职内幕曝光,Sam Altman面临信任崩盘。
文生图模型成熟之后,有多少人苦练Midjourney咒语,还是调不出可用的图像?
我们需要一个扁平化的世界,这样才能创造出更多的东西。
就在上周Google隆重举办I/O开发者大会的当天下午,消失在人们视野里半年之久的OpenAI联合创始人兼前首席科学家Ilya Sutskever忽然露面发声了。
不做外部场景,就做内部。
“Scaling Law不是万金油”——关于大模型表现,华为又提出了新理论。
OpenAI超级对齐负责人Jan Leike,也就是刚刚追随Ilya离开公司的那位,自曝离职的真正原因,以及更多内幕。
许多临床任务需要了解专业数据,例如医学图像、基因组学,这类专业知识信息在通用多模态大模型的训练中通常不存在。
近年来,定制化的人物生成技术在社区中引起了广泛关注。
本次公布的获奖论文中,有多位华人作者。