
新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜
新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜OpenAI“双12”刚进行到第二天,就把大模型圈搅得好不热闹! 一边是Meta没预告就发布了Llama 3.3,70B版本就能实现以前405B的性能。
OpenAI“双12”刚进行到第二天,就把大模型圈搅得好不热闹! 一边是Meta没预告就发布了Llama 3.3,70B版本就能实现以前405B的性能。
最新计算集群,Base青岛! 华为云华东(青岛)数据中心刚刚正式开服。
知识密集型工作也败了!大型语言模型在预测神经科学结果方面超越了人类专家,平均准确率达到81%,而人类专家仅为63%;模型通过整合大量文献数据,展现出了惊人的前瞻性预测能力,预示着未来科研工作中人机协作的巨大潜力。
最近,世界模型(World Models)似乎成为了 AI 领域最热门的研究方向。
在人工智能发展史上,强化学习 (RL) 凭借其严谨的数学框架解决了众多复杂的决策问题,从围棋、国际象棋到机器人控制等领域都取得了突破性进展。
人类离AGI究竟还有多远?最新一期Nature文章,从以往研究分析、多位大佬言论深入探讨了LLM在智能化道路上突破与局限。
以 GPT4V 为代表的多模态大模型(LMMs)在大语言模型(LLMs)上增加如同视觉的多感官技能,以实现更强的通用智能。虽然 LMMs 让人类更加接近创造智慧,但迄今为止,我们并不能理解自然与人工的多模态智能是如何产生的。
12月5日,英伟达已经与越南政府达成合作,将在越南开设首个AI研发中心。越南投资部长阮智勇表示,英伟达将在越南开设人工智能研发中心,与越南最大的电信及移动运营商Viettel集团的数据中心共同推动越南先进人工智能技术的发展。
原通义千问大模型技术负责人周畅(花名:钟煌)于 7 月 18 日被曝将离职创业,然而在 10 月 23 日,就有消息称周畅已经低调加入了字节跳动。
强化微调可以轻松创建具备强大推理能力的专家模型。
这个 17 岁的年轻人如何悄悄开发出一款月收入 112 万美元的 AI 应用
搜索这件事,早就被 AI 卷到天上去了。 但 Exa 的出现直接让所有玩家“破防”:他们搞了一个“史上最慢搜索引擎”,并声称:越慢,结果越牛。
就在刚刚,OpenAI 年底的 AI 春晚迎来了第二弹。 如果说昨天的 ChatGPT Pro 订阅计划震撼了普通用户的钱包,那么今天推出的产品则转向了不同的目标客户群体——企业机构和开发者。
史上首个川普自创职业——AI和加密货币「沙皇」,将钦定给马斯克密友、著名风投者David Sacks。未来,他将在AI、加密货币领域大刀阔斧,一年最多只需上班130天。
最近从由大型语言模型(LLM)驱动的聊天机器人向如今该领域所定义的 Agent 系统或 Agentic AI 的转变,可以用一句老话来概括:“少说话,多做事。”
今年上半年,Kimi 在海外曾推出过一款 AI 生成 MV 的产品——Noisee.
近两年来,AI技术取得了重大发展。与此同时,对于使用版权内容进行AI模型训练争议不断,各国也都在积极探索适合自身的规制框架。
我们可能处在一次工业革命级别的社会转型上。
今年有机会上下半年都花了不少时间待在湾区和日本东京,近距离观察两个对于SaaS与软件最肥沃的土壤是如何从犹豫、了解到拥抱AI。有人认为今年是AI落地的元年,有人已经认为不及预期,更多人愿意把答案交给时间,我是后者。但正是在混沌中才有机会可寻,才能激发创新。
旷日持久的“Kimi仲裁”案,终于迎来当事人的另一方——杨植麟的发声。此前的近一个月里,月之暗面创始人杨植麟,以及其联创兼CTO张宇韬被循环智能时期投资人提起仲裁一事,已经被讨论已久。但月之暗面一方始终噤声,对外表示一切以法律结果为准。
OpenAI“双12”直播第二天,依旧简短精悍,主题:新功能强化微调(Reinforcement Fine-Tuning),使用极少训练数据即在特定领域轻松地创建专家模型。少到什么程度呢?最低几十个例子就可以。
昨天,就在 OpenAI 12 天连发的第一天发布火遍全网的同时,微软也发布了一款重量级 AI 产品:Copilot Vision。这是一款集成在 Edge 浏览器中的 AI 助手,可以与你实时「协作上网」,并能随时提供帮助。
今天凌晨,云计算巨头亚马逊云科技的 re:Invent 与大号创业公司 OpenAI 的发布「撞了车」。后者公布了一系列生成式 AI 应用,价格更贵、性能更强大,而前者则致力于简化生产力矛盾,降低价格。
在 Minecraft 中构造一个能完成各种长序列任务的智能体,颇有挑战性。现有的工作利用大语言模型 / 多模态大模型生成行动规划,以提升智能体执行长序列任务的能力。
目前,这一领域发展迅速,但现有综述多聚焦于单智能体的架构、特定能力或多智能体系统的某些方面,尚缺乏从个体到社会模拟的系统性回顾。因此,本文试图填补这一空白,为该领域提供全面的概述。
全国首个零售金融领域大模型天镜,揭晓了过去460多天的成绩单。 目前已实现智能营销交互、数据决策支持、防伪安全等八大应用场景。1.0版本人机交互模型完成100亿交易额,全面服务超2亿用户。
融合物理知识的大型视频语言模型PhysVLM,开源了! 它不仅在 PhysGame 基准上展现出最先进的性能,还在通用视频理解基准上(Video-MME, VCG)表现出领先的性能。
OpenAI最新交互数据,就这么水灵灵被奥特曼全抖出来了: 每周超过3亿活跃用户 每天用户们在上面发送10亿条消息 130万美国开发者使用OpenAI开发,全球数量更庞大
随着“AI妖股”Applovin股价暴涨790%,市值超过1000亿美金,国内大厂正加速发力生成式 AI 营销广告领域。
苹果今日向iPhone用户推送了 iOS 18.2 RC 更新(内部版本号:22C150),本次更新距离上次发布 Beta/RC 间隔15天。