大模型如何推理?斯坦福CS25重要一课,DeepMind首席科学家主讲
大模型如何推理?斯坦福CS25重要一课,DeepMind首席科学家主讲所有学LLM的人都要知道的内容。 这可能是对于大语言模型(LLM)原理最清晰、易懂的解读。
所有学LLM的人都要知道的内容。 这可能是对于大语言模型(LLM)原理最清晰、易懂的解读。
Yann LeCun的AI故事,纪录片回顾了这位深度学习先驱的四十年历程。从索邦大学的孤独探索,到贝尔实验室发明卷积神经网络、推动支票识别商用,再与Hinton、Bengio共创深度学习革命,他始终坚信机器应学会学习。
太夸张!百度办AI“培训班”,大佬都纷纷要来拜师学艺。 刚刚百度举办了首席AI架构师培养计划 (AICA)的第九期开学典礼,一看吓一跳,本期学员里可谓是卧虎藏龙。
这阵子玩了不少 AI 应用,感觉大家都在卷一个事,让 AI 更强、更快、更全能。但聊多了会发现,无论模型能力多强,它们大多还像是解决问题的工具,在下一次对话里把你忘得一干二净。
第一财经「新皮层」独家获悉,快手副总裁、大模型负责人张迪将离职,快手高级副总裁、可灵AI事业部负责人兼社区科学线负责人盖坤将兼任可灵AI技术部负责人,「更深地管技术」。
只需要一句话或一张图片,就能生成360度全景3D世界。
AI现在可以帮你生成音乐,把自拍照变成文艺复兴风格的肖像画,甚至能帮你预订晚餐。但如果你让它处理发票对账、订单录入或者文件验证,它就开始抓瞎了,最后这些活还是得靠某个打开了15个浏览器标签页、有着超强耐心的员工来完成。
有趣,一款仅4B大小的开源模型Jan-v1,居然声称能平替Perplexity Pro。 并且完全免费,支持本地部署。
8 月 13 日,Google I/O Connect China 2025——Google 开发者大会在上海拉开帷幕。来自 Google 全球不同领域的专家,为中国出海开发者们带来 AI 驱动下的前沿技术、创新开发工具以及全球化平台的最新动态。
天啊,首届人形机器人运动会,现场乱成一锅粥了。 宇树机器人勇夺1500米长跑金牌,但撞人还逃逸了
2025 年,人工智能的叙事已经不再靠“模型突破”来驱动,而是进入了“应用激战区”。 硅谷著名孵化器 Y Combinator 在官网上直言——“2025 年有望成为 AI Agent 之年。”
情绪价值这块儿,GPT-5让很多网友大呼失望。 免费用户想念GPT-4o,也只能默默调理了。
GPT-5比人类医生还会看X光片?! 最新研究显示,GPT-5对医学影像的推理和理解准确率分别比人类专家高出24.23%和29.40%。
一家名为Palabra AI 的初创公司正在开发 AI 语音翻译引擎,致力于解决教学大型语言模型(LLMs)理解多种语言这一颇具挑战性的难题。
如果你是一名正在投身 AI 浪潮的创业者,或者一个正在思考,如何利用 AI 改造现有业务的从业者,那么 G7 易流 CEO 翟学魂的经历,或许能给你带来一些重要的启示。
前几天发现一个有意思的应用 Macaron,靠颜值就吸引了我,整个设计风格非常的阳光而且高级,尤其是里面的图标,很好看。
今年 6 月,The Browser Company 向 Arc 用户开放了浏览器 Dia 的 Beta 测试。上个月,Perplexity 新推出了自己的 AI 原生浏览器 Comet,随后 OpenAI 也宣布计划在未来几周发布浏览器。
AI领域一度陷入“上下文窗口”的军备竞赛,从几千token扩展到数百万token。这相当于给了AI一个巨大的图书馆。但这些“百万上下文”的顶级模型,它究竟是真的“理解”了,还是只是一个更会“背书”的复读机?
AI生成论文泛滥成灾,arXiv平台看不下去了—— 紧急升级审核机制,用自动化工具来检测AI生成内容。 Nature最新发现,原来每年竟然都有2%的论文会因为AI使用被拒?! 比如像,bioRxiv和medRxiv每天都要拒绝十多篇公式化AI手稿,每个月就高达7000多份。
谷歌开源Gemma 3 270M闪亮登场!只需几分钟即可完成微调,指令遵循和文本结构化能力更是惊艳,性能超越Qwen 2.5同级模型。
前沿 AI 模型真的能做到博士级推理吗? 前段时间,谷歌、OpenAI 的模型都在数学奥林匹克(IMO)水平测试中达到了金牌水准,这样的表现让人很容易联想到 LLM 是不是已经具备了解决博士级科研难题的推理能力?
无需人工标注,吞下17亿张图片,Meta用自监督学习炼出「视觉全能王」!NASA已将它送上火星,医疗、卫星、自动驾驶领域集体沸腾。
首个开源多模态Deep Research Agent来了。整合了网页浏览、图像搜索、代码解释器、内部 OCR 等多种工具,通过全自动流程生成高质量推理轨迹,并用冷启动微调和强化学习优化决策,使模型在任务中能自主选择合适的工具组合和推理路径。
加拿大AI新贵Cohere获5亿美元融资、估值68亿美元,前Meta FAIR副总裁、PyTorch与Llama重要推手Joelle Pineau加盟出任首席AI官,或将开启企业AI新战局。
随手拍的一张图,就能秒变3A级游戏大作?! 刚刚,腾讯全新开源游戏视频生成框架Hunyuan-GameCraft,专为游戏环境设计,让任何人都能轻松搞定游戏制作。
10亿用户App转向AI原生应用,大船如何掉头?高德最近打了个样,用AI重构底层技术栈,建立主-从Agent架构,将千问大模型与空间智能结合,展现出了新范式的强大威力,给用户带去了极大便利。
给 Sam 的专业建议:直播选人要小心。 大家都是老朋友,在新 Lab 聚首了。
GPT-5发布以来,路由架构是最受关心的部分之一。它不仅实现了多个模型统一调度,而且还藏着奥特曼的诸多小心思。比如成本更可控、悄悄识别意图插入广告等。
短短两个月前,我们还在感叹 31 家 AI 小团队的高效表现,当时团队平均规模仅 20 人,人均创造收入高达 279 万美元(参见《细数 31 家 AI 应用小团队,平均 20 人、人均创收 279 万美元》)。
疯狂的七月已经落下了帷幕,如果用一个词来形容国产大模型,「开源」无疑是当之无愧的高频词汇。