
英国AI初创公司Portia AI完成440万英镑融资:打造可控可信的AI代理新时代
英国AI初创公司Portia AI完成440万英镑融资:打造可控可信的AI代理新时代在生成式AI和多智能体系统迅速发展的当下,谁能率先解决“可信度”和“可控性”问题,谁就能真正把AI带入生产级别的商业落地。英国AI创业公司 Portia AI,正是在这个方向上突围的代表。
在生成式AI和多智能体系统迅速发展的当下,谁能率先解决“可信度”和“可控性”问题,谁就能真正把AI带入生产级别的商业落地。英国AI创业公司 Portia AI,正是在这个方向上突围的代表。
视频理解的CoT推理能力,怎么评?
AI趋势正在“中场休息”,在此之前训练>评估,在此之后评估>训练。
让推理模型不要思考,得到的结果反而更准确?
多模态生成技术持续突破内容创作的边界。
“DeepSeek,评价一下第三届中国AIGC产业峰会”:
2025,当大模型来到应用爆发之年,越来越多的垂直行业当中,开始涌现出AI落地的经典实践案例。
最近,来自大连理工和莫纳什大学的团队提出了物理真实的视频生成框架 VLIPP。通过利用视觉语言模型来将物理规律注入到视频扩散模型的方法来提升视频生成中的物理真实性。
“人工智能数据中心的能源成本迅速上升,占据了全球头条新闻,然而硬件生命周期中其他环节对环境造成的影响却鲜少被提及。人工智能硬件的制造过程是能源密集型的,并且具有很深的环境足迹。”Digiconomist创始人、绿色和平组织所发报告《芯片制造的关键节点:追踪芯片制造中的电力消耗与碳排放》(下称报告)作者之一的Alex de Vries说。
据《纽约时报》报道,特朗普政府正考虑对中国AI公司DeepSeek实施新的限制措施,包括禁止其采购英伟达AI芯片,并可能限制美国用户访问其AI服务。这一举措是特朗普政府加速人工智能领域中美竞争战略的一部分。自DeepSeek以破坏性创新震撼硅谷与华尔街以来,美国政府内部已开始权衡多种应对方案,旨在限制中国获取美国核心技术、以及进入美国消费者市场的能力。
高德地图正式宣布,推出全球首个基于地图的AI导航智能体(NaviAgent),应用创新技术理念和架构,推动导航这一历史悠久的服务,由传统出行工具,向“会思考、能预判、有温度”的智能出行伙伴蜕变。
“史上最强视觉生成模型”,现在属于快手。一基双子的可灵AI基础模型——文/图生图的可图、文/图生视频的可灵,都重磅升级到2.0版本。可图2.0,对比MidJourney 7.0,胜负比「(good+same) / (same+bad)」超300%,对比FLUX超过150%;
今天,字节发布了一整套 AI 全家桶,深度思考模型、视觉推理、文生图、AI Agent……几乎涵盖了最近 AI 圈关注度最高的产品。字节发布的产品和亮点有哪些:1. 豆包 1.5 · 深度思考模型,2. 文生图 3.0
不止GPT-4o可以制作吉卜力风格图像!更多工具都可以制作吉卜力风图像。甚至2分钟之内,还能用照片生成吉卜力风格动画:蒙娜丽莎给你说Hello。
线下难觅踪影,出海才是康庄大道?
顶会论文评审,AI立大功!ICLR 2025首次大规模引入AI参与审稿,最终有12222条建议被审稿人采纳,89%情况下提升了评审质量。详细30页报告,揭秘AI在顶会审稿的惊人潜力。
Transformer架构主导着生成式AI浪潮的当下,但它并非十全十美,也并非没有改写者。
多智能体系统分布式共识优化的一系列研究来了!
OpenAI新模型全网实测惊艳来袭!o3缩放图像被玩疯,o4-mini速解Project Euler,碾压人类。AI初创CEO说,OpenAI凭此一役已经重回榜首,甚至有经济学家直言AGI已经来临!
AI 外衣下的“血汗工厂”
凌晨3点,AI第8次把按钮写成button_1,我差点把电脑砸了...
这是一份142页的研究论文,本文深入解析了大型推理模型DeepSeek-R1如何通过"思考"解决问题。研究揭示了模型思维的结构化过程,以及每个问题都存在甜蜜点"最佳推理区间"的惊人发现。这标志着"思维学"这一新兴领域的诞生,为我们理解和优化AI推理能力提供了宝贵框架。
向量模型的核心功能是测量语义相似度,但这个测量结果很容易受到多种干扰因素的影响。在本文中,我们将着眼于文本向量模型中一个普遍存在的偏差来源:输入内容的长度。
今年的 GTC 大会,英伟达发布了通用机器人模型 GR00T N1,老黄特别提到未来重点关注的趋势是「Physical AI」(物理 AI)。
从人们被大模型“震撼”完开始思考如何把这项技术用起来的第一天,教育就是被很多人天然想到的场景。一个能压缩全世界知识的AI,天然就是一个人类想象里“老师”的样子。
当前,所有主流的视觉基础模型(如 SigLIP、DINOv2 等)都仍然在低分辨率(如 384 * 384 分辨率)下进行预训练。对比人类视觉系统可以轻松达到 10K 等效分辨率,这种低分辨率预训练极大地限制了视觉模型对于高清细节的理解能力。
模型正重塑我们的社会文化生态,但其本质常被误解。《Science》上的一篇最新文章,揭示大模型并非自主智能主体,而是一种革命性文化社会技术,类似于语言、印刷与市场制度。它以独特方式汇聚并重构人类信息,成为“人类社会人工系统”的新变体。
即将重新定义社交
在今天凌晨1点的产品发布中,OpenAI还开源了一个终端轻量级代码Agent智能体——Codex CLI。