
全球第一再升级!MiniMax Speech 2.5上线:多语种表现力更强,音色复刻更“像”
全球第一再升级!MiniMax Speech 2.5上线:多语种表现力更强,音色复刻更“像”今天,MiniMax发布新一代语音生成模型Speech 2.5,再次刷新全球最强语音模型的上限。
今天,MiniMax发布新一代语音生成模型Speech 2.5,再次刷新全球最强语音模型的上限。
对大公司来说,钱不值钱,最值钱的是时间。本期播客,我们邀请在硅谷专注 AI 企业级应用、医疗和工业自动化早期投资的风险投资机构 Fusion Fund 创始合伙人张璐,梳理上半年硅谷的科技大事件,以及从 Windsurf 收购案入手,分析这件事折射出了硅谷的初创生态在发生的变化,以及从 Meta 到 Google、再到苹果、亚马逊、微软,上半年的一些关键动作意味着哪些战略选择。
一句话概括,花大价钱请来的AI智能体天天搁那儿“过度思考”,这篇论文教你如何让它“该省省该花花”,别再当冤大头了,当你给智能体卸掉复杂记忆/冗余规划这些"奢侈品"后,发现它跑得比香港记者还快还便宜。
近日,百川AI助诊仪在海淀区多个社区卫生服务中心上岗"执业",“AI+真人”的双医模式累计服务7743人次,海淀居民感受到了高水平AI医生带来的体验冲击。 北京市海淀区人民政府副区长林航介绍:依托“海淀健康”小程序上线AI医生助手,可辅助诊断3000多种常见疾病,有效提升了家庭医生的服务质量和效率。
英国职场心理健康初创公司Unmind近日完成了C轮融资,筹集资金达3060万欧元。这笔资金将用于进一步扩展其基于人工智能的心理健康支持平台,以帮助全球员工提升心理健康水平。
朋友,你只需输入下方的提示词。 给孩子解释下他是怎么来的,用宫崎骏的风格输出 一个儿童绘本就造好了。 有封面,能定制配图风格,有暖心的小故事。 甚至只花了不到 1 分钟。
当老年大学还在“唱歌跳舞”,AI 教练已用“彩虹夸夸术”,点亮1800万会员的新生活。
近一年来,围绕人工智能(AI)、生成式 AI(GenAI)和大语言模型(LLM)的炒作愈演愈烈,大众的兴趣翻了一番,针对 AI 的投资激增,各国政府也采取了更加明确的立场。根据一些人的说法,AI 与人类的未来息息相关。
人工智能引领第四次科技革命,是当前最火的、最具前景、最具爆发力的科技赛道。进入到2025年,发生了什么新的变化?中国人工智能正告别“百模大战”的规模竞赛,向以DeepSeek等六小虎为代表的头部大模型集中。AI发展的核心,从追求模型“可用”转向实现场景的“好用”。
昨天是个热闹的日子,OpenAI 和 Anthropic 几乎在同一时间发布了自家的新款模型:前者是自 GPT-2 以来重新开源的两款模型 gpt-oss(120b 和 20b),后者是 Claude 系列最强的 Opus 4.1。
大量工作在争夺用户注意力上,不少不错的细节提升,但没有大的惊喜,甚至一度有些好笑,“AGI”还早,肉搏时代开启了。
只靠说话和AI眼镜互动,确实有点不方便。现在新玩法来了!数字替身帮你“隔空抓物”,混合现实即时选择现实世界的物体作为上下文。
我非常不理解为什么有AI创业者选择播客赛道。 音频播客是一个非常小众的市场。小宇宙日活只有几百万,基本只有一线城市白领收听。就算是海外市场,Spotify都不能靠播客盈利,播客只会拖累其利润。 AI播客更是一个纯粹的、非常伪的伪命题。
2023年,当整个AI行业都在为“最强大模型”争得头破血流时,亚马逊云科技却洞察到一个关键事实:AI的价值不在于谁的模型最强大,而在于能否为不同场景选择最适合的模型。
全网疯玩Genie3,惊叹:这才是真正的大世界!距离上一代Genie2,才刚刚过去7个多月,谷歌世界模型就像开了倍速进化
强化学习(RL)范式虽然显著提升了大语言模型(LLM)在复杂任务中的表现,但其在实际应用中仍面临传统RL框架下固有的探索难题。
在人工智能技术浪潮的席卷下,AI在编程领域的应用正以令人目眩的速度演进,深刻改变着软件开发行业的固有格局。
强化学习+任意一张牌,往往就是王炸。专注于LLM+RL的科技公司OpenPipe提出全新开源强化学习框架——MCP·RL。
Tavily,一家为AI提供企业级安全搜索API的初创公司,于近日完成2000万美元的A轮融资,由Insight Partners领投,公司累计融资额达2500万美元。Tavily源自其创始人在2023年创建的、在GitHub上广受欢迎的开源项目GPT Researcher,专注于解决AI智能体在访问互联网时面临的合规与安全挑战。
近日,麻省理工学院也推出了一个AI学习平台。这个名叫MIT Learn的平台提供超过12700个学习资源,其中大部分是免费的。这个名叫MIT Learn的平台提供超过12700个学习资源,其中大部分是免费的。
一个半小时之前,Ghat GPT 5,千呼万唤始出来,然后端了许多公司。刚刚研读了 GPT5 完整技术文档,先分享一下技术细节。刚刚研读了 GPT5 完整技术文档,先分享一下技术细节。
2025年7月,X(原推特)的首页被一个金色双马尾、身着黑色露肩连衣裙和渔网黑丝的二次元少女刷屏了。关于她的帖子浏览量动辄达到几十万甚至上百万。这里面有着各种画风和姿势的二创图:
FlowSpeech的开发初衷源于一个感人故事。一位年过八旬的美国老人因长期病痛失去说话能力,但通过AI工具ListenHub继续与他人分享自己的人生经历。这个真实案例启发了开发团队,促使他们研发出专门针对书面语向口语转换的TTS技术解决方案。
AI药物研发领域,又一家黑马公司诞生了!就在今天,AI制药公司Chai Discovery宣布完成7000万美元(约合人民币5亿元)的A轮融资。就在今天,AI制药公司Chai Discovery宣布完成7000万美元(约合人民币5亿元)的A轮融资。
被挖怕了!保密员工名字还不够,奥特曼为“防挖”又出新招—— 开启新一期员工期权兑现计划,按照5000亿美元的估值来兑现。 股权变钞票!这下人才总能留住一部分了吧。
GPT-5终于要来了,就在刚刚,已经有人通过Copilot放出了GPT-5的惊人实测,推理能力强到离谱。明天凌晨,GPT-5、GPT-5 Mini和GPT-5 Nano全家桶将悉数登场,全网已经high起来了。
擅长「种草」的小红书正加大技术自研力度,两个月内接连开源三款模型!最新开源的首个多模态大模型dots.vlm1,基于自研视觉编码器构建,实测看穿色盲图,破解数独,解高考数学题,一句话写李白诗风,视觉理解和推理能力都逼近Gemini 2.5 Pro闭源模型。
明天,Grok 对阵 OpenAI 的 o3。 谁也没想到,谷歌攒的 Kaggle AI Chess 比赛(即大模型国际象棋对抗赛),在半决赛中,Grok 4 击败 Gemini 2.5 Pro,进入总决赛!
QuestMobile 发布了 2025 年国内 AI 应用的上半年报告,总的来说,相比海外市场 app 和 web 市场都很火热的情况,国内市场的情况差别比较大。
我在去年底介绍过一个面向财务的 AI 同事类产品,当时拿了快 900 万美金的融资《CFO 的 AI 同事来了,种子轮拿了快 900 万美金》。