击败GPT、Gemini,复旦×创智孵化创业团队「模思智能」,语音模型上新了
击败GPT、Gemini,复旦×创智孵化创业团队「模思智能」,语音模型上新了近日,由复旦邱锡鹏担任首席科学家的模思智能发布了多说话人自动语音识别(ASR)模型 MOSS-Transcribe-Diarize,不但可以语音转文字,还可以将音频片段与对话中不同的说话者关联起来,性能超过了 GPT-4o、Gemini、豆包等一众模型。
近日,由复旦邱锡鹏担任首席科学家的模思智能发布了多说话人自动语音识别(ASR)模型 MOSS-Transcribe-Diarize,不但可以语音转文字,还可以将音频片段与对话中不同的说话者关联起来,性能超过了 GPT-4o、Gemini、豆包等一众模型。
这不是一个普通的Skill,而是一把“把经验变成Skill”的工具:Claudeception是一个Meta-Skill,即专门用来“生产技能”的技能。
我最近在刷 TikTok 和 YouTube 的时候,发现一件挺有意思的事。
10B参数拥有媲美千亿级模型的多模态推理实力。
智谱AI上市后,再发新成果。
AI变聪明的真相居然是正在“脑内群聊”?!
不知道有多少人曾为了让数据图表既“好看”又“好懂”,而在设计软件与代码编辑器之间反复横跳,熬到“头秃”。
数据库技术初创公司ClickHouse 在新一轮融资中筹集了 4 亿美元,公司估值达到 150 亿美元——比不到一年前的估值翻了一番以上。这笔大规模融资传递出投资者对人工智能应用支撑型企业的青睐信号,这类企业正与Databricks 和 Snowflake 等公司展开竞争。
《晚点 Auto》独家获悉,激光雷达供应商禾赛科技联合创始人及 CTO 向少卿和 CEO 李一帆、首席科学家孙恺在 2024 年底创立了一家机器人公司 Sharpa,主要开发通用机器人及核心部件。
在2026年的世界经济论坛上,微软 CEO 萨提亚·纳德拉(Satya Nadella)与贝莱德 CEO 拉里·芬克(Larry Fink)进行了一场对话。
前两天听同事说豆包在浦东美术馆接活儿了,不光带人逛展,还包讲解的那种。(震惊.jpg)
交互、计算解耦后,穿戴设备只需要做纯交互终端就够了,手机理论上可以做得更薄,iPhone Air可以看作是在做这种准备;
不讲武德!游戏圈这回真是被AI抄家了。(doge)
刚刚,𝕏 平台(原 Twitter 平台)公布了全新的开源消息:已将全新的推荐算法开源,该算法由与 xAI 的 Grok 模型相同的 Transformer 架构驱动。
“全局交互” 几乎等同于 self-attention:每个 token 都能和所有 token 对话,效果强,但代价也直观 —— 复杂度随 token 数平方增长,分辨率一高就吃不消。现有方法大多从 “相似度匹配” 出发(attention),或从 “扩散 / 传导” 出发(热方程类方法)。但热方程本质上是一个强低通滤波器:随着传播时间增加,高频细节(边缘、纹理)会迅速消失,导致特征过平滑。
如果你最近关注了 GitHub,可能会注意到一个有趣的现象: YOLO 的版本号,直接从 11 跳到了 26。
2025 年 1 月 20 日,DeepSeek(深度求索)正式发布了 DeepSeek-R1 模型,并由此开启了新的开源 LLM 时代。在 Hugging Face 刚刚发布的《「DeepSeek 时刻」一周年记》博客中,DeepSeek-R1 也是该平台上获赞最多的模型。
知情人士独家讲述:陈天桥与代季峰的MiroMind团队发生了什么?1月18日,盛大集团与MiroMind发布联合声明,代季峰从即日起卸任技术顾问一职。这周一,MiroMind内部员工发现,代季峰已经退出了公司群。
今天,MiniMax Agent 2.0 推出了 Desktop App,能操作本地文件、自动化网页操作。MiniMax Agent 2.0 这次更新了两个核心能力:一个是 Desktop App,一个是 Expert Agents。
《读佳》获悉,Z世代社交平台Soul近期低调推出AI情绪服务小程序“塔塔疗愈所”,聚焦情绪记录、正念练习、泛心理趣味测试三大核心功能,以轻量化形态深化情绪价值供给。这一动作正值Soul冲刺IPO的关键节点,是其强化AI战略、丰富情绪服务生态的重要布局,为上市故事再添新筹码。
谁能想到,有朝一日,人在游戏里会被 AI 耍得团团转。
当 DeepSeek 和 OpenAI 的核心突破者越来越年轻,传统的简历筛选正在失效。一位前阿里达摩院的研究员,试图用 Agent 编织一张能捕捉「下一个 Ilya」的网。
昨天,Claude刚刚被曝要有永久记忆,今天就被开发者抢先一步。一个叫Smart Forking的扩展,让大模型首次拥有「长期记忆」,无需重头解释。开发者圈沸腾了:难以置信,它真的能跑!
大语言模型的爆发,让大家见证了 Scaling Law 的威力:只要数据够多、算力够猛,智能似乎就会自动涌现。但在机器人领域,这个公式似乎失效了。
我们进入了一个模型不再只是“工具”的时代。真正的突破,不在于它能做多少事,而在于它是否能读懂你的意图、情绪与沉默。
「服务器繁忙,请稍后再试。」
不要被AI的温柔表象欺骗! Anthropic最新研究刺穿了AGI的温情假象:你以为在和良师益友倾诉,其实是在悬崖边给「杀手」松绑。 当脆弱情感遇上激活值坍塌,RLHF防御层将瞬间溃缩。既然无法教化野兽,人类只能选择最冷酷的「赛博脑叶切除术」。
刚发布Cowork的Anthropic又要融资了。知情人士透露,这家公司正在敲定一轮250亿美元的巨额融资,距离上次融资仅仅过了两个多月。
最近马斯克很头疼:Grok在X上脱人衣服这件事,眼瞅着平息不了了。
作为一个科技媒体人,基本永远在路上。刚刚过去的 2025 年飞了快 10 万公里,平均每周都要出差一次,让我练就了一个「铁屁股」。