
ICML2025|清华医工平台提出大模型「全周期」医学能力评测框架MultiCogEval
ICML2025|清华医工平台提出大模型「全周期」医学能力评测框架MultiCogEval大语言模型(Large Language Models,LLMs)技术的迅猛发展,正在深刻重塑医疗行业。医疗领域正成为这一前沿技术的 “新战场” 之一。大模型具备强大的文本理解与生成能力,能够快速读取医学文献、解读病历记录,甚至基于患者表述生成初步诊断建议,有效辅助医生提升诊断的准确性与效率。
大语言模型(Large Language Models,LLMs)技术的迅猛发展,正在深刻重塑医疗行业。医疗领域正成为这一前沿技术的 “新战场” 之一。大模型具备强大的文本理解与生成能力,能够快速读取医学文献、解读病历记录,甚至基于患者表述生成初步诊断建议,有效辅助医生提升诊断的准确性与效率。
Fidji Simo以Instacart CEO的成功经验,加入OpenAI管理层。这份备忘录展示了她的宏大愿景:让AI成为知识、健康和创意的钥匙,打破资源壁垒,重塑人类的生活方式。
兄弟们!又发现宝藏项目了! 刚刚在GitHub上刷到这个叫Graphiti的东西,卧槽,简直是AI智能体的记忆神器啊!
几个月前,国际IT咨询机构Gartner给AI智能体(Agentic AI,代理式AI)算了一笔账。预测到2028年,即三年后,全球33%的企业软件将包含Agent(代理),在2024年,该比例不到1%;到2028年,15%的日常工作将由Agent自主完成,2024年该比例接近0%。
在过去很长一段时间里,科技圈似乎人均都成了“提示词工程师”,大家都在琢磨怎么用最精妙的语言驯服AI。但包括Andrej Karpathy在内的很多行业大佬已经开始反思了,他们认为,决定AI效果的关键,可能早就不是怎么问,而是你给AI喂了什么料。这个思路,就是最近越来越火的上下文工程(Context Engineering)。
如何让AI像人一样,仅凭少量演示,就能稳健适应复杂多变的真实场景? 美国东北大学和波士顿动力RAI提出了HEP(Hierarchical Equivariant Policy via Frame Transfer)框架,首创“坐标系转移接口”,让机器人学习更高效、泛化更灵活。
不经意间,这场燃烧了三年的AI热潮,已经悄然改变了我们的生活方式。我们开始习惯用AI写作、咨询,向它提出各种问题,搜索引擎的使用频率也在减少。这场改变世界的技术革命,正让那些有想法却不会写代码的普通用户,第一次有机会接触代码世界,体验创造产品的“酷”感。 Same.new正是这样一款AI开发利器。
最近看了前Tinder首席产品官Ravi Mehta的一个讲座分享视频,他在讲座中提出了一个让所有产品人都应该深思的问题:你的产品是否正面临AI颠覆的风险?看完这个讲座后,我深受震撼。不是因为AI技术有多先进,而是因为我突然意识到,我们可能正处在一个史无前例的时代——那些曾经稳固的Product Market Fit正在大规模失效。
Kimi 又火了,在 DeepSeek 的热闹中沉寂大半年后,Kimi K2 悄悄在 LMArena 竞技场中从 DeepSeek 手中,夺过了全球开源第一的宝座。
AI合成生物有用吗?究竟用在哪? 近日,美国头部市场咨询公司Lux Research发表了一篇名为《AI in Synthetic Biology: Necessary or Nice to Have?》的文章。