
破解「个性化学习」长尾难题,巧用神经坍缩理论 | ICML 2025
破解「个性化学习」长尾难题,巧用神经坍缩理论 | ICML 2025NCAL是一种新的个性化学习方法,它通过优化文本嵌入的分布来解决教育数据中常见的长尾分布问题,从而提高模型对少数类别的处理能力。
NCAL是一种新的个性化学习方法,它通过优化文本嵌入的分布来解决教育数据中常见的长尾分布问题,从而提高模型对少数类别的处理能力。
你有没有想过,为什么那些最聪明的AI工程师要把80%的时间浪费在修复数据基础设施上,而不是构建真正改变世界的AI应用?这个看似不合理的现象,正是Eventual创始人Sammy Sidhu和Jay Chia在Lyft自动驾驶部门工作时亲身经历的痛苦。
香港大学NLP团队联合字节跳动Seed、复旦大学发布名为Polaris的强化学习训练配方:通过Scaling RL,Polaris让4B模型的数学推理能力(AIME25上取得79.4,AIME24上取得81.2)超越了一众商业大模型,如Seed-1.5-thinking、Claude-4-Opus和o3-mini-high(25/01/31)。
就在刚刚,据《连线》杂志报道,OpenAI 总裁 Greg Brockman 本周二在公司 Slack 群里宣布从特斯拉、xAI 和 Meta 挖来四位硬核工程师,并将加入 OpenAI 的扩展团队。值得一提的是,Dalton 和 Ruddarraju 之前也都曾在 Robinhood 工作过。
近日,以色列初创公司Algocell宣布获得 280 万美元(约合人民币2000万元)的种子前融资。
刚刚,AI制药从理论迈向实践的关键一步!DeepMind分拆公司,亮出「秘密武器」:基于AlphaFold系统研发的候选药物,已进入人体临床实验。这意味着将大幅缩短新药研发周期、降低成本,加速新药惠及患者。
你有没有想过,为什么实体店的转化率能达到30-35%,而在线购物网站却只有可怜的1.5%?
安全研究团队 General Analysis 日前警告称,如果你使用了 Cursor 搭配 MCP,有可能在毫不知情的情况下,把你的整个 SQL 数据库泄露出去——而攻击者仅靠一条“看起来没什么问题”的用户信息就能做到这一点。
Meta挖走OpenAI大批员工后,又用OpenAI的技术搞出新突破。新架构名为2-Simplicial Transformer,重点是通过修改标准注意力,让Transformer能更高效地利用训练数据,以突破当前大模型发展的数据瓶颈。
“上线 4 个月,DAU 破百万,累计用户破千万,用户日均对话次数超 9 次,跻身国内同类产品第一梯队 ——元石科技的‘问小白’用生成式推荐重新定义AI时代的信息获取与消费。