
ChatGPT后训练方法被OpenAI离职联创公开,PPT全网转~
ChatGPT后训练方法被OpenAI离职联创公开,PPT全网转~离开OpenAI后,他们俩把ChatGPT后训练方法做成了PPT,还公开了~
离开OpenAI后,他们俩把ChatGPT后训练方法做成了PPT,还公开了~
「医生,你开的这些检查都没有必要,属于『过度检查』。」「谁说没有必要?」「DeepSeek 说的。」最近,有位家属在社交平台上发文表示,孩子在医院接受的部分检查被 DeepSeek 判断为「可能非必要」,于是这位家属认为接诊的医生是在「开过度的检查」,让人「花冤枉钱」。
从春节至今,DeepSeek的热度还在走高。
OpenAI前CTO Murati离职后,终于官宣新动向!她创立的「思考机器实验室」汇聚了OpenAI、谷歌DeepMind等顶尖AI人才,包括OpenAI联合创始人Schulman、前安全副总Lilian Weng等。
AI智能便携硬件+1。
推进AI良率管理。
公考机构得跟AI抢生源了
有AI,中止交易!
再次证明,AI行业里大力出奇迹。
Transformer 架构在过去几年中通过注意力机制在多个领域(如计算机视觉、自然语言处理和长序列任务)中取得了非凡的成就。然而,其核心组件「自注意力机制」 的计算复杂度随输入 token 数量呈二次方增长,导致资源消耗巨大,难以扩展到更长的序列或更大的模型。
当全球AI军备竞赛尚未燃起狼烟时,一位中国青年已悄然完成技术储备。潞晨科技创始人尤洋——这位拥有传奇学历背景的90后科技精英,在读书期间,就意识到到了“AI是未来,中国人要有自己的技术”。
我们正见证一场静默的推理革命。传统AI训练如同盲人摸象,依赖碎片化文本拼凑认知图景,DeepSeek-AI团队的CODEI/O范式首次让机器真正"理解"了推理的本质——它将代码执行中蕴含的逻辑流,转化为可解释、可验证的思维链条,犹如为AI装上了解剖推理过程的显微镜。
去年 8 月,Codeium 完成了由 General Catalyst、Kleiner Perkins 等参与的 1.5 亿美元融资,估值来到 12.5 亿美元,是这些老牌基金在 AI Coding 领域下的重注。之后在 11 月 Codeium 正式发布了 Agentic IDE Windsurf,与 Cursor/Devin 进行差异化竞争。
这个AI领域千亿级市场,将辐射千家万户。 DeepSeek-R1横空出世,打响了大模型比拼性价比的第一枪。 Meta、OpenAI等国外头部大模型厂商纷纷复刻或变相降价。比DeepSeek-R1晚两周发布的OpenAI o3-mini模型,定价比前代模型o1-mini降低了超6成,比前代完整版的o1模型便宜超9成。
今天凌晨,一个创业消息引爆了整个 AI 社区:一家名为 Thinking Machines Lab 的新创业公司建立了,而其背后有一个堪称有史以来最豪华的大模型创业团队阵容。
“我十分想见梁文锋。” DeepSeek火了之后,投资圈开始焦虑了。 根据“路边消息社”报道,“最近想要见DeepSeek创始人梁文锋,需要汇报到地方办公室。”根据报道,最近想要约见梁文锋的投资机构太多,为了保护这位AI大牛,想约见他的机构,需要先报到省委办公厅。
大模型混战,一边卷能力,一边卷“低价”。 DeepSeek彻底让全球都坐不住了。 昨天,马斯克携“地球上最聪明的AI”——Gork 3在直播中亮相,自称其“推理能力超越目前所有已知模型”,在推理-测试时间得分上,也好于DeepSeek R1、OpenAI o1。不久前,国民级应用微信宣布接入DeepSeek R1,正在灰度测试中,这一王炸组合被外界认为AI搜索领域要变天。
任何一张照片,直接就能定位照片中的具体所在地,并呈现出对应的3D场景。GeoSpy使得这一切都成为了现实,但大家也都为此而感到隐私泄露的巨大风险和潜在危害。
接了 AI,带有翻译功能的蓝牙耳机,在美国彻底卖爆了。 在 TikTok 上,你能看到各色博主在向外国消费者推荐 9.9 美元的「翻译耳机」,尤其在 AI 创新最为积极的美国,人们对于这些所谓「接入 AI」的蓝牙耳机趋之若鹜。
RedStone是一个高效构建大规模指定领域数据的处理管道,通过优化数据处理流程,从Common Crawl中提取了RedStone-Web、RedStone-Code、RedStone-Math和RedStone-QA等数据集,在多项任务中超越了现有开源数据集,显著提升了模型性能。
强化学习训练数据越多,模型推理能力就越强?新研究提出LIM方法,揭示提升推理能力的关键在于优化数据质量,而不是数据规模。该方法在小模型上优势尽显。从此,强化学习Scaling Law可能要被改写了!
带点特斯拉、SpaceX 基因,工程能力很强。
就在刚刚,奥特曼发了个推特,轻描淡写透露了个大消息: For our next open source project……
不过半月,Ilya神秘初创SSI又被曝出将完成超10亿美金新一轮融资,估值超300亿。成立8个月时间,官网至今也只有一页文字。
随着 Roblox 和 Minecraft 等游戏平台在年轻儿童中越来越受欢迎,以及 YouTube 等平台占据了他们每天大量的屏幕时间,教育科技公司在吸引他们的注意力方面面临挑战。
刚刚,马斯克xAI的Grok 3终于亮相(超300万人次围观)!一出道即巅峰,竞技场(lmarena.ai)官方给出了这样的评价:Grok 3是首个突破1400分的模型,并且在所有类别中排名第一。
近两年来,AI Coding赛道迎来井喷式发展,GitHub Copilot、Cursor等产品收入增长迅猛,科技巨头和风险投资纷纷加码,新一代AI Coding产品在提升开发效率、减少错误和确保代码质量方面表现出色,正在深刻改变软件开发生态。
用扩散模型替代自回归,大模型的逆诅咒有解了!
刚刚,阶跃星辰联合吉利汽车集团,开源了两款多模态大模型!新模型共2款:全球范围内参数量最大的开源视频生成模型Step-Video-T2V行业内首款产品级开源语音交互大模型Step-Audio多模态卷王开始开源多模态模型,其中Step-Video-T2V采用的还是最为开放宽松的MIT开源协议,可任意编辑和商业应用。
毫不意外地,DeepSeek的火烧到了硬件行业。