
3B模型长思考后击败70B!HuggingFace逆向出o1背后技术细节并开源
3B模型长思考后击败70B!HuggingFace逆向出o1背后技术细节并开源如果给小模型更长的思考时间,它们性能可以超越更大规模的模型。
如果给小模型更长的思考时间,它们性能可以超越更大规模的模型。
智东西12月17日报道,近日,估值达140亿美元的硅谷AI数据标注独角兽Scale AI被其数据标注工人诉上法庭,其华人创始人、全球最年轻的白手起家亿万富翁之一Alexandr Wang也被列为被告。
上周五(12月13日)晚,美股市场惊现“买博通、卖英伟达”:博通(broadcom)股价大涨27%,创下历史最高单日涨幅,公司市值突破1万亿美元,同时,芯片龙头英伟达的股价录得3.3%的下跌。
全球最年轻的 95 后亿万富翁、MIT 辍学生以及估值超 1000 亿的 AI 独角兽 Scale AI 创始人 Alexandr Wang 近期在 SPC 对谈时回顾了自己在 YC 创业加速器的经历。
这几天,学术圈的小伙伴肯定都很关注正在加拿大温哥华举办的机器学习顶会——NeurIPS 2024。本届会议于今日落下帷幕,共接收 15671 篇有效论文投稿,比去年增长了 27%,最终接收率为 25.8%。
讯飞医疗的拆分上市,终于有了新的进展。 港交所文件显示,12月12日,讯飞医疗科技股份有限公司通过港交所上市聆讯。该公司今年7月提交上市申请,华泰国际、广发证券(香港)、建银国际为联席保荐人。
三家最具价值的AI初创公司——Anthropic、OpenAI和xAI——都扎根美国。且美国有7家科技公司的市值达到万亿美元,而欧洲一家都没有。
Cresta由Zayd Enam、Tim Shi和Sebastian Thrun于2017年联合创立,目前由Wu Ping担任CEO,团队汇聚了来自Google、Facebook等顶尖科技公司的专家。
OpenAI和创始元老之一马斯克彻底撕破脸,公开甩出证据,打脸最近寻求美国法院阻止OpenAI转型为营利性组织的马斯克,预示着双方的法庭大战还可能升级。
阔别九月,大家期待的 DeepSeek-VL2 终于来了!DeepSeek-MoE 架构配合动态切图,视觉能力再升级。从视觉定位到梗图解析,从 OCR 到故事生成,从 3B、16B 再到 27B,DeepSeek-VL2 正式开源。