已节省数百万GPU小时!字节再砍MoE训练成本,核心代码全开源
已节省数百万GPU小时!字节再砍MoE训练成本,核心代码全开源字节对MoE模型训练成本再砍一刀,成本可节省40%! 刚刚,豆包大模型团队在GitHub上开源了叫做COMET的MoE优化技术。
字节对MoE模型训练成本再砍一刀,成本可节省40%! 刚刚,豆包大模型团队在GitHub上开源了叫做COMET的MoE优化技术。
AGI明年降临?清华人大最新研究给狂热的AI世界泼了一盆冷水:人类距离真正的AGI,还有整整70年!若要实现「自主级智能,需要惊人的10²⁶参数,所需GPU总价竟是苹果市值的4×10⁷倍!
美政府掀起了一阵AI First狂潮,而幕后推手正是科技狂人马斯克。他领衔的DOGE正打造一款AI神器GSAi,要提升政府内部12000名员工的效率,甚至还要开发一款AI编码智能体。一场效率革命,正悄然开启。
一夜之间,RTX 5070被网友们喷成“史上最差的70系列”了。
3月3日,CoreWeave提交上市招股书,申请在纳斯达克上市,股票代码为“CRWV”。据知情人士透露,CoreWeave预计通过此次上市筹集约40亿美元资金,估值目标超过350亿美元。本次交易将成为近年来AI算力领域规模最大的IPO之一。
台积电豪掷千亿美元在美建厂,特朗普高调站台。与此同时,昔日霸主英特尔奋起直追,18A制程被寄予厚望,英伟达、博通等巨头秘密测试。代工大战硝烟再起!然而,18A制程的延期又为英特尔的复兴之路蒙上阴影。
2月26日,美光宣布已率先向生态系统合作伙伴及特定客户出货专为下一代CPU设计的 1γ(1-gamma) 第六代 (10纳米级) DRAM节点DDR5内存样品。
Hugging Face发布了「超大规模实战手册」,在512个GPU上进行超过4000个scaling实验。联创兼CEO Clement对此感到十分自豪。
国际可重构计算领域顶级会议 ——FPGA 2025 在落幕之时传来消息,今年的最佳论文颁发给了无问芯穹和上交、清华共同提出的视频生成大模型推理 IP 工作 FlightVGM,这是 FPGA 会议首次将该奖项授予完全由中国大陆科研团队主导的研究工作,同时也是亚太国家团队首次获此殊荣。
据新加坡本地媒体报道,新加坡警方逮捕了两名新加坡籍男子和一名中国公民,并指控这3人涉嫌绕过了美国贸易出口限制,非法向国内的DeepSeek公司走私Nvidia GPU。据路透社报道,新加坡警方和海关突击搜查了22个地点,总计逮捕了9人,并查获了相关文件和电子记录。