AI资讯新闻榜单内容搜索-ASC

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: ASC
7B扩散语言模型单样例1000+ tokens/s!上交大联合华为推出LoPA

7B扩散语言模型单样例1000+ tokens/s!上交大联合华为推出LoPA

7B扩散语言模型单样例1000+ tokens/s!上交大联合华为推出LoPA

,时长 00:20 视频 1:单样例推理速度对比:SGLang 部署的 Qwen3-8B (NVIDIA) vs. LoPA-Dist 部署 (NVIDIA & Ascend)(注:NVIDIA 平台

来自主题: AI技术研报
7550 点击    2026-01-01 10:09
LeCun的JEPA已进化为视觉-语言模型,1.6B参数比肩72B Qwen-VL

LeCun的JEPA已进化为视觉-语言模型,1.6B参数比肩72B Qwen-VL

LeCun的JEPA已进化为视觉-语言模型,1.6B参数比肩72B Qwen-VL

近日,来自 Meta、香港科技大学、索邦大学、纽约大学的一个联合团队基于 JEPA 打造了一个视觉-语言模型:VL-JEPA。据作者 Pascale Fung 介绍,VL-JEPA 是第一个基于联合嵌入预测架构,能够实时执行通用领域视觉-语言任务的非生成模型。

来自主题: AI技术研报
8494 点击    2025-12-21 12:39
DeepSeek V3到V3.2的进化之路,一文看全

DeepSeek V3到V3.2的进化之路,一文看全

DeepSeek V3到V3.2的进化之路,一文看全

12 月 1 日,DeepSeek 一口气发布了两款新模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。几天过去,热度依旧不减,解读其技术报告的博客也正在不断涌现。知名 AI 研究者和博主 Sebastian Raschka 发布这篇深度博客尤其值得一读,其详细梳理了 DeepSeek V3 到 V3.2 的进化历程。

来自主题: AI技术研报
7950 点击    2025-12-08 12:48
甲骨文推出全球最大AI超算,作为OpenAI「星际之门」算力核心

甲骨文推出全球最大AI超算,作为OpenAI「星际之门」算力核心

甲骨文推出全球最大AI超算,作为OpenAI「星际之门」算力核心

甲骨文于上周发布全球最大云端AI超级计算机「OCI Zettascale10」,由80万块NVIDIA GPU组成,峰值算力高达16 ZettaFLOPS,成为OpenAI「星际之门」集群的算力核心。其独创Acceleron RoCE网络实现GPU间高效互联,显著提升性能与能效。该系统象征甲骨文在AI基础设施竞争中的强势布局。

来自主题: AI资讯
9349 点击    2025-10-21 12:07
Ilya信徒逆袭!23岁天才被OpenAI开除,靠165页AI预言书撬动15亿美金

Ilya信徒逆袭!23岁天才被OpenAI开除,靠165页AI预言书撬动15亿美金

Ilya信徒逆袭!23岁天才被OpenAI开除,靠165页AI预言书撬动15亿美金

他曾是Ilya的亲信,因揭露OpenAI安全隐患被解雇,却在短短6个月内以47%回报打造出管理规模15亿美元的基金。作为AI安全激进派,他在165页论文《Situational Awareness》中预测2027年将迎来AGI,并呼吁建立「AI版曼哈顿计划」。

来自主题: AI资讯
7823 点击    2025-08-30 18:40
融资2900万美金,AI原生的贷款发放平台,速度超传统30倍

融资2900万美金,AI原生的贷款发放平台,速度超传统30倍

融资2900万美金,AI原生的贷款发放平台,速度超传统30倍

你有没有想过,一家小企业想要贷款时,为什么总是被迫在两个极端选择之间挣扎?要么选择社区银行的低利率,但要忍受漫长的审批流程和落后的数字化体验;要么转向在线放贷平台的快速审批,却要承受高达60%的年化利率。这种看似无解的困境,正在被一家名为Casca的创业公司彻底颠覆。

来自主题: AI资讯
6751 点击    2025-08-27 11:36
硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码

硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码

硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码

自GPT-2以来,大模型的整体架构虽然未有大的变化,但从未停止演化的脚步。借OpenAI开源gpt-oss(120B/20B),Sebastian Raschka博士将我们带回硬核拆机现场,回溯了从GPT-2到gpt-oss的大模型演进之路,并将gpt-oss与Qwen3进行了详细对比。

来自主题: AI技术研报
8672 点击    2025-08-18 11:13
史上最大高质量科学推理后训练数据集开源,快速让Qwen3等变“科学家”

史上最大高质量科学推理后训练数据集开源,快速让Qwen3等变“科学家”

史上最大高质量科学推理后训练数据集开源,快速让Qwen3等变“科学家”

有史规模最大的开源科学推理后训练数据集来了! 上海创智学院、上海交通大学(GAIR Lab)发布MegaScience。该数据集包含约125万条问答对及其参考答案,广泛覆盖生物学、化学、计算机科学、经济学、数学、医学、物理学等多个学科领域,旨在为通用人工智能系统的科学推理能力训练与评估提供坚实的数据。

来自主题: AI技术研报
7094 点击    2025-08-09 15:52
AI时代的"一人独角兽":小团队如何重新定义商业成功

AI时代的"一人独角兽":小团队如何重新定义商业成功

AI时代的"一人独角兽":小团队如何重新定义商业成功

“下一家估值十亿美元的公司,也许只有一个人。”这是 2025 年红杉 AI 峰会(AI Ascent)下午场的开场白。台下本来窃窃私语的投资人一下安静了:如果这句话成真,硅谷几十年建立的“团队规模=护城河”逻辑,将被彻底改写。

来自主题: AI资讯
8468 点击    2025-05-30 15:14