AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
全球开源大模型,前十五名全是中国的

全球开源大模型,前十五名全是中国的

全球开源大模型,前十五名全是中国的

近日,随着新一代大语言模型(LLM)的一波更新,开源大模型再次成为了热门讨论话题。软件工程师、自媒体 Rohan Paul 发现了一个惊人的现象:Design Arena 排行榜上排名前十几位开源 AI 模型全部来自中国。

来自主题: AI资讯
8689 点击    2025-08-26 12:20
ChatGPT到底学了多少「污言秽语」?清华团队首提大语言模型中文语料污染治理技术

ChatGPT到底学了多少「污言秽语」?清华团队首提大语言模型中文语料污染治理技术

ChatGPT到底学了多少「污言秽语」?清华团队首提大语言模型中文语料污染治理技术

如果我们的教科书里包含大量的污言秽语,那么我们能学好语言吗?这种荒唐的问题却出现在最先进 ChatGPT 系列模型的学习过程中。

来自主题: AI技术研报
8497 点击    2025-08-26 12:11
唯快不破:上海AI Lab 82页综述带你感受LLM高效架构的魅力

唯快不破:上海AI Lab 82页综述带你感受LLM高效架构的魅力

唯快不破:上海AI Lab 82页综述带你感受LLM高效架构的魅力

近年来,大语言模型(LLMs)展现出强大的语言理解与生成能力,推动了文本生成、代码生成、问答、翻译等任务的突破。代表性模型如 GPT、Claude、Gemini、DeepSeek、Qwen 等,已经深刻改变了人机交互方式。

来自主题: AI技术研报
8026 点击    2025-08-26 11:30
真实场景也能批量造「险」!VLM+扩散模型打造真实域自动驾驶极限测试

真实场景也能批量造「险」!VLM+扩散模型打造真实域自动驾驶极限测试

真实场景也能批量造「险」!VLM+扩散模型打造真实域自动驾驶极限测试

浙江大学与哈工大(深圳)联合推出SafeMVDrive,利用扩散模型结合VLM实现批量化多视角真实域的安全关键视频生成。该方法在保持画质与真实感的同时,显著增强了驾驶场景的危险性。生成的场景用于端到端自动驾驶系统的极限压测,可使得模型的碰撞率提升50倍。

来自主题: AI技术研报
7643 点击    2025-08-26 10:47
2025临界点:AI智商超越人类,经济规则即将改写

2025临界点:AI智商超越人类,经济规则即将改写

2025临界点:AI智商超越人类,经济规则即将改写

AI的平均智商已突破110,正式超越普通人类。2025,AI开始参与经济系统的「全链条操作」。从信息收集、判断决策到实际执行,完整经济链条第一次有非人类主体独立运行,AI改写商业底层规则!凯恩斯百年预言终将来临,AI经济正在浮现。

来自主题: AI资讯
7843 点击    2025-08-26 10:33
突发!Deepseek最新模型被外网爆出恶性Bug??

突发!Deepseek最新模型被外网爆出恶性Bug??

突发!Deepseek最新模型被外网爆出恶性Bug??

一早起来,看到群里炸了锅!主角是我们备受期待的 DeepSeek V3.1 模型。有用户反馈,该模型在生成文本时,会毫无征兆地随机插入“极”这个汉字(繁体简体都会)

来自主题: AI资讯
9931 点击    2025-08-26 10:14
字节大模型团队核心再出走,视觉基础研究负责人冯佳时离职Seed,或投身新一轮AI创业

字节大模型团队核心再出走,视觉基础研究负责人冯佳时离职Seed,或投身新一轮AI创业

字节大模型团队核心再出走,视觉基础研究负责人冯佳时离职Seed,或投身新一轮AI创业

据申妈朋友圈报道,字节Seed大模型视觉基础研究团队负责人冯佳时已正式离职。根据其在字节的职级体系判断,他的级别应在4-1或4-2之间,属于公司最为稀缺的核心研究序列。冯佳时后续去向或是AI创业。

来自主题: AI资讯
10164 点击    2025-08-25 23:05
中国AI创业只是少数人的游戏

中国AI创业只是少数人的游戏

中国AI创业只是少数人的游戏

AI一日,人间一年。 大语言模型的战局刚刚尘埃落定,Agent的热潮又汹涌而至。

来自主题: AI资讯
9365 点击    2025-08-25 16:18
大模型能否为不同硬件平台生成高性能内核?南大、浙大提出跨平台内核生成评测框架MultiKernelBench

大模型能否为不同硬件平台生成高性能内核?南大、浙大提出跨平台内核生成评测框架MultiKernelBench

大模型能否为不同硬件平台生成高性能内核?南大、浙大提出跨平台内核生成评测框架MultiKernelBench

在深度学习模型的推理与训练过程中,绝大部分计算都依赖于底层计算内核(Kernel)来执行。计算内核是运行在硬件加速器(如 GPU、NPU、TPU)上的 “小型高性能程序”,它负责完成矩阵乘法、卷积、归一化等深度学习的核心算子运算。

来自主题: AI技术研报
8656 点击    2025-08-25 15:44