AI资讯新闻榜单内容搜索-千问

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 千问
Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了

Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了

Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了

开源大模型正在进入中国时间。 Kimi K2风头正盛,然而不到一周,Qwen3就迎来最新升级,235B总参数量仅占Kimi K2 1T规模的四分之一。 基准测试性能上却超越了Kimi K2。

来自主题: AI资讯
7744 点击    2025-07-22 15:02
凌晨!通义千问更新Qwen3旗舰模型,通用能力与长文本处理显著提升!

凌晨!通义千问更新Qwen3旗舰模型,通用能力与长文本处理显著提升!

凌晨!通义千问更新Qwen3旗舰模型,通用能力与长文本处理显著提升!

昨晚凌晨,通义千问团队宣布,已对其旗舰模型 Qwen3 进行升级,并推出非思考模式(Non-thinking)的更新版本:Qwen3-235B-A22B-Instruct-2507-FP8。此次更新旨在提升模型的综合能力

来自主题: AI资讯
10400 点击    2025-07-22 09:30
阿里通义千问Qwen Chat迎来重大更新!桌面客户端发布,支持一键唤起调用MCP

阿里通义千问Qwen Chat迎来重大更新!桌面客户端发布,支持一键唤起调用MCP

阿里通义千问Qwen Chat迎来重大更新!桌面客户端发布,支持一键唤起调用MCP

7月11日晚间,阿里通义千问团队宣布,对其人工智能聊天产品Qwen Chat进行重大更新,在优化用户交互体验的同时,还新增了多项实用功能。7月11日晚间,阿里通义千问团队宣布,对其人工智能聊天产品Qwen Chat进行重大更新,在优化用户交互体验的同时,还新增了多项实用功能。

来自主题: AI资讯
9917 点击    2025-07-13 10:32
华为 Pangu 员工自曝:盘古模型套壳、续训、洗水印

华为 Pangu 员工自曝:盘古模型套壳、续训、洗水印

华为 Pangu 员工自曝:盘古模型套壳、续训、洗水印

华为 Pangu 员工自曝盘古模型并非如内部宣称的是“从旧的135B参数继承改造而来”,而是直接套用阿里千问 1.5 110B 模型进行续训(通过加层、扩增FFN维度、添加PI机制凑参数)。作者指出:

来自主题: AI资讯
10979 点击    2025-07-07 09:58
换模型就得重新优化提示词?用下MetaSPO,专门优化系统提示的Meta-Learning框架 | 最新

换模型就得重新优化提示词?用下MetaSPO,专门优化系统提示的Meta-Learning框架 | 最新

换模型就得重新优化提示词?用下MetaSPO,专门优化系统提示的Meta-Learning框架 | 最新

每次更换语言模型就要重新优化提示词?资源浪费且效率低下!本文介绍MetaSPO框架,首个专注模型迁移系统提示优化的元学习方法,让一次优化的提示可跨模型通用。我在儿童教育场景的实验验证了效果:框架自动生成了五种不同教育范式的系统提示,最优的"苏格拉底式"提示成功由DeepSeek-V3迁移到通义千问模型,评分从0.3920提升至0.4362。

来自主题: AI技术研报
8022 点击    2025-05-19 10:11
用微信聊天记录来做AI数字的你,开源了

用微信聊天记录来做AI数字的你,开源了

用微信聊天记录来做AI数字的你,开源了

数字生命最靠谱的项目底座。就在这几天一个项目火了,就是叫做weclone。总的来说基于微信聊天记录来生成你的数字分身,现在开源了整个项目的技术是使用python来完成的,并且支持阿里同义千问2.5,现在已经有8.7K收藏了。

来自主题: AI资讯
9526 点击    2025-05-17 09:33
“Qwen3之后,我才真正敢投AI应用”

“Qwen3之后,我才真正敢投AI应用”

“Qwen3之后,我才真正敢投AI应用”

2025年4月29日凌晨,距离通义千问Qwen3正式发布还有5小时,X和GitHub上的开发者们已经搬好小板凳蹲守发布。开源社区的技术爱好者们熬夜刷新,等待第一时间测试和体验这款备受期待的中国大模型新作。

来自主题: AI资讯
9239 点击    2025-05-01 13:57
为什么李飞飞团队经常cue通义千问?

为什么李飞飞团队经常cue通义千问?

为什么李飞飞团队经常cue通义千问?

Qwen 3还未发布,但已发布的Qwen系列含金量还在上升。2个月前,李飞飞团队基于Qwen2.5-32B-Instruct 模型,以不到50美元的成本训练出新模型 S1-32B,取得了与 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型数学及编码能力相当的效果。如今,他们的视线再次投向了这个国产模型。

来自主题: AI资讯
8762 点击    2025-04-12 12:02