
DeepSeek致谢腾讯大模型网络提速技术方案贡献
DeepSeek致谢腾讯大模型网络提速技术方案贡献最近,DeepSeek工程师在GitHub上高亮了来自腾讯的代码贡献,并用“huge speedup”介绍了这次性能提升。
来自主题: AI技术研报
4794 点击 2025-05-08 15:02
最近,DeepSeek工程师在GitHub上高亮了来自腾讯的代码贡献,并用“huge speedup”介绍了这次性能提升。
鹅厂新一代旗舰大模型混元Turbo技术报告首次曝光。模型采用全新分层异构的MoE架构,总参数达万亿级别,性能仅次于GPT-4o,位列国内第一梯队。
「现在每家公司都是 AI 公司,但引入 AI 之后,利润真的能提高吗?」
大模型之争,到了不只是拼技术的时刻。
腾讯大模型“憋了一年”,终于开始放大招了。
腾讯元宝 VS GPT-4o,究竟谁技高一筹?
进入2024,大模型的风向变了。 当初“百模大战”时,只要简单粗暴拿个Demo搞MaaS(模型即服务),也就是让用户直接和大模型交互就足以上牌桌。
大模型在今年的落地,除了对用 AI 对已有业务进行改造和提效外,算力和推理的优化,可能是另外一项重要的实践了。这在腾讯的两个完全不同的业务上有着明显的体现。
3月20日,腾讯发布了2023年全年及第四季度业绩报告。在当天晚上的电话会议上,腾讯管理层给2023年提炼的经营亮点是“高度聚焦于主要产品并向高质量收入增长模型转型”。