AI资讯新闻榜单内容搜索-训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 训练

一键开关灯！谷歌用扩散模型，将电影级光影控制玩到极致

一键开关灯！谷歌用扩散模型，将电影级光影控制玩到极致

一键开关灯！谷歌用扩散模型，将电影级光影控制玩到极致

最近，Google 推出了一个可以精准控制画面中光影的项目 —— LightLab。它让用户能够从单张图像实现对光源的细粒度参数化控制，可以改变可见光源的强度和颜色、环境光的强度，并且能够将虚拟光源插入场景中。

来自主题: AI技术研报

8976 点击 2025-05-16 15:14

GPT-4V仅达Level-2？全球首个多模态通才段位排行榜发布，General-Level打造多模态通用AI评测新范式

GPT-4V仅达Level-2？全球首个多模态通才段位排行榜发布，General-Level打造多模态通用AI评测新范式

GPT-4V仅达Level-2？全球首个多模态通才段位排行榜发布，General-Level打造多模态通用AI评测新范式

多模态大模型（Multimodal Large Language Models, MLLM）正迅速崛起，从只能理解单一模态，到如今可以同时理解和生成图像、文本、音频甚至视频等多种模态。正因如此，在AI竞赛进入“下半场”之际（由最近的OpenAI研究员姚顺雨所引发的共识观点），设计科学的评估机制俨然成为决定胜负的核心关键。

来自主题: AI技术研报

9597 点击 2025-05-16 15:06

梁文锋署名DeepSeek新论文：公开V3大模型降本方法

梁文锋署名DeepSeek新论文：公开V3大模型降本方法

梁文锋署名DeepSeek新论文：公开V3大模型降本方法

梁文锋亲自参与的DeepSeek最新论文，来了！

来自主题: AI技术研报

8728 点击 2025-05-16 11:47

个人开发者训400亿参数大模型：分布式算力，DeepSeek架构，3090单卡部署

个人开发者训400亿参数大模型：分布式算力，DeepSeek架构，3090单卡部署

个人开发者训400亿参数大模型：分布式算力，DeepSeek架构，3090单卡部署

打破科技巨头算力垄断，个人开发者联手也能训练超大规模AI模型？

来自主题: AI资讯

9376 点击 2025-05-16 11:10

「边思考、边搜索、边写作」WebThinker开启AI搜索&研究新纪元！

「边思考、边搜索、边写作」WebThinker开启AI搜索&研究新纪元！

「边思考、边搜索、边写作」WebThinker开启AI搜索&研究新纪元！

大型推理模型（如 OpenAI-o1、DeepSeek-R1）展现了强大的推理能力，但其静态知识限制了在复杂知识密集型任务及全面报告生成中的表现。为应对此挑战，深度研究智能体 WebThinker 赋予 LRM 在推理中自主搜索网络、导航网页及撰写报告的能力。

来自主题: AI技术研报

8280 点击 2025-05-16 11:04

表格RAG语义割裂，用Pneuma+SAT增强检索准确性和效率 |最新

表格RAG语义割裂，用Pneuma+SAT增强检索准确性和效率 |最新

表格RAG语义割裂，用Pneuma+SAT增强检索准确性和效率 |最新

在上一篇文章中，我为大家介绍了SAT如何通过神经网络驱动的智能分段技术，解决传统文本处理中的语义割裂问题。今天，我将继续与您探讨SAT如何与Pneuma系统融合，开创表格数据检索与表示的新范式。

来自主题: AI技术研报

7737 点击 2025-05-16 10:43

字节最新大模型秘籍：只挑能有推理潜力的数据训练！1.3B模型无需标签自动挑选

字节最新大模型秘籍：只挑能有推理潜力的数据训练！1.3B模型无需标签自动挑选

字节最新大模型秘籍：只挑能有推理潜力的数据训练！1.3B模型无需标签自动挑选

和人工标记数据说拜拜，利用预训练语言模型中的注意力机制就能选择可激发推理能力的训练数据！

来自主题: AI技术研报

7803 点击 2025-05-16 10:07

刚刚，DeepSeek首曝V3降成本秘诀！软硬协同突破Scaling天花板

刚刚，DeepSeek首曝V3降成本秘诀！软硬协同突破Scaling天花板

刚刚，DeepSeek首曝V3降成本秘诀！软硬协同突破Scaling天花板

DeepSeek最新论文深入剖析了V3/R1的开发历程，揭示了硬件与大语言模型架构协同设计的核心奥秘。论文展示了如何突破内存、计算和通信瓶颈，实现低成本、高效率的大规模AI训练与推理。不仅总结了实践经验，还为未来AI硬件与模型协同设计提出了建议。

来自主题: AI技术研报

9832 点击 2025-05-15 17:12

全新预训练数据筛选方案，让数据效率提升10倍！配置仅需fastText评分器｜港科大vivo出品

全新预训练数据筛选方案，让数据效率提升10倍！配置仅需fastText评分器｜港科大vivo出品

全新预训练数据筛选方案，让数据效率提升10倍！配置仅需fastText评分器｜港科大vivo出品

vivo自研大模型用的数据筛选方法，公开了。

来自主题: AI技术研报

10954 点击 2025-05-15 14:11

讨厌RAG生成幻觉？试一下SAT重构文本分块，按语义而不是Token

讨厌RAG生成幻觉？试一下SAT重构文本分块，按语义而不是Token

讨厌RAG生成幻觉？试一下SAT重构文本分块，按语义而不是Token

搞RAG开发，一个被普遍忽视却又至关重要的痛点是：如何避免Token分块带来的语义割裂问题。SAT模型通过神经网络驱动的智能分段技术，巧妙解决了这一难题。它不是RAG的替代，而是RAG的强力前置增强层，通过确保每个文本块的语义完整性，显著降低下游生成的幻觉风险。

来自主题: AI技术研报

9041 点击 2025-05-15 12:02

上一页当前第223页,共437页下一页