AI资讯新闻榜单内容搜索-Era

RAG效果要提升，先搞定高质量Context Pruning

Context Pruning如何结合rerank，优化RAG上下文？

来自主题: AI技术研报

9475 点击 2025-11-28 10:05

AI基准测试集体塌房，最高84%都是坏题｜斯坦福最新研究

基准测试（Benchmarks）在人工智能的发展进程中扮演着至关重要的角色，构成了评价生成式模型（Generative Models）性能的事实标准。对于从事模型训练与评估的AI研究者而言，GSM8K、MMLU等数据集的数据质量直接决定了评估结论的可靠性。

来自主题: AI技术研报

9196 点击 2025-11-28 09:28

海内外资本都愿意投钱，卷疯了的生图模型，渗透硬件市场？

就在前两天，深圳一家名为 Inspire Curve 的创企设计出的 AI 概念相机，获得了有“设计界奥斯卡”美誉的 iF 设计奖。从媒体报道给出的信息看，两款产品的共通之处是将 AI 生图模型引入拍摄过程，让用户在 AI 的帮助下，一键“出片”。

来自主题: AI资讯

9122 点击 2025-11-19 10:10

VinciCoder：多模态统一代码生成框架和视觉反馈强化学习，数据代码模型权重已开源

长期以来，多模态代码生成（Multimodal Code Generation）的训练严重依赖于特定任务的监督微调（SFT）。尽管这种范式在 Chart-to-code 等单一任务上取得了显著成功，但其 “狭隘的训练范围” 从根本上限制了模型的泛化能力，阻碍了通用视觉代码智能（Generalized VIsioN Code Intelligence）的发展。

来自主题: AI技术研报

9665 点击 2025-11-17 14:32

具身智能一步踏入Scaling Law！10B+基础模型，27万小时真实数据

当前机器人领域，基础模型主要基于「视觉-语言预训练」，这样可将现有大型多模态模型的语义泛化优势迁移过来。但是，机器人的智能确实能随着算力和数据的增加而持续提升吗？我们能预测这种提升吗？

来自主题: AI技术研报

7492 点击 2025-11-05 16:42

Embedding相似度不是万金油，电商、新闻场景如何按时效性做rerank

同样是语义相似度结合时效性做rerank，指数衰减、高斯衰减、线性衰减怎么选？假设你要在一个新闻应用中落地语义检索功能，让用户搜索雷军的投资版图盘点时，能自动关联顺为资本、小米战投等核心关联信息。

来自主题: AI技术研报

9724 点击 2025-11-05 09:46

HF日趋榜一！真端到端模型AutoDeco终结手动调参解码

大语言模型（LLM）的「炼丹师」们，或许都曾面临一个共同的困扰：为不同任务、不同模型手动调整解码超参数（如 temperature 和 top-p）。这个过程不仅耗时耗力，而且一旦模型或任务发生变化，历史经验便瞬间失效，一切又得从头再来。

来自主题: AI技术研报

11186 点击 2025-11-04 16:14

世界模型可单GPU秒级生成了？厦大、腾讯开源FlashWorld，效果惊艳、免费体验

厦门大学和腾讯合作的最新论文《FlashWorld: High-quality 3D Scene Generation within Seconds》获得了海内外的广泛关注，在当日 Huggingface Daily Paper 榜单位列第一，并在 X 上获得 AK、Midjourney 创始人、SuperSplat 创始人等 AI 大佬点赞转发。

来自主题: AI技术研报

7316 点击 2025-10-31 10:27

TPAMI 2025 | AI对抗迁移性评估的「拨乱反正」：那些年效果虚高的攻防算法们

对抗样本（adversarial examples）的迁移性（transferability）—— 在某个模型上生成的对抗样本能够同样误导其他未知模型 —— 被认为是威胁现实黑盒深度学习系统安全的核心因素。尽管现有研究已提出复杂多样的迁移攻击方法，却仍缺乏系统且公平的方法对比分析：（1）针对攻击迁移性，未采用公平超参设置的同类攻击对比分析；（2）针对攻击隐蔽性，缺乏多样指标。

来自主题: AI技术研报

7253 点击 2025-10-29 16:05

英伟达曝超级 AI 芯片 Vera Rubin，黄仁勋要创造 AI 的「登月时刻」

在北京时间凌晨举办的英伟达 GTC 大会上，黄仁勋用一系列人类历史创新的剪影开场，并把英伟达与 AI 创新直接拔高定调为「下一个阿波罗时刻」。除了展示下一代超级芯片 Vera Rubin，黄仁勋还大谈 6G、量子计算，机器人和自动驾驶，同时宣布要投资新的巨头，舞台大屏上英伟达的「合作」对象名单可以说是密密麻麻。

来自主题: AI资讯

9200 点击 2025-10-29 12:03

AI资讯新闻榜单内容搜索-Era

RAG效果要提升，先搞定高质量Context Pruning

AI基准测试集体塌房，最高84%都是坏题 ｜斯坦福最新研究

海内外资本都愿意投钱，卷疯了的生图模型，渗透硬件市场？

VinciCoder：多模态统一代码生成框架和视觉反馈强化学习，数据代码模型权重已开源

具身智能一步踏入Scaling Law！10B+基础模型，27万小时真实数据

Embedding相似度不是万金油，电商、 新闻场景如何按时效性做rerank

HF日趋榜一！真端到端模型AutoDeco终结手动调参解码

世界模型可单GPU秒级生成了？厦大、腾讯开源FlashWorld，效果惊艳、免费体验

TPAMI 2025 | AI对抗迁移性评估的「拨乱反正」：那些年效果虚高的攻防算法们

英伟达曝超级 AI 芯片 Vera Rubin，黄仁勋要创造 AI 的「登月时刻」

AI基准测试集体塌房，最高84%都是坏题｜斯坦福最新研究

Embedding相似度不是万金油，电商、新闻场景如何按时效性做rerank