AI资讯新闻榜单内容搜索-模型

中科大联合华为诺亚提出Entropy Law，揭秘大模型性能、数据压缩率以及训练损失关系

数据是大语言模型（LLMs）成功的基石，但并非所有数据都有益于模型学习。

来自主题: AI技术研报

10554 点击 2024-07-22 14:55

盛名一时的BERT哪去了？这个问题的答案昭示了LLM范式的转变

编码器模型哪去了？如果 BERT 效果好，那为什么不扩展它？编码器 - 解码器或仅编码器模型怎么样了？

来自主题: AI资讯

9744 点击 2024-07-22 14:50

5年160亿估值，硅谷“企业AI”领头羊怎么做到的？

大模型引发的AI大战持续了两年多之后，现在所有创业团队和投资人都在问的一个问题是——适用于大模型真正的场景有哪些？或者，更重要的是，到底怎么才能获得货真价实的客户和营收？

来自主题: AI资讯

11507 点击 2024-07-22 14:45

瑞士安全科技公司Threatray基于人工智能和机器学习，开发基于代码深度分析的恶意软件检测和分析工具 | 瑞士创新100强

用AI模型从代码层面深度分析和防御恶意软件。

来自主题: AI资讯

9321 点击 2024-07-22 14:42

不是，我就好奇，为啥 AI 公司都要用「星星」符号？

整得跟共济会似的。

来自主题: AI资讯

6327 点击 2024-07-22 10:38

ECCV 2024 | 让GPT-4图像理解更易出错，全新策略增强VLP模型对抗迁移性

针对视觉-语言预训练（Vision-Language Pretraining, VLP）模型的对抗攻击，现有的研究往往仅关注对抗轨迹中对抗样本周围的多样性，但这些对抗样本高度依赖于代理模型生成，存在代理模型过拟合的风险。

来自主题: AI技术研报

10972 点击 2024-07-21 17:12

ICML 2024 Oral | DPO是否比PPO更适合LLM，清华吴翼团队最新揭秘

如何让大模型更好的遵从人类指令和意图？如何让大模型有更好的推理能力？如何让大模型避免幻觉？能否解决这些问题，是让大模型真正广泛可用，甚至实现超级智能（Super Intelligence）最为关键的技术挑战。这些最困难的挑战也是吴翼团队长期以来的研究重点，大模型对齐技术（Alignment）所要攻克的难题。

来自主题: AI资讯

12186 点击 2024-07-21 17:10