AI资讯新闻榜单内容搜索-训练

「大模型变小」成年度大趋势！1月AI四大研究精彩亮点超长总结，模型合并MoE方法是主流

AI大模型并非越大越好？过去一个月，关于大模型变小的研究成为亮点，通过模型合并，采用MoE架构都能实现小模型高性能。

来自主题: AI技术研报

6065 点击 2024-02-09 12:11

GPT-4推理能力暴涨32%，谷歌新型思维链效果超CoT，计算成本可降至1/40

谷歌&南加大推出最新研究“自我发现”（Self-Discover），重新定义了大模型推理范式。与已成行业标准的思维链（CoT）相比，新方法不仅让模型在面对复杂任务时表现更佳，还把同等效果下的推理成本压缩至1/40。

来自主题: AI技术研报

5352 点击 2024-02-08 19:44

AI大模型“卖铲人”去年劲赚7.5亿美元，成功模式难复制

在AI大模型初创企业普遍还处于入不敷出、疯狂烧钱的阶段时，一家专注于AI数据服务的初创企业已经赚得盆满钵满，成为收入最高的AI创业公司之一。

来自主题: AI资讯

4109 点击 2024-02-07 10:29

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法

现有的语义分割技术在评估指标、损失函数等设计上都存在缺陷，研究人员针对相关缺陷设计了全新的损失函数、评估指标和基准，在多个应用场景下展现了更高的准确性和校准性。

来自主题: AI技术研报

3784 点击 2024-02-06 14:47

比OpenAI官方提示词指南更全，这26条黄金准则让LLM性能飙升50%以上

今天，穆罕默德・本・扎耶德人工智能大学 VILA Lab 带来了一项关于如何更好地为不同规模的大模型书写提示词（prompt）的研究，让大模型性能在不需要任何额外训练的前提下轻松提升 50% 以上。该工作在 X (Twitter)、Reddit 和 LinkedIn 等平台上都引起了广泛的讨论和关注。

来自主题: AI技术研报

6371 点击 2024-02-05 14:39

2亿参数时序模型替代LLM？谷歌突破性研究被批「犯新手错误」

最近，谷歌的一篇论文在 X 等社交媒体平台上引发了一些争议。

来自主题: AI技术研报

8841 点击 2024-02-05 14:33

一张“哑火”的AI禁令

前不久，美国商务部出了一份《采取额外措施应对与重大恶意网络行为相关的国家紧急状态》提案，提出：禁止中国公司使用美国的云计算资源来训练AI模型。这相当于AI芯片禁运的“补丁”。美国商务部长吉娜·雷蒙多在采访时提到，美国的云数据中心也大量使用AI芯片，而美国对芯片实施了出口管制，也必须考虑关闭这条路径。

来自主题: AI资讯

7005 点击 2024-02-05 11:13