AI技术研报-这里有最前沿的人工智能技术解读

让AI眼里有活主动干！清华&面壁等开源主动交互Agent新范式

颠覆现有Agent范式、让AI拥有“主动能动性！清华&面壁等团队最新开源新一代主动Agent交互范式（ ProActive Agent）。

来自主题: AI技术研报

7764 点击 2024-11-28 20:50

代码模型自我进化超越GPT-4o蒸馏！UIUC伯克利等提出自对齐方法 | NIPS 2024

代码模型可以自己进化，利用自身生成的数据来进行指令调优，效果超越GPT-4o直接蒸馏！

来自主题: AI技术研报

7933 点击 2024-11-28 20:44

LLM也会和人类一样焦虑！还会产生更多偏见，图宾根大学最新研究

你是否有过这样的感受，当你感觉焦虑的时候，做出的决策和反应都与正常情况下不同？

来自主题: AI技术研报

11090 点击 2024-11-28 20:41

向量数据库的中场战事：长期主义者Zilliz如何全球突围

命运齿轮转动的开始，源于 2023 年的 3 月 23 日的 OpenAI 一次日常更新。

来自主题: AI技术研报

12609 点击 2024-11-28 14:23

12%计算量就能媲美原模型，Adobe、罗切斯特大学等提出YOPO剪枝技术

尽管近期 Qwen2-VL 和 InternVL-2.0 的出现将开源多模态大模型的 SOTA 提升到了新高度，但巨大的计算开销限制了其在很多场景下的应用。

来自主题: AI技术研报

10738 点击 2024-11-28 14:16

rebuttal真的有用！这篇ICLR论文，所有审稿人都加了2分，直接跃升排名第9

最近，正处于评议阶段的 ICLR 2025 论文真是看点连连，比如前些天爆出的 ICLR 低分论文作者硬刚审稿人的事件以及今天我们要介绍的这个通过 rebuttal（反驳）硬是将自己的平均分拉高 2 分，直接晋升第 9 名的论文。

来自主题: AI技术研报

9061 点击 2024-11-28 14:08

LLM破局泛化诊断难题，MSSP刊登北航PHM实验室健康管理大模型交叉研究

近日，《Mechanical System and Signal Processing》（MSSP）在线发表刊登北航 PHM 团队最新研究成果：基于大语言模型的轴承故障诊断框架（LLM-based Framework for Bearing Fault Diagnosis）。

来自主题: AI技术研报

10451 点击 2024-11-28 13:53

突破86%，解耦LLM的记忆与推理，首个超越GPT-4o的推理框架（含prompt） | 最新

这是一个不容小觑的最新推理框架，它解耦了LLM的记忆与推理，用此框架Fine-tuned过的LLaMa-3.1-8B在TruthfulQA数据集上首次超越了GPT-4o。

来自主题: AI技术研报

8433 点击 2024-11-28 11:26

应用指南｜一分钟完成立案材料准备——基于GPT和编程

前段时间，笔者有幸参加了师兄主讲的《法律人如何使用AI系列讲座》第二期。讲座中提到，GPT不仅能够优化工作流程，还可以帮助没有任何编程经验的人编写代码。恰巧近期立案工作增加，需要逐一准备大量的立案材料（如所函、授权委托书、合同、介绍信等）。

来自主题: AI技术研报

7697 点击 2024-11-28 10:03

Fixie AI 推出 Ultravox v0.4.1：专门用于与 LLM 进行实时对话以及 GPT-4o 实时的替代方案

在人工智能领域，与AI进行无缝的实时交互一直是开发者和研究者面临的一大挑战。特别是将文本、图片、音频等多模态信息整合成一个连贯的对话系统，更是难上加难。尽管像GPT-4这样的语言模型在对话流畅性和上下文理解上取得了长足进步，但在实际应用中，这些模型仍然存在不足之处：

来自主题: AI技术研报

10620 点击 2024-11-28 09:53

基于向量模型的文本水印技术

在 EMNLP 2024 上，我们看到了向量模型的各种创新用法，其中最出人意料的莫过于：文本水印。

来自主题: AI技术研报

9556 点击 2024-11-28 09:17

AI卷翻科研！DeepMind 36页报告：全球实验室被「AI科学家」指数级接管

OpenAI科学家Jason Wei预测，未来一年内，AI重点将从推广大众需求转为促进科学发现，无独有偶，DeepMind刚刚发布的36页报告也揭示出：全球实验室AI使用正在指数级增长，AI for Science真正的黄金时代即将来临。

来自主题: AI技术研报

9881 点击 2024-11-27 18:02

不是RNN的锅！清华团队深入分析长上下文建模中的状态崩溃，Mamba作者点赞

RNN模型在长上下文中表现不佳？近日，来自清华的研究团队对此进行了深入的实验分析，结果表明：不是RNN的锅。

来自主题: AI技术研报

10492 点击 2024-11-27 17:10

一文看尽Meta开源大礼包！全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等

Meta最近开源了多个AI项目，包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等，提升了AI在图像处理和语音识别领域的能力，进一步推动了AI研究的进展。

来自主题: AI技术研报

10487 点击 2024-11-27 16:50

AI造芯Nature论文遭围攻，谷歌发文硬刚学术抹黑！Jeff Dean怒怼：你们连模型都没训

近日，面对EDA界对于自家AlphaChip的质疑，谷歌首席科学家Jeff Dean以论文回应论文，并表示：大家注意，这是同行竞争！

来自主题: AI技术研报

10933 点击 2024-11-27 16:39

HuggingFace工程师亲授：如何在Transformer中实现最好的位置编码

一个有效的复杂系统总是从一个有效的简单系统演化而来的。——John Gall

来自主题: AI技术研报

9071 点击 2024-11-27 16:22

AI 知识库对比：Dify 还是 FastGPT

之前出了一些 Dify 的基础教程，后台有小伙伴经常问三金：Dify 和 fastGPT 哪个好啊？我该用哪个呢？为了帮小伙伴解开这个疑惑，今儿三金就先带大家分别看下这两个产品在知识库上的异同点。废话不多说，开整！

来自主题: AI技术研报

9887 点击 2024-11-27 14:53

跨模态大升级！少量数据高效微调，LLM教会CLIP玩转复杂文本

在当今多模态领域，CLIP 模型凭借其卓越的视觉与文本对齐能力，推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习，将视觉与语言信号嵌入到同一特征空间中，受到了广泛应用。

来自主题: AI技术研报

6999 点击 2024-11-27 14:41

将偏好学习引入模型训练，北大李戈团队新框架，可显著提升代码准确性与执行效率

代码模型SFT对齐后，缺少进一步偏好学习的问题有解了。北大李戈教授团队与字节合作，在模型训练过程中引入偏好学习，提出了一个全新的代码生成优化框架——CodeDPO。

来自主题: AI技术研报

8672 点击 2024-11-27 14:35

1行代码改进大模型训练，Llama训练速度提升至1.47倍，全华人团队出品

只要改一行代码，就能让大模型训练效率提升至1.47倍。

来自主题: AI技术研报

7237 点击 2024-11-27 14:25

微软发现不同prompt模版会导致最大40%性能差距！

这篇文章研究了提示格式对大型语言模型（LLM）性能的影响。

来自主题: AI技术研报

6886 点击 2024-11-27 13:48

微软、OpenAI最新发布：从吴恩达教授推荐的Medprompt到o1的技术演进

近期，微软研究团队发布了一项重要的研究成果，揭示了AI推理能力从传统的提示工程方法（如Medprompt）到原生推理机制（如OpenAI的o1）演进的全貌。此项研究为正在开发AI产品的朋友们提供了宝贵的技术洞察。本文将详细分析这一研究的过程和结论，探讨其对AI推理领域及产品开发的深远影响。

来自主题: AI技术研报

7233 点击 2024-11-27 09:25

微软将推出LazyGraphRAG，索引成本降低至GraphRAG的千分之一！｜抢先解读

将知识图谱技术与RAG有机结合的GraphRAG可谓是今年下半年来的LLM应用领域的一个热点，借助大模型从非结构化文本数据创建知识图谱与摘要，并结合图与向量索引技术来提高对复杂用户查询的检索增强与响应质量。

来自主题: AI技术研报

9341 点击 2024-11-26 18:01

Claude化身服务器联通一切！AI写好代码自己发Github，人类程序员只配动嘴了

Anthropic又发大礼包！现在Claude自己就是一台服务器。

来自主题: AI技术研报

9392 点击 2024-11-26 17:12

空间智能新进展：教机器人组装宜家家具，首次实现操作步骤与真实视频对齐 | NeurIPS

斯坦福吴佳俊团队，给机器人设计了一套组装宜家家具的视频教程！

来自主题: AI技术研报

8753 点击 2024-11-26 16:58

吴恩达开源大模型套件：11个模型平台一种方式调用，已获星标超1.2K

吴恩达发布的开源大模型套件aisuite，不到半天就斩获了1200+星标。

来自主题: AI技术研报

10240 点击 2024-11-26 16:47

超越GPT-4o！开源科研神器登场，4500万篇论文检索增强生成靠谱回答

只需几秒钟，开源模型检索4500篇论文，比GPT-4o还靠谱！

来自主题: AI技术研报

10758 点击 2024-11-26 16:34

「学术版ChatGPT」登场！Ai2打造科研效率神器OpenScholar，让LLM帮你搞定文献综述

Ai2和华盛顿大学联合Meta、CMU、斯坦福等机构发布了最新的OpenScholar系统，使用检索增强的方法帮助科学家进行文献搜索和文献综述工作，而且做到了数据、代码、模型权重的全方位开源。

来自主题: AI技术研报

7144 点击 2024-11-26 14:05

UC伯克利：给大模型测MBTI，Llama更敢说但GPT-4像理工男

如果给LLM做MBTI，会得到什么结果？UC伯克利的最新研究就发现，不同模型真的有自己独特的性格

来自主题: AI技术研报

7812 点击 2024-11-26 13:59

撞墙还是新起点？自回归模型在图像领域展现出Scaling潜力

自回归方法，在图像生成中观察到了 Scaling Law。「Scaling Law 撞墙了？」这恐怕是 AI 社区最近讨论热度最高的话题。

来自主题: AI技术研报

6739 点击 2024-11-26 13:48