AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
使用 Swarm 构建多智能体新闻助理

使用 Swarm 构建多智能体新闻助理

使用 Swarm 构建多智能体新闻助理

本文将带你构建一个多智能体新闻助理,利用 OpenAI 的 Swarm 框架和 Llama 3.2 来自动化新闻处理工作流。在本地运行环境下,我们将实现一个多智能体系统,让不同的智能体各司其职,分步完成新闻搜索、信息综合与摘要生成等任务,而无需付费使用外部服务。

来自主题: AI技术研报
4202 点击    2024-11-06 09:44
多专家Prompt: 让LLM拥有群体决策的智慧 |最新

多专家Prompt: 让LLM拥有群体决策的智慧 |最新

多专家Prompt: 让LLM拥有群体决策的智慧 |最新

在当前的LLM应用开发中,工程师们通常通过使用单一角色或专家视角的方式来处理复杂问题。这种单一视角虽然能够提供一定的专业性,但也经常因为专家视角的局限性带来偏见,影响输出的全面性和可靠性。

来自主题: AI技术研报
7610 点击    2024-11-06 09:40
Agent也有快慢脑了!这次真的不一样

Agent也有快慢脑了!这次真的不一样

Agent也有快慢脑了!这次真的不一样

基于这一理念,DeepMind团队开发了一个双系统框架,称为Talker-Reasoner,旨在模仿人类的这两种思维模式。

来自主题: AI技术研报
4127 点击    2024-11-06 09:39
【新进展】知识图谱+大模型-->医疗诊断

【新进展】知识图谱+大模型-->医疗诊断

【新进展】知识图谱+大模型-->医疗诊断

近年来,生成式大型语言模型(LLMs)在各类语言任务中的表现令人瞩目,但在医疗领域的应用面临诸多挑战,尤其是在减少诊断错误和避免对患者造成伤害方面。

来自主题: AI技术研报
4493 点击    2024-11-06 09:34
比ChatGPT更牛!苹果新AI模型刷新交互体验!能看懂你的手机屏幕!平板和安卓机也都行

比ChatGPT更牛!苹果新AI模型刷新交互体验!能看懂你的手机屏幕!平板和安卓机也都行

比ChatGPT更牛!苹果新AI模型刷新交互体验!能看懂你的手机屏幕!平板和安卓机也都行

家人们,苹果一直在悄悄进步! 近期,据小鹿观察,各大科技巨头不仅在提升模型解决复杂问题的能力上竞争激烈,而且还在大语言模型应用于用户界面(UI)交互方面上暗暗发力!

来自主题: AI技术研报
4008 点击    2024-11-05 19:33
Bifröst:基于语言指令的3D感知图像合成技术

Bifröst:基于语言指令的3D感知图像合成技术

Bifröst:基于语言指令的3D感知图像合成技术

Bifröst 是一个创新的3D感知图像合成框架,它利用扩散模型来执行基于语言指令的图像合成任务。

来自主题: AI技术研报
4403 点击    2024-11-05 19:29
RAG 系统的分块难题:小型语言模型如何找到最佳断点?

RAG 系统的分块难题:小型语言模型如何找到最佳断点?

RAG 系统的分块难题:小型语言模型如何找到最佳断点?

之前我们聊过 RAG 里文档分块 (Chunking) 的挑战,也介绍了 迟分 (Late Chunking) 的概念,它可以在向量化的时候减少上下文信息的丢失。今天,我们来聊聊另一个难题:如何找到最佳的分块断点。

来自主题: AI技术研报
5259 点击    2024-11-05 16:36
无需参数访问!CMU用大模型自动优化视觉语言提示词 | CVPR’24

无需参数访问!CMU用大模型自动优化视觉语言提示词 | CVPR’24

无需参数访问!CMU用大模型自动优化视觉语言提示词 | CVPR’24

视觉语言模型(如 GPT-4o、DALL-E 3)通常拥有数十亿参数,且模型权重不公开,使得传统的白盒优化方法(如反向传播)难以实施。

来自主题: AI技术研报
2503 点击    2024-11-05 15:28
1000个智能体打造《我的世界》,北大校友35页技术报告揭秘

1000个智能体打造《我的世界》,北大校友35页技术报告揭秘

1000个智能体打造《我的世界》,北大校友35页技术报告揭秘

北大校友打造的1000个智能体「我的世界」,背后原理揭晓了! 团队全新公开35页技术报告,详尽解密AI智能体如何产生专业化分工、社交互动、甚至传播虚拟宗教……

来自主题: AI技术研报
2781 点击    2024-11-05 15:17
NeurIPS 2024|新一代芯片电路逻辑综合,可扩展可解释的神经电路生成框架

NeurIPS 2024|新一代芯片电路逻辑综合,可扩展可解释的神经电路生成框架

NeurIPS 2024|新一代芯片电路逻辑综合,可扩展可解释的神经电路生成框架

近日,中科大王杰教授团队(MIRA Lab)和华为诺亚方舟实验室(Huawei Noah's Ark Lab)联合提出了可生成具有成千上万节点规模的神经电路生成与优化框架,具备高扩展性和高可解释性,这为新一代芯片电路逻辑综合工具奠定了重要基础。论文发表在 CCF-A 类人工智能顶级会议 Neural Information Processing Systems(NeurIPS 2024)。

来自主题: AI技术研报
3005 点击    2024-11-05 15:01
视觉定位新SOTA!华人团队开源革新框架SegVG,边界框转为分割信号 | ECCV 2024

视觉定位新SOTA!华人团队开源革新框架SegVG,边界框转为分割信号 | ECCV 2024

视觉定位新SOTA!华人团队开源革新框架SegVG,边界框转为分割信号 | ECCV 2024

SegVG是一种新的视觉定位方法,通过将边界框注释转化为像素级分割信号来增强模型的监督信号,同时利用三重对齐模块解决特征域差异问题,提升了定位准确性。实验结果显示,SegVG在多个标准数据集上超越了现有的最佳模型,证明了其在视觉定位任务中的有效性和实用性。

来自主题: AI技术研报
2939 点击    2024-11-05 14:56
无需训练即可大幅提升SAM 2!开源的SAM2Long来了,港中文、上海AI Lab出品

无需训练即可大幅提升SAM 2!开源的SAM2Long来了,港中文、上海AI Lab出品

无需训练即可大幅提升SAM 2!开源的SAM2Long来了,港中文、上海AI Lab出品

Segment Anything Model 2(SAM 2)在传统视频目标分割任务大放异彩,引起了众多关注。然而,港中文和上海 AI Lab 的研究团队发现 SAM 2 的贪婪选择策略容易陷入「错误累积」的问题,即一次错误的分割掩码选择将影响后续帧的分割结果,导致整个视频分割性能的下降。这个问题在长视频分割任务中显得更加严重。

来自主题: AI技术研报
7062 点击    2024-11-05 14:53
纯技术文章(PPT原文):英伟达 GB200 超级计算集群数据中心部署;AI 工厂与 Broadcom AI ASIC光学连接

纯技术文章(PPT原文):英伟达 GB200 超级计算集群数据中心部署;AI 工厂与 Broadcom AI ASIC光学连接

纯技术文章(PPT原文):英伟达 GB200 超级计算集群数据中心部署;AI 工厂与 Broadcom AI ASIC光学连接

NVIDIA DGX GB200 超级计算集群数据中心部署指南解读,NVIDIA AI 工厂部署与 Broadcom AI 计算 ASIC 光学连接技术

来自主题: AI技术研报
6590 点击    2024-11-05 09:38
MVDrag3D:灵活强大的拖拽式多视图3D编辑技术

MVDrag3D:灵活强大的拖拽式多视图3D编辑技术

MVDrag3D:灵活强大的拖拽式多视图3D编辑技术

MVDrag3D 是一种创新的3D编辑框架,它通过结合多视图生成和重建先验来实现灵活且富有创造性的拖拽编辑。

来自主题: AI技术研报
3570 点击    2024-11-05 09:38
你真的会用ICL吗?把ICL和IWL双重学习同时写进提示词试试 | DeepMind

你真的会用ICL吗?把ICL和IWL双重学习同时写进提示词试试 | DeepMind

你真的会用ICL吗?把ICL和IWL双重学习同时写进提示词试试 | DeepMind

大家对in-context learning(ICL)的能力可能已经很熟悉了,您通常会通过上下文示例就能快速让prompt适应新任务。然而,作为AI应用开发者,您是否思考过:为什么有时候精心设计的few-shot prompt会失效?为什么相同的prompt模式在不同场景下效果差异巨大?

来自主题: AI技术研报
5255 点击    2024-11-05 09:17
高效评估多模态预训练对齐质量,中科大提出模态融合率MIR

高效评估多模态预训练对齐质量,中科大提出模态融合率MIR

高效评估多模态预训练对齐质量,中科大提出模态融合率MIR

来自中科大等单位的研究团队共同提出了用来有效评估多模态大模型预训练质量的评估指标 Modality Integration Rate(MIR),能够快速准确地评估多模态预训练的模态对齐程度。

来自主题: AI技术研报
3458 点击    2024-11-04 17:13
Jim Fan全华人团队HOVER问世,1.5M小模型让机器人获「潜意识」!

Jim Fan全华人团队HOVER问世,1.5M小模型让机器人获「潜意识」!

Jim Fan全华人团队HOVER问世,1.5M小模型让机器人获「潜意识」!

来自英伟达、CMU、UC伯克利等的全华人团队提出一个全新的人形机器人通用的全身控制器HOVER,仅用一个1.5M参数模型就可以控制人形机器人的身体。人形机器人的运动和操作之前只是外表看起来类人,现在有了HOVER,连底层运动逻辑都可以类人了!

来自主题: AI技术研报
2924 点击    2024-11-04 17:02
UCLA、MIT数学家推翻39年经典数学猜想!AI证明卡在99.99%,人类最终证伪

UCLA、MIT数学家推翻39年经典数学猜想!AI证明卡在99.99%,人类最终证伪

UCLA、MIT数学家推翻39年经典数学猜想!AI证明卡在99.99%,人类最终证伪

39年来一个看似理所当然的数学理论,刚刚被数学家证伪!UCLA和MIT的研究者证实:概率论中众所周知的假设「上下铺猜想」是错的。有趣的是,他们用AI已经证明到了99.99%的程度,但最终,靠的还是理论论证。

来自主题: AI技术研报
3345 点击    2024-11-04 16:29
英伟达团队机器训练新方法!仅5次演示让机器生成1000个新demo,李飞飞高徒与徒孙联手出品

英伟达团队机器训练新方法!仅5次演示让机器生成1000个新demo,李飞飞高徒与徒孙联手出品

英伟达团队机器训练新方法!仅5次演示让机器生成1000个新demo,李飞飞高徒与徒孙联手出品

人类只需要演示五次,就能让机器人学会一项复杂技能。英伟达实验室,提出了机器人训练数据缺乏问题的新解决方案——DexMimicGen。

来自主题: AI技术研报
5852 点击    2024-11-04 15:36
解决真实GitHub Issue能力登顶,字节豆包MarsCode团队分享背后工程实践,踩过的坑也分享了

解决真实GitHub Issue能力登顶,字节豆包MarsCode团队分享背后工程实践,踩过的坑也分享了

解决真实GitHub Issue能力登顶,字节豆包MarsCode团队分享背后工程实践,踩过的坑也分享了

解决真实GitHub Issue的基准测试,字节家的豆包MarsCode Agent悄悄登顶了。SWE-Bench,一个由普林斯顿大学提出的极具挑战性的Benchmark,近期受到工业界、学术界和创业团队的广泛关注。

来自主题: AI技术研报
4334 点击    2024-11-04 15:29
斯坦福&哈佛医学院 - MMedAgent,一个用于医疗领域的多模态医疗AI智能体

斯坦福&哈佛医学院 - MMedAgent,一个用于医疗领域的多模态医疗AI智能体

斯坦福&哈佛医学院 - MMedAgent,一个用于医疗领域的多模态医疗AI智能体

与最先进的开源方法甚至闭源模型 GPT-4o 相比,MMedAgent 在各种医疗任务中实现了卓越的性能。此外,MMedAgent 在更新和集成新医疗工具方面表现出效率。

来自主题: AI技术研报
4915 点击    2024-11-04 09:49
中国企业的生成式AI应用陷阱:只有场景想象,没有业务目的

中国企业的生成式AI应用陷阱:只有场景想象,没有业务目的

中国企业的生成式AI应用陷阱:只有场景想象,没有业务目的

中国企业对于生成式AI应用场景的了解都来自于ChatGPT的传说,但中国企业能使用的GenAI资源与ChatGPT却没有关系。直截了当地说,中国企业目前能够使用的GenAI资源都比GPT-4要差很多,注意不是“有差距”,而是“差很多”,这是中国企业考虑生成式AI问题的基本前提。

来自主题: AI技术研报
3506 点击    2024-11-04 09:37
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术

幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术

幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术

在人工智能领域,大型预训练模型(如 GPT 和 LLaVA)的 “幻觉” 现象常被视为一个难以克服的挑战,尤其是在执行精确任务如图像分割时。

来自主题: AI技术研报
7387 点击    2024-11-03 17:53