AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
还在醉心于AI写作一键生成?看18位创意作家的AI writing workflow |华盛顿大学最新

还在醉心于AI写作一键生成?看18位创意作家的AI writing workflow |华盛顿大学最新

还在醉心于AI写作一键生成?看18位创意作家的AI writing workflow |华盛顿大学最新

在当前AI写作工具迅速发展的背景下,华盛顿大学的这项研究选择了一个独特的切入点。研究团队没有去探讨AI是否应该用于创意写作这个争议性话题,而是直接走进了那些已经在使用AI的作家的创作现场。这18位作家来自不同背景:

来自主题: AI技术研报
4179 点击    2024-11-12 09:50
用LLM一键生成百万级领域知识图谱!中科大新框架入选ACL 2024

用LLM一键生成百万级领域知识图谱!中科大新框架入选ACL 2024

用LLM一键生成百万级领域知识图谱!中科大新框架入选ACL 2024

现在,用LLM一键就能生成百万级领域知识图谱了?! 来自中科大MIRA实验室研究人员提出一种通用的自动化知识图谱构建新框架SAC-KG

来自主题: AI技术研报
2900 点击    2024-11-11 21:21
具身智能基础——强化学习

具身智能基础——强化学习

具身智能基础——强化学习

强化学习中的核心概念是智能体(Agent)和环境(Environment)之间的交互。智能体通过观察环境的状态,选择动作来改变环境,环境根据动作反馈出奖励和新的状态。

来自主题: AI技术研报
4106 点击    2024-11-11 20:56
别再手动编排工作流了,AI 能做的比你更好!

别再手动编排工作流了,AI 能做的比你更好!

别再手动编排工作流了,AI 能做的比你更好!

现在 workflow 也有了自己的智能助手啦! MetaGPT 开源的 AFLOW 可以完全自动地构建和优化 workflow 了!

来自主题: AI技术研报
3666 点击    2024-11-11 15:20
专家模型不要专家并行!微软开源MoE新路径

专家模型不要专家并行!微软开源MoE新路径

专家模型不要专家并行!微软开源MoE新路径

近日,来自微软的研究人员开源了使用全新方法训练的MoE大模型,不走寻常路,且编码和数学表现出色。

来自主题: AI技术研报
6146 点击    2024-11-11 15:15
陶哲轩联手60多位数学家出题,世界顶尖模型通过率仅2%!专家级数学基准,让AI再苦战数年

陶哲轩联手60多位数学家出题,世界顶尖模型通过率仅2%!专家级数学基准,让AI再苦战数年

陶哲轩联手60多位数学家出题,世界顶尖模型通过率仅2%!专家级数学基准,让AI再苦战数年

Epoch AI推出数学基准FrontierMath,目前前沿模型测试成功率均低于2%!OpenAI研究科学家Noam Brown说道:「我喜欢看到新评估的前沿模型通过率如此之低。这种感觉就像一觉醒来,外面是一片崭新的雪地,完全没有人迹。」或许,FrontierMath测试成功率突破的那一天,会是AI发展过程中一个全新的里程碑。

来自主题: AI技术研报
3839 点击    2024-11-11 15:10
清华团队破解具身智能Scaling Law,GPT时刻在即!宁德时代联创终于出手

清华团队破解具身智能Scaling Law,GPT时刻在即!宁德时代联创终于出手

清华团队破解具身智能Scaling Law,GPT时刻在即!宁德时代联创终于出手

半年两次大融资后,这家具身智能黑马再次获得融资!作为柏睿资本首次投资的具身智能企业,千寻智能不仅拥有出身自伯克利系联创,在技术、硬件、商业化上,也让人极有信心。

来自主题: AI技术研报
2748 点击    2024-11-11 15:05
两位本科生一作,首次提出「持续学习」+「少样本」知识图谱补全 | CIKM 2024

两位本科生一作,首次提出「持续学习」+「少样本」知识图谱补全 | CIKM 2024

两位本科生一作,首次提出「持续学习」+「少样本」知识图谱补全 | CIKM 2024

上海大学本科生研发的新框架能有效应对知识图谱补全中的灾难性遗忘和少样本学习难题,提升模型在动态环境和数据稀缺场景下的应用能力。这项研究不仅推动了领域发展,也为实际应用提供了宝贵参考。

来自主题: AI技术研报
2693 点击    2024-11-11 14:57
AI数学神话破灭!FrontierMath让LLM集体几乎“交白卷”:正确率不超过2%

AI数学神话破灭!FrontierMath让LLM集体几乎“交白卷”:正确率不超过2%

AI数学神话破灭!FrontierMath让LLM集体几乎“交白卷”:正确率不超过2%

大型语言模型(LLM)最近在各种数学benchmark上疯狂刷分,动辄90%以上的正确率,搞得好像要统治数学界一样。然而,Epoch AI看不下去了,联手60多位顶尖数学家,憋了个大招——FrontierMath,一个专治LLM各种不服的全新数学推理测试!结果惨不忍睹,LLM集体“翻车”,正确率竟然不到2%!

来自主题: AI技术研报
3764 点击    2024-11-11 14:36
12 个 RAG 痛点和建议的解决方案-解决检索增强生成的核心挑战

12 个 RAG 痛点和建议的解决方案-解决检索增强生成的核心挑战

12 个 RAG 痛点和建议的解决方案-解决检索增强生成的核心挑战

受到 Barnett 等人的论文《设计检索增强生成系统时的七个故障点》的启发,让我们在本文中探讨该论文中提到的七个故障点以及开发 RAG 管道时的另外五个常见痛点。

来自主题: AI技术研报
10316 点击    2024-11-10 22:05
谷歌苹果曝出LLM惊人内幕,自主识别错误却装糊涂!AI幻觉背后藏着更大秘密

谷歌苹果曝出LLM惊人内幕,自主识别错误却装糊涂!AI幻觉背后藏着更大秘密

谷歌苹果曝出LLM惊人内幕,自主识别错误却装糊涂!AI幻觉背后藏着更大秘密

大模型幻觉,究竟是怎么来的?谷歌、苹果等机构研究人员发现,大模型知道的远比表现的要多。它们能够在内部编码正确答案,却依旧输出了错误内容。

来自主题: AI技术研报
3637 点击    2024-11-10 14:11
哈佛推出全新类ChatGPT癌症诊断AI,登上Nature!准确率高达96%

哈佛推出全新类ChatGPT癌症诊断AI,登上Nature!准确率高达96%

哈佛推出全新类ChatGPT癌症诊断AI,登上Nature!准确率高达96%

能够执行多种任务,识别19种癌症类型,预测患者生存率……哈佛医学院研究人员提出CHIEF,一种多功能AI癌症诊断模型,表现出类似于ChatGPT的灵活性,远超其他现有的癌症诊断模型。

来自主题: AI技术研报
2830 点击    2024-11-10 14:05
NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界?

NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界?

NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界?

该文章的第一作者陈麒光,目前就读于哈工大赛尔实验室。他的主要研究方向包括大模型思维链、跨语言大模型等。 该研究主要提出了推理边界框架(Reasoning Boundary Framework, RBF),首次尝试量化并优化思维链推理能力。

来自主题: AI技术研报
3374 点击    2024-11-10 13:50
揭示Transformer重要缺陷!北大提出傅里叶分析神经网络FAN,填补周期性特征建模缺陷

揭示Transformer重要缺陷!北大提出傅里叶分析神经网络FAN,填补周期性特征建模缺陷

揭示Transformer重要缺陷!北大提出傅里叶分析神经网络FAN,填补周期性特征建模缺陷

周期性现象广泛存在,深刻影响着人类社会和自然科学。作为最重要的基本特性之一,许多规律都显式或隐式地包含周期性,例如天文学中的行星运动、气象学中的季节变化、生物学中的昼夜节律、经济学中的商业周期、物理学中的电磁波以及数学运算和逻辑推理等。因此,在许多任务和场景中,人们希望对周期进行建模,以便根据以往的经验进行推理。

来自主题: AI技术研报
2490 点击    2024-11-10 13:43
清华厦大等提出“无限长上下文”技术,100万大海捞针全绿,Llama\Qwen\MiniCPM都能上分

清华厦大等提出“无限长上下文”技术,100万大海捞针全绿,Llama\Qwen\MiniCPM都能上分

清华厦大等提出“无限长上下文”技术,100万大海捞针全绿,Llama\Qwen\MiniCPM都能上分

大模型的记忆限制被打破了,变相实现“无限长”上下文。最新成果,来自清华、厦大等联合提出的LLMxMapReduce长本文分帧处理技术。

来自主题: AI技术研报
3693 点击    2024-11-09 15:38
MetaGPT开源自动生成智能体工作流,4.55%成本超GPT-4o

MetaGPT开源自动生成智能体工作流,4.55%成本超GPT-4o

MetaGPT开源自动生成智能体工作流,4.55%成本超GPT-4o

对于 LLM 从业者来说,让 LLM 落地应用并发挥作用需要手动构建并反复调试 Agentic Workflow,这无疑是个繁琐过程,一遍遍修改相似的代码,调试 prompt,手动执行测试并观察效果,并且换个 LLM 可能就会失效,有高昂的人力成本。许多公司甚至专职招聘 Prompt Engineer 来完成这一工作。

来自主题: AI技术研报
3147 点击    2024-11-09 10:31
不让视觉语言模型「盲猜」,性能竟直接提升一倍?

不让视觉语言模型「盲猜」,性能竟直接提升一倍?

不让视觉语言模型「盲猜」,性能竟直接提升一倍?

近日,卡内基梅隆大学与华盛顿大学的研究团队推出了 NaturalBench,这是一项发表于 NeurIPS'24 的以视觉为核心的 VQA 基准。它通过自然图像上的简单问题——即自然对抗样本(Natural Adversarial Samples)——对视觉语言模型发起严峻挑战。

来自主题: AI技术研报
2652 点击    2024-11-09 10:27
清华大学自动化系李梢团队提出基于AI的肿瘤中西医防治新范式

清华大学自动化系李梢团队提出基于AI的肿瘤中西医防治新范式

清华大学自动化系李梢团队提出基于AI的肿瘤中西医防治新范式

随着生物医学研究进入人工智能时代,如何运用AI前沿技术,深入挖掘中医药在肿瘤防治上的特色理论与实践经验,形成中西医融合的肿瘤防治新范式?这既是中西医学面临的共性难题,也是人工智能与信息科学面临的重大挑战。

来自主题: AI技术研报
3364 点击    2024-11-09 10:19
生成式AI,一年或造50万吨垃圾

生成式AI,一年或造50万吨垃圾

生成式AI,一年或造50万吨垃圾

智东西11月8日报道,生成式AI的发展或将加剧电子垃圾问题。

来自主题: AI技术研报
1843 点击    2024-11-09 09:46
评估大模型不看输出看「内在」,上交大新测试指标入选NeurIPS 2024

评估大模型不看输出看「内在」,上交大新测试指标入选NeurIPS 2024

评估大模型不看输出看「内在」,上交大新测试指标入选NeurIPS 2024

能够深入大模型内部的新评测指标来了! 上交大MIFA实验室提出了全新的大模型评估指标Diff-eRank。 不同于传统评测方法,Diff-eRank不研究模型输出,而是选择了分析其背后的隐藏表征。

来自主题: AI技术研报
3202 点击    2024-11-08 19:43
RAGEval:实现实际场景检索增强生成系统(RAG)的“精准诊断”

RAGEval:实现实际场景检索增强生成系统(RAG)的“精准诊断”

RAGEval:实现实际场景检索增强生成系统(RAG)的“精准诊断”

清华大学NLP实验室联合北京师范大学、中国科学院大学、东北大学等机构的研究人员推出了全新的评测方法 RAGEval,通过快速构建场景化评估数据实现对检索增强生成(RAG)系统的“精准诊断”。

来自主题: AI技术研报
3122 点击    2024-11-08 19:31
聚焦「视听触感官」协同配合的具身精细操纵,人大胡迪团队领衔探索机器人模态时变性挑战

聚焦「视听触感官」协同配合的具身精细操纵,人大胡迪团队领衔探索机器人模态时变性挑战

聚焦「视听触感官」协同配合的具身精细操纵,人大胡迪团队领衔探索机器人模态时变性挑战

中国人民大学高瓴人工智能学院 GeWu 实验室、朝闻道机器人和 TeleAI 最近的合作研究揭示并指出了 “模态时变性”(Modality Temporality)现象,通过捕捉并刻画各个模态质量随物体操纵过程的变化,提升不同信息在具身多模态交互的感知质量,可显著改善精细物体操纵的表现。论文已被 CoRL2024 接收并选为 Oral Presentation。

来自主题: AI技术研报
3212 点击    2024-11-08 19:26
LeCun赞转!类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘

LeCun赞转!类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘

LeCun赞转!类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘

自从 Sora 横空出世,业界便掀起了一场「视频生成模型到底懂不懂物理规律」的争论。图灵奖得主 Yann LeCun 明确表示,基于文本提示生成的逼真视频并不代表模型真正理解了物理世界。之后更是直言,像 Sora 这样通过生成像素来建模世界的方式注定要失败。

来自主题: AI技术研报
3619 点击    2024-11-08 19:14
文本图格式大一统!首个大规模文本边基准TEG-DB发布 | NeurIPS 2024

文本图格式大一统!首个大规模文本边基准TEG-DB发布 | NeurIPS 2024

文本图格式大一统!首个大规模文本边基准TEG-DB发布 | NeurIPS 2024

最近,来自上海大学、山东大学和埃默里大学等机构的研究人员首次提出了文本边图的数据集与基准,包括9个覆盖4个领域的大规模文本边图数据集,以及一套标准化的文本边图研究范式。该研究的发表极大促进了文本边图图表示学习的研究,有利于自然语言处理与图数据挖掘领域的深度合作。

来自主题: AI技术研报
2917 点击    2024-11-08 14:20
谷歌DeepMind研究再登Nature封面,隐形水印让AI无所遁形

谷歌DeepMind研究再登Nature封面,隐形水印让AI无所遁形

谷歌DeepMind研究再登Nature封面,隐形水印让AI无所遁形

近日,谷歌DeepMind发表的一项研究登上了Nature期刊的封面,研究人员开发了一种名为SynthID-Text的水印方案,已经在自家的Gemini上投入使用,跟踪AI生成的文本内容,使其无所遁形。

来自主题: AI技术研报
2652 点击    2024-11-08 14:12