AI资讯新闻榜单内容搜索-研究

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 研究
万字综述大模型高效推理:无问芯穹与清华、上交最新联合研究全面解析大模型推理优化

万字综述大模型高效推理:无问芯穹与清华、上交最新联合研究全面解析大模型推理优化

万字综述大模型高效推理:无问芯穹与清华、上交最新联合研究全面解析大模型推理优化

近年来,大语言模型(Large Language Models, LLMs)受到学术界和工业界的广泛关注,得益于其在各种语言生成任务上的出色表现,大语言模型推动了各种人工智能应用(例如ChatGPT、Copilot等)的发展。然而,大语言模型的落地应用受到其较大的推理开销的限制,对部署资源、用户体验、经济成本都带来了巨大挑战。

来自主题: AI技术研报
11243 点击    2024-06-14 10:35
GPT-4尚未出现自我意识!这项研究用「上帝之点」解读,迈向AGI局限无法克服

GPT-4尚未出现自我意识!这项研究用「上帝之点」解读,迈向AGI局限无法克服

GPT-4尚未出现自我意识!这项研究用「上帝之点」解读,迈向AGI局限无法克服

中国科学院大学和中科数字大脑研究院的研究人员,引入了上帝之点和死亡之点,构建了智能体演化的动力学模型——Flight Model。他们发现,以GPT-4为代表的AI已经接近了人类成人智能水平,但尚未表现出自我意识证据。并且,具有自我意识到AGI,在科学原理上存在目前无法克服的局限性。

来自主题: AI技术研报
8227 点击    2024-06-13 20:06
对话李开复:价格战烧不出 AI 超级应用,未来国内可能只剩下 10 家大模型公司

对话李开复:价格战烧不出 AI 超级应用,未来国内可能只剩下 10 家大模型公司

对话李开复:价格战烧不出 AI 超级应用,未来国内可能只剩下 10 家大模型公司

26 年前,微软中国研究院成立(即微软亚洲研究院的前身),作为创办者和首任院长,李开复带领微软亚洲研究院从零开始发展,并建立起了一套完善的「大牛+小牛+学生」人才培养机制和创新文化,在全球产生了重大影响。

来自主题: AI资讯
10998 点击    2024-06-13 10:55
用神经架构搜索给LLM瘦身,模型变小,准确度有时反而更高

用神经架构搜索给LLM瘦身,模型变小,准确度有时反而更高

用神经架构搜索给LLM瘦身,模型变小,准确度有时反而更高

大型语言模型(LLM)的一个主要特点是「大」,也因此其训练和部署成本都相当高,如何在保证 LLM 准确度的同时让其变小就成了非常重要且有价值的研究课题。

来自主题: AI技术研报
10437 点击    2024-06-11 10:06
i人小助手:Meta推出多模态对话图,帮你轻松识别社交状态

i人小助手:Meta推出多模态对话图,帮你轻松识别社交状态

i人小助手:Meta推出多模态对话图,帮你轻松识别社交状态

近年来兴起的第一人称视角视频研究为理解人类社交行为提供了无法取代的直观视角,然而,绝大多数的既往工作都侧重于分析与摄像机佩戴者相关的行为,并未关注处于社交场景中其他社交对象的状态。

来自主题: AI技术研报
9021 点击    2024-06-10 15:02
谷歌开源TimesFM:1000亿个时间点训练,入选ICML 2024

谷歌开源TimesFM:1000亿个时间点训练,入选ICML 2024

谷歌开源TimesFM:1000亿个时间点训练,入选ICML 2024

在大语言模型突飞猛进的同时,谷歌的研究团队在时序预测方面也取得了突破性的成果——今年2月发表的模型TimesFM,而且放出了模型的代码和权重,让更多开发者体验这种「开箱即用」的零样本预测能力。

来自主题: AI资讯
10191 点击    2024-06-10 14:40
「汪汪」to Vector!密歇根博士生用AI解码狗的声音 | LREC 2024

「汪汪」to Vector!密歇根博士生用AI解码狗的声音 | LREC 2024

「汪汪」to Vector!密歇根博士生用AI解码狗的声音 | LREC 2024

近日,来自密歇根大学的研究人员,开发了一款人工智能工具,可以区分不同含义的狗叫声,并识别狗的年龄、性别和品种。

来自主题: AI资讯
9448 点击    2024-06-10 14:35
两句话,让LLM逻辑推理瞬间崩溃!最新「爱丽丝梦游仙境」曝出GPT、Claude等重大缺陷

两句话,让LLM逻辑推理瞬间崩溃!最新「爱丽丝梦游仙境」曝出GPT、Claude等重大缺陷

两句话,让LLM逻辑推理瞬间崩溃!最新「爱丽丝梦游仙境」曝出GPT、Claude等重大缺陷

在基准测试上频频屠榜的大模型们,竟然被一道简单的逻辑推理题打得全军覆没?最近,研究机构LAION的几位作者共同发表了一篇文章,以「爱丽丝梦游仙境」为启发涉及了一系列简单的推理问题,揭示了LLM基准测试的盲区。

来自主题: AI技术研报
10552 点击    2024-06-10 14:23
GPT-4欺骗人类高达99.16%惊人率!PNAS重磅研究曝出,LLM推理越强欺骗值越高

GPT-4欺骗人类高达99.16%惊人率!PNAS重磅研究曝出,LLM推理越强欺骗值越高

GPT-4欺骗人类高达99.16%惊人率!PNAS重磅研究曝出,LLM推理越强欺骗值越高

最近,德国研究科学家发表的PANS论文揭示了一个令人担忧的现象:LLM已经涌现出「欺骗能力」,它们可以理解并诱导欺骗策。而且,相比前几年的LLM,更先进的GPT-4、ChatGPT等模型在欺骗任务中的表现显著提升。

来自主题: AI技术研报
9249 点击    2024-06-09 18:23
Llama3-8B秒杀700亿巨兽?北大博士生等全新「BoT」框架推理暴涨70倍,24点图形推理一步成神

Llama3-8B秒杀700亿巨兽?北大博士生等全新「BoT」框架推理暴涨70倍,24点图形推理一步成神

Llama3-8B秒杀700亿巨兽?北大博士生等全新「BoT」框架推理暴涨70倍,24点图形推理一步成神

24点游戏、几何图形、一步将死问题,这些推理密集型任务,难倒了一片大模型,怎么破?北大、UC伯克利、斯坦福研究者最近提出了一种全新的BoT方法,用思维模板大幅增强了推理性能。而Llama3-8B在BoT的加持下,竟多次超越Llama3-70B!

来自主题: AI技术研报
10284 点击    2024-06-08 20:15