AI资讯新闻榜单内容搜索-框架

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 框架
ACL 2024 | 提升大模型持续学习性能,哈工大、度小满提出共享注意力框架SAPT

ACL 2024 | 提升大模型持续学习性能,哈工大、度小满提出共享注意力框架SAPT

ACL 2024 | 提升大模型持续学习性能,哈工大、度小满提出共享注意力框架SAPT

在大模型实际部署落地的过程中,如何赋予大模型持续学习的能力是一个至关重要的挑战。这使其能够动态适应新的任务并不断获得新的知识。大模型的持续学习主要面临两个重大挑战,分别是灾难性遗忘和知识迁移。灾难性遗忘是指模型在学习新任务时,会忘记其已掌握的旧任务。知识迁移则涉及到如何在学习新任务时有效地应用旧任务的知识来提升新任务学习的效果。

来自主题: AI技术研报
8407 点击    2024-05-29 16:18
OCR小模型仍有机会!华科等提出VIMTS:零样本视频端到端识别新SOTA

OCR小模型仍有机会!华科等提出VIMTS:零样本视频端到端识别新SOTA

OCR小模型仍有机会!华科等提出VIMTS:零样本视频端到端识别新SOTA

通过提示查询生成模块和任务感知适配器,大一统框架VimTS在不同任务间实现更好的协同作用,显著提升了模型的泛化能力。该方法在多个跨域基准测试中表现优异,尤其在视频级跨域自适应方面,仅使用图像数据就实现了比现有端到端视频识别方法更高的性能。

来自主题: AI技术研报
8508 点击    2024-05-28 13:53
大模型“国家队”发力了 ,中国移动发布“万百千”

大模型“国家队”发力了 ,中国移动发布“万百千”

大模型“国家队”发力了 ,中国移动发布“万百千”

国产大模型最新进展,这次来自“国家队”! 刚刚,全栈国产化生态大模型“九天智能基座”正式发布! 它由中国移动自研。包括万卡算力、千亿模型及百汇平台三部分。 其中模型部分是九天自主研发的从算子到框架全栈国产训练的千亿参数大模型,能力达到GPT-4的90%水平。

来自主题: AI资讯
9418 点击    2024-05-25 18:32
只需单卡RTX 3090,低比特量化训练就能实现LLaMA-3 8B全参微调

只需单卡RTX 3090,低比特量化训练就能实现LLaMA-3 8B全参微调

只需单卡RTX 3090,低比特量化训练就能实现LLaMA-3 8B全参微调

本文由GreenBit.AI团队撰写,团队的核心成员来自德国哈索·普拉特纳计算机系统工程院开源技术小组。我们致力于推动开源社区的发展,倡导可持续的机器学习理念。我们的目标是通过提供更具成本效益的解决方案,使人工智能技术在环境和社会层面产生积极影响。

来自主题: AI技术研报
8087 点击    2024-05-25 18:15
果然,美国限制AI出口立法的进程又进一步

果然,美国限制AI出口立法的进程又进一步

果然,美国限制AI出口立法的进程又进一步

当地时间2024年5月22日,美国众议院外交事务委员会以压倒性多数,通过了一项限制AI模型出口的法案——《加强海外关键出口限制国家框架法案》(Enhancing National Frameworks for Overseas Critical Exports Act / HR 8315,以下简称ENFORCE法案),旨在扩大美国政府监管人工智能系统出口的权力。

来自主题: AI资讯
1973 点击    2024-05-25 10:49
腾讯PCG自研高性能大语言模型推理引擎「一念LLM」正式开源

腾讯PCG自研高性能大语言模型推理引擎「一念LLM」正式开源

腾讯PCG自研高性能大语言模型推理引擎「一念LLM」正式开源

以 OpenAI 的 GPT 系列模型为代表的大语言模型(LLM)掀起了新一轮 AI 应用浪潮,但是 LLM 推理的高昂成本一直困扰着业务团队。

来自主题: AI技术研报
9982 点击    2024-05-24 20:58
标注受限也能识别多标签图像!中山大学等发布异构语义转移HST框架 | IJCV 2024

标注受限也能识别多标签图像!中山大学等发布异构语义转移HST框架 | IJCV 2024

标注受限也能识别多标签图像!中山大学等发布异构语义转移HST框架 | IJCV 2024

在多标签图像识别领域中,由于图像本身和潜在标签类别的复杂性,收集满足现有模型训练的多标签标注信息往往成本高昂且难以拓展。中山大学联合广东工业大学联手探索标注受限情况下的多标签图像识别任务,通过对多标签图像中的强语义相关性的探索研究,提出了一种异构语义转移(Heterogeneous Semantic Transfer, HST) 框架,实现了有效的未知标签生成。

来自主题: AI技术研报
3589 点击    2024-05-24 20:39
均价300万美元?英伟达GH200超级芯片落地9个超算中心,每秒两百亿亿次flop

均价300万美元?英伟达GH200超级芯片落地9个超算中心,每秒两百亿亿次flop

均价300万美元?英伟达GH200超级芯片落地9个超算中心,每秒两百亿亿次flop

英伟达正在宣传其Grace Hopper的异构计算框架正在被分布于世界各地的9台超算系统所使用,共同实现了惊人的 200 exaflops的AI计算能力。这表明英伟达正在为世界上一些更强大的人工智能系统供货,已经开始取代AMD和英特尔在高性能计算领域的地位。

来自主题: AI资讯
8432 点击    2024-05-22 13:03
替代MLP的KAN,被开源项目扩展到卷积了

替代MLP的KAN,被开源项目扩展到卷积了

替代MLP的KAN,被开源项目扩展到卷积了

本月初,来自 MIT 等机构的研究者提出了一种非常有潜力的 MLP 替代方法 ——KAN。

来自主题: AI资讯
9667 点击    2024-05-19 16:25