AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
DanceGRPO:首个统一视觉生成的强化学习框架

DanceGRPO:首个统一视觉生成的强化学习框架

DanceGRPO:首个统一视觉生成的强化学习框架

R1 横空出世,带火了 GRPO 算法,RL 也随之成为 2025 年的热门技术探索方向,近期,字节 Seed 团队就在图像生成方向进行了相关探索。

来自主题: AI技术研报
7172 点击    2025-05-15 10:47
红杉资本的AI应用焦虑:AI必须要赚钱了

红杉资本的AI应用焦虑:AI必须要赚钱了

红杉资本的AI应用焦虑:AI必须要赚钱了

红杉资本连续三年关注AI应用的盈利压力,指出当前AI市场规模已达万亿美元但面临挑战:智能体技术受限于串行任务瓶颈,行业渗透率差异显著,初创企业需深耕垂直领域或整合人工环节。大模型厂商向下游扩张挤压初创空间,部分企业通过收购强化竞争力,AI应用需从工具转向交付结果以突破盈利困境。

来自主题: AI技术研报
8042 点击    2025-05-15 10:29
为什么AI视频工具长得越来越像?

为什么AI视频工具长得越来越像?

为什么AI视频工具长得越来越像?

比起此前对生成时长、模型参数的强调,大半年来,不提Sora的AI视频玩家将这场“军备竞赛”的重点放在了三个维度上——卷一致性、卷可用性、卷可玩性。所谓的“一致性”指的是视频生成过程中帧与帧之间的过渡性、动作的连续性和场景的真实性等。

来自主题: AI技术研报
7939 点击    2025-05-15 10:27
通义万相VACE开源!一款模型搞定多种视频编辑任务

通义万相VACE开源!一款模型搞定多种视频编辑任务

通义万相VACE开源!一款模型搞定多种视频编辑任务

此次开源的 Wan2.1-VACE-1.3B 支持 480P 分辨率,Wan2.1-VACE-14B 支持 480P 和 720P 分辨率。通过 VACE,用户可一站式完成文生视频、图像参考生成、局部编辑与视频扩展等多种任务,无需频繁切换模型或工具,真正实现高效、灵活的视频创作体验。

来自主题: AI资讯
8974 点击    2025-05-15 00:35
精准提取数据太折磨人,试下pip install -U contextgem,自动生成提示 | 痛快

精准提取数据太折磨人,试下pip install -U contextgem,自动生成提示 | 痛快

精准提取数据太折磨人,试下pip install -U contextgem,自动生成提示 | 痛快

最近ContextGem很火。它既不是RAG也不是Agent,而是专注于"结构化提取"的框架,它像一个"文档理解层",通过文档中心设计和神经网络技术(SAT)将非结构化文档转化为精确的结构化数据。它可作为RAG的前置处理器、Agent的感知模块,也可独立使用。

来自主题: AI技术研报
7434 点击    2025-05-14 15:12
首个,专攻点云上下文学习自适应采样!支持点级、提示级|CVPR 2025

首个,专攻点云上下文学习自适应采样!支持点级、提示级|CVPR 2025

首个,专攻点云上下文学习自适应采样!支持点级、提示级|CVPR 2025

MICAS是一种专为3D点云上下文学习设计的多粒度采样方法,通过任务自适应点采样和查询特定提示采样,提升模型在点云重建、去噪、配准和分割等任务中的稳健性和适应性,显著优于现有技术。

来自主题: AI技术研报
8091 点击    2025-05-14 14:28
ICML 2025 | 如何在合成文本数据时避免模型崩溃?

ICML 2025 | 如何在合成文本数据时避免模型崩溃?

ICML 2025 | 如何在合成文本数据时避免模型崩溃?

随着生成式人工智能技术的飞速发展,合成数据正日益成为大模型训练的重要组成部分。未来的 GPT 系列语言模型不可避免地将依赖于由人工数据和合成数据混合构成的大规模语料。

来自主题: AI技术研报
7364 点击    2025-05-14 14:04