AI资讯新闻榜单内容搜索-CR

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: CR
Meta新突破!跨模态生成告别噪声:流匹配实现任意模态无缝流转

Meta新突破!跨模态生成告别噪声:流匹配实现任意模态无缝流转

Meta新突破!跨模态生成告别噪声:流匹配实现任意模态无缝流转

在人工智能领域,跨模态生成(如文本到图像、图像到文本)一直是技术发展的前沿方向。现有方法如扩散模型(Diffusion Models)和流匹配(Flow Matching)虽取得了显著进展,但仍面临依赖噪声分布、复杂条件机制等挑战。

来自主题: AI技术研报
7012 点击    2025-06-04 14:18
全面评估多模态模型视频OCR能力,Gemini 准确率仅73.7%

全面评估多模态模型视频OCR能力,Gemini 准确率仅73.7%

全面评估多模态模型视频OCR能力,Gemini 准确率仅73.7%

多模态大模型(MLLM)在静态图像上已经展现出卓越的 OCR 能力,能准确识别和理解图像中的文字内容。MME-VideoOCR 致力于系统评估并推动MLLM在视频OCR中的感知、理解和推理能力。

来自主题: AI技术研报
6636 点击    2025-05-30 17:30
华为中科大联创大模型低比特量化算法,1‰数据实现昇腾无损压缩7倍

华为中科大联创大模型低比特量化算法,1‰数据实现昇腾无损压缩7倍

华为中科大联创大模型低比特量化算法,1‰数据实现昇腾无损压缩7倍

大模型巨无霸体量,让端侧部署望而却步?华为联手中科大提出CBQ新方案,仅用0.1%的训练数据实现7倍压缩率,保留99%精度。

来自主题: AI技术研报
8101 点击    2025-05-26 15:21
超越 OCR:AI 如何为企业文档处理带来变革

超越 OCR:AI 如何为企业文档处理带来变革

超越 OCR:AI 如何为企业文档处理带来变革

长期以来,光学字符识别(OCR)技术一直是文档数字化的基石。然而,传统的实现方式在应对当今复杂多样的文档时却显得力不从心。在企业领域,文档的形式多种多样,包括扫描的合同、图像、带有嵌入式表格的电子邮件,甚至是手写笔记。基于模式识别和模板的系统无法跟上时代的步伐。一旦输入与预期的规范有所偏离,性能便会出现明显下降,暴露出其脆弱性。

来自主题: AI技术研报
7833 点击    2025-05-25 11:56
AI+设计丨Recraft:前俄罗斯模特打造的创意操作系统

AI+设计丨Recraft:前俄罗斯模特打造的创意操作系统

AI+设计丨Recraft:前俄罗斯模特打造的创意操作系统

Recraft,利用AI生成和编辑高质量矢量插图和图标,服务于设计和市场团队。完成3000万美元B轮融资,投资方为Accel、Khosla Ventures、Madrona。本轮估值未知,累计融资4200万美元。

来自主题: AI资讯
7465 点击    2025-05-23 15:34
速递|全球最大AI芯片矩阵诞生:摩根大通新增70亿美元注资阿比林数据中心,可容纳40万块英伟达芯片

速递|全球最大AI芯片矩阵诞生:摩根大通新增70亿美元注资阿比林数据中心,可容纳40万块英伟达芯片

速递|全球最大AI芯片矩阵诞生:摩根大通新增70亿美元注资阿比林数据中心,可容纳40万块英伟达芯片

该项目在今年1 月进一步扩大,Crusoe 与甲骨文签署了更大规模的租赁协议 ,新增 6 个数据中心,覆盖整个 1.2 吉瓦的场地,The Information 率先报道。该协议使甲骨文能为 OpenAI 提供的算力规模翻了两番,额外增加 30 万块 GPU。最初与 Blue Owl 成立的合资企业并不包含此次扩建计划。

来自主题: AI资讯
7774 点击    2025-05-23 15:22
速递|曾经融资4.5亿美元AI独角兽Builder.ai资金链断裂,启动破产程序

速递|曾经融资4.5亿美元AI独角兽Builder.ai资金链断裂,启动破产程序

速递|曾经融资4.5亿美元AI独角兽Builder.ai资金链断裂,启动破产程序

曾估值超10 亿美元的微软支持 AI 公司 Builder.ai 陷入资金短缺,已进入破产程序,该公司发言人向 TechCrunch 证实了这一消息。

来自主题: AI资讯
6233 点击    2025-05-22 13:53
ICRA 2025|通用多机器人长时任务规划框架破解任务分配难题,成功率+105%、效率+36%

ICRA 2025|通用多机器人长时任务规划框架破解任务分配难题,成功率+105%、效率+36%

ICRA 2025|通用多机器人长时任务规划框架破解任务分配难题,成功率+105%、效率+36%

2025 年 5 月,美国加州大学河滨分校 (UC Riverside) 与宾夕法尼亚州立大学 (Penn State University) 联合团队在机器人领域顶级会议 ICRA 2025 上发布最新研究成果 LaMMA-P。

来自主题: AI技术研报
9054 点击    2025-05-20 14:50