AI资讯新闻榜单内容搜索-Era

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Era
字节开源了一个了不得的模型!

字节开源了一个了不得的模型!

字节开源了一个了不得的模型!

字节跳动开源了一个口碑还不错的模型——BAGEL (ByteDance Agnostic Generation and Empathetic Language model), 一个统一多模态基础模型。啥叫“统一”?一个模型就能同时理解和生成文本、图像、视频!

来自主题: AI资讯
8356 点击    2025-05-31 13:45
中国团队让AI拥有「视觉想象力」,像人类一样脑补画面来思考

中国团队让AI拥有「视觉想象力」,像人类一样脑补画面来思考

中国团队让AI拥有「视觉想象力」,像人类一样脑补画面来思考

在人类的认知过程中,视觉思维(Visual Thinking)扮演着不可替代的核心角色,这一现象贯穿于各个专业领域和日常生活的方方面面。

来自主题: AI技术研报
10782 点击    2025-05-30 12:53
速递|AI办公Context获1100万美元融资,估值7000万美元,打造能“逻辑推演”数据的AI办公

速递|AI办公Context获1100万美元融资,估值7000万美元,打造能“逻辑推演”数据的AI办公

速递|AI办公Context获1100万美元融资,估值7000万美元,打造能“逻辑推演”数据的AI办公

Context 是一家开发人工智能办公套件的初创公司,于5 月 28 日宣布完成 1100 万美元种子轮融资,由 Lux Capital 领投,高通创投和 General Catalyst 跟投。此轮融资使公司总融资额达到约 1575 万美元,估值达 7000 万美元。

来自主题: AI资讯
6528 点击    2025-05-29 18:32
第二次Sora时刻来了!全球首款实时摄像头诞生,真人感拉满颠覆全行业

第二次Sora时刻来了!全球首款实时摄像头诞生,真人感拉满颠覆全行业

第二次Sora时刻来了!全球首款实时摄像头诞生,真人感拉满颠覆全行业

就在刚刚,全球首款实时摄像头重磅诞生!从此,AI视频生成的「实时性」和「沉浸感」被重新定义,全行业都有了颠覆性方案。

来自主题: AI资讯
11203 点击    2025-05-28 16:23
这样更公平:用jina-reranker-m0为多模态文档打分重排

这样更公平:用jina-reranker-m0为多模态文档打分重排

这样更公平:用jina-reranker-m0为多模态文档打分重排

当你在搜索“中国队在多哈乒乓球锦标赛的成绩”时,一篇新闻报道的文本部分和你的查询的相关性是 0.7,配图的相关性 0.5;另一篇则是文本相关性为 0.6,图片也是 0.6。那么,哪一篇报道才是你真正想要的呢?

来自主题: AI技术研报
8889 点击    2025-05-27 09:57
312条轨迹激发241%性能!上交大与SII开源电脑智能体,超越 Claude 3.7

312条轨迹激发241%性能!上交大与SII开源电脑智能体,超越 Claude 3.7

312条轨迹激发241%性能!上交大与SII开源电脑智能体,超越 Claude 3.7

自 Anthropic 推出 Claude Computer Use,打响电脑智能体(Computer Use Agent)的第一枪后,OpenAI 也相继推出 Operator,用强化学习(RL)算法把电脑智能体的能力推向新高,引发全球范围广泛关注。

来自主题: AI技术研报
9173 点击    2025-05-25 15:11
颜水成领衔,给AI分段位!超100款多模态模型,无人达到L5

颜水成领衔,给AI分段位!超100款多模态模型,无人达到L5

颜水成领衔,给AI分段位!超100款多模态模型,无人达到L5

理想中的多模态大模型应该是什么样?十所顶尖高校联合发布General-Level评估框架和General-Bench基准数据集,用五级分类制明确了多模态通才模型的能力标准。当前多模态大语言模型在任务支持、模态覆盖等方面存在不足,且多数通用模型未能超越专家模型,真正的通用人工智能需要实现模态间的协同效应。

来自主题: AI技术研报
10640 点击    2025-05-19 17:08
GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式

GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式

GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式

多模态大模型(Multimodal Large Language Models, MLLM)正迅速崛起,从只能理解单一模态,到如今可以同时理解和生成图像、文本、音频甚至视频等多种模态。正因如此,在AI竞赛进入“下半场”之际(由最近的OpenAI研究员姚顺雨所引发的共识观点),设计科学的评估机制俨然成为决定胜负的核心关键。

来自主题: AI技术研报
9708 点击    2025-05-16 15:06
CVPR2025|MCA-Ctrl:多方协同注意力控制助力AIGC时代图像精准定制化

CVPR2025|MCA-Ctrl:多方协同注意力控制助力AIGC时代图像精准定制化

CVPR2025|MCA-Ctrl:多方协同注意力控制助力AIGC时代图像精准定制化

近年来,生成式人工智能(Generative AI)技术的突破性进展,特别是文本到图像 T2I 生成模型的快速发展,已经使 AI 系统能够根据用户输入的文本提示(prompt)生成高度逼真的图像。从早期的 DALL・E 到 Stable Diffusion、Midjourney 等模型,这一领域的技术迭代呈现出加速发展的态势。

来自主题: AI技术研报
11928 点击    2025-05-12 14:59
AI圈惊天丑闻,Meta作弊刷分实锤?顶级榜单曝黑幕,斯坦福MIT痛斥

AI圈惊天丑闻,Meta作弊刷分实锤?顶级榜单曝黑幕,斯坦福MIT痛斥

AI圈惊天丑闻,Meta作弊刷分实锤?顶级榜单曝黑幕,斯坦福MIT痛斥

刚刚,LMArena陷入了巨大争议,斯坦福MIT和Ai2等的研究者联手发论文痛斥,这个排行榜已经被Meta等公司利用暗中操作排名!Karpathy也下场帮忙锤了一把。而LMArena官方立马回应:论文存在多处错误,指控不实。

来自主题: AI资讯
10287 点击    2025-05-01 14:07