
多模态长文本理解测评首发:46款模型无一攻克128K难关
多模态长文本理解测评首发:46款模型无一攻克128K难关来自香港科技大学、腾讯西雅图AI Lab、爱丁堡大学、Miniml.AI、英伟达的研究者联合提出了MMLongBench,旨在全面评估多模态模型的长文本理解能力。
来自香港科技大学、腾讯西雅图AI Lab、爱丁堡大学、Miniml.AI、英伟达的研究者联合提出了MMLongBench,旨在全面评估多模态模型的长文本理解能力。
判断AI是否智能,评价维度如今已不仅限于刷榜成绩。
在被微软、谷歌高调比拼 AI 实力刷屏之际,腾讯 AI 携重磅产品轮番登场,不止于拼技术,更是以扎实布局展现对 AI 落地的深度洞察与务实态度。
DeepSeek依旧牢牢占据中国AI产品访问量第一的宝座,其月访问量甚至超过其他几款主流产品的总和。相比之下,腾讯「元宝」和「Kimi」的流量则出现明显下滑,环比降幅超过20%。在广告投放趋于保守之后,用户增长逐步放缓,流量更加依赖产品本身的可用性和用户黏性。
手绘草图一键变身专业游戏形象:
AI红利已兑现,然后呢?又是一年财报季,AI毫无悬念成为互联网企业高频提及的关键词。
近日,腾讯 PCG 社交线的研究团队针对这一问题,采用强化学习(RL)训练方法,通过分组相对策略优化(Group Relative Policy Optimization, GRPO)算法,结合基于奖励的课程采样策略(Reward-based Curriculum Sampling, RCS),将其创新性地应用在意图识别任务上,
微信正从超级应用迈向超级Agent。
AI 圈子每时每刻都在发生巨大变化,编程工具赛道掀起技术革新浪潮。以原生 IDE 体验见长的 Cursor ,凭借其 Agent 模式在 AI 编程领域脱颖而出,对 GitHub Copilot 以及 VS Code 与 JetBrains 全家桶的地位发起挑战。
昨天看到了一个挺有意思的产品发布。是腾讯云自己家的代码助手,CodeBuddy,开了个直播,发了他们的3.0版本。