AI资讯新闻榜单内容搜索-框架

事件相机+AI视频生成，港大CUBE框架入选ICIP，无需训练实现可控视频生成

在这个信息爆炸的时代，如何让AI生成的视频更具创意，又符合特定需求？

来自主题: AI技术研报

8737 点击 2024-10-26 22:05

易慧智能发布汽车行业大模型评测集，并重磅推出模型路由技术方案

10月25日，汽车行业AI产品和业务解决方案提供商易慧智能发布了汽车行业首个大模型评测集。此次评测旨在全面评估市面上主流大模型在汽车行业中的实际应用效果，特别关注于汽车营销场景的应用评估。在此基础上，易慧智能重磅推出创新的模型路由技术方案——基于多模型的YiAgent群体智能技术框架。

来自主题: AI资讯

6767 点击 2024-10-26 11:11

图像伪造照妖镜！北大发布多模态LLM图像篡改检测定位框架FakeShield

北京大学的研究人员开发了一种新型多模态框架FakeShield，能够检测图像伪造、定位篡改区域，并提供基于像素和图像语义错误的合理解释，可以提高图像伪造检测的可解释性和泛化能力。

来自主题: AI技术研报

6430 点击 2024-10-25 11:03

自动驾驶不怵恶劣天气，西电&上海AI Lab多模态融合检测端到端算法来了 | NeurlPS Oral

西安电子科大、上海AI Lab等提出多模态融合检测算法E2E-MFD，将图像融合和目标检测整合到一个单阶段、端到端框架中，简化训练的同时，提升目标解析性能。相关论文已入选顶会NeurlPS 2024 Oral，代码、模型均已开源。

来自主题: AI技术研报

6175 点击 2024-10-25 10:56

MIT韩松团队长上下文LLM推理高效框架DuoAttention：单GPU实现330万Token上下文推理

TL;DR：DuoAttention 通过将大语言模型的注意力头分为检索头（Retrieval Heads，需要完整 KV 缓存）和流式头（Streaming Heads，只需固定量 KV 缓存），大幅提升了长上下文推理的效率，显著减少内存消耗、同时提高解码（Decoding）和预填充（Pre-filling）速度，同时在长短上下文任务中保持了准确率。

来自主题: AI技术研报

5504 点击 2024-10-24 11:33