AI资讯新闻榜单内容搜索-全模态

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 全模态
截胡OpenAI,谷歌全模态模型首次解禁!Gemini 2.0中文唠嗑式P图,动漫游戏圈沸腾

截胡OpenAI,谷歌全模态模型首次解禁!Gemini 2.0中文唠嗑式P图,动漫游戏圈沸腾

截胡OpenAI,谷歌全模态模型首次解禁!Gemini 2.0中文唠嗑式P图,动漫游戏圈沸腾

OpenAI的全模态模型没来,谷歌的全模态图像生成器倒是抢先上线了!Gemini 2.0 Flash中上线的原生图像生成功能,动动嘴就能PS,还能轻松制作海报和表情包,动漫和漫画圈已经沸腾了。

来自主题: AI资讯
8910 点击    2025-03-13 18:22
多模态DeepSeek来了,北大港科联合发布Align-DS-V

多模态DeepSeek来了,北大港科联合发布Align-DS-V

多模态DeepSeek来了,北大港科联合发布Align-DS-V

在当前AI领域的快速发展中,“强推理慢思考”已经成为主要的发展动向之一,它们深刻影响着研发方向和投资决策。如何将强推理慢思考进一步推广到更多模态甚至是全模态场景,并且确保和人类的价值意图相一致,已成为一个极具前瞻性且至关重要的挑战。

来自主题: AI技术研报
7457 点击    2025-02-06 12:13
全模态对齐框架align-anything来了:实现跨模态指令跟随

全模态对齐框架align-anything来了:实现跨模态指令跟随

全模态对齐框架align-anything来了:实现跨模态指令跟随

如何全模态大模型与人类的意图相对齐,已成为一个极具前瞻性且至关重要的挑战。

来自主题: AI技术研报
7435 点击    2024-10-18 10:53
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024

AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024

AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024

音视频大语言模型在处理视频内容时,往往未能充分发挥语音的作用。video-SALMONN模型通过三部分创新:音视频编码和时间对齐、多分辨率因果Q-Former、多样性损失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。

来自主题: AI技术研报
6492 点击    2024-07-31 15:05