AI资讯新闻榜单内容搜索-框架

统一图像生成，无需繁杂插件！智源发布扩散模型框架OmniGen

多模态模型，统一图像生成。

来自主题: AI资讯

8124 点击 2024-10-30 13:39

叙事Prompt也能提升LLM推理能力？用叙事框架SoT解决复杂问题 |波恩大学最新

如何通过更好的提示工程来提升模型的推理能力，一直是研究人员和工程师们关注的重点。

来自主题: AI资讯

11582 点击 2024-10-30 11:07

Janus：DeepSeek 打造的多模态理解与生成的解耦视觉编码框架

Janus 是 DeepSeek AI 开发的一个先进的多模态理解和生成框架，它通过创新性地解耦视觉编码路径来应对多模态理解和生成任务之间的需求冲突。

来自主题: AI技术研报

9069 点击 2024-10-29 14:46

一个模型走天下！智源提出全新扩散架构OmniGen，AI生图进入「一键生成」时代

LLM统一了语言生成任务，图像生成可以吗？就在刚刚，智源推出了全新扩散模型架构OmniGen，单个模型就能生成图像，彻底告别繁琐工作流！

来自主题: AI技术研报

6083 点击 2024-10-29 14:38

PUMA：商汤科技迈向多模态任务统一框架的多粒度视觉生成模型

PUMA（emPowering Unified MLLM with Multi-grAnular visual generation）是一项创新的多模态大型语言模型（MLLM），由商汤科技联合来自香港中文大学、港大和清华大学的研究人员共同开发。它通过统一的框架处理和生成多粒度的视觉表示，巧妙地平衡了视觉生成任务中的多样性与可控性。

来自主题: AI技术研报

5992 点击 2024-10-29 14:32

新扩散模型OmniGen一统图像生成，架构还高度简化、易用

大型语言模型（LLM）的出现统一了语言生成任务，并彻底改变了人机交互。然而，在图像生成领域，能够在单一框架内处理各种任务的统一模型在很大程度上仍未得到探索。近日，智源推出了新的扩散模型架构 OmniGen，一种新的用于统一图像生成的多模态模型。

来自主题: AI技术研报

12453 点击 2024-10-29 13:38

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-Reasoner

TS-Reasoner是一个创新的多步推理框架，结合了大型语言模型的上下文学习和推理能力，通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估，有效提高了复杂时间序列任务的推理能力和准确性。实验结果表明，TS-Reasoner在金融决策、能源负载预测和因果关系挖掘等多个任务上，相较于现有方法具有显著的性能优势。

来自主题: AI技术研报

7065 点击 2024-10-28 18:30