AI资讯新闻榜单内容搜索-ima

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: ima
NIPS2025|小红书智创AIGC团队提出布局控制生成新算法InstanceAssemble

NIPS2025|小红书智创AIGC团队提出布局控制生成新算法InstanceAssemble

NIPS2025|小红书智创AIGC团队提出布局控制生成新算法InstanceAssemble

当下的文本生成图像扩散模型取得了长足进展,为图像生成引入布局控制(Layout-to-Image, L2I)成为可能。

来自主题: AI技术研报
5471 点击    2025-11-04 11:33
让 AI 开口「像人」:最难的不是智能,是「嗓音」

让 AI 开口「像人」:最难的不是智能,是「嗓音」

让 AI 开口「像人」:最难的不是智能,是「嗓音」

Voice Agent 赛道正在爆发,但它迫切需要一个能让对话真正「流动起来」的底层引擎,一个能撑起下一代交互体验的 TTS 模型。竞争的焦点,已经从 LLM 的「大脑」,延伸到了 TTS 的「嗓音」。谁掌握嗓音,谁就掌握着下一代 AI 商业化的钥匙。而 10 月 30 日 MiniMax 发布的 Speech 2.6 模型,似乎正是一个专为解决这些痛点而来的答案。

来自主题: AI资讯
7725 点击    2025-10-31 15:35
3B Image Captioning小钢炮重磅来袭,性能比肩Qwen2.5-VL-72B

3B Image Captioning小钢炮重磅来袭,性能比肩Qwen2.5-VL-72B

3B Image Captioning小钢炮重磅来袭,性能比肩Qwen2.5-VL-72B

今天推荐一个 Dense Image Captioning 的最新技术 —— CapRL (Captioning Reinforcement Learning)。CapRL 首次成功将 DeepSeek-R1 的强化学习方法应用到 image captioning 这种开放视觉任务,创新的以实用性重新定义 image captioning 的 reward。

来自主题: AI技术研报
9046 点击    2025-10-29 10:24
MiniMax,可能是今年最大的黑马。

MiniMax,可能是今年最大的黑马。

MiniMax,可能是今年最大的黑马。

周日晚上,都准备去睡觉了。结果在 X 上刷到一条消息,有个国外的博主说,MiniMax 的 M2 模型将会成为中国最好的模型,与 Sonnet 4.5 旗鼓相当。 我当时心里咯噔一下。MiniMax?

来自主题: AI资讯
8976 点击    2025-10-28 13:54
月之暗面能扳回一局吗?

月之暗面能扳回一局吗?

月之暗面能扳回一局吗?

月之暗面融资传闻升级,估值或逼近MiniMax。Kimi产品因MAU下滑、DeepSeek冲击失速,战略转向Coding和Agent方向,推出分层会员订阅商业化。杨植麟在开源上妥协,但坚持基座模型和toC路线,面临分发弱势和高昂成本,未来半年需明确定位应对激烈竞争。

来自主题: AI资讯
7663 点击    2025-10-28 08:20
MiniMax 迎来大版本号升级:M2 突袭榜单 + 限免,我们第一时间为你评测

MiniMax 迎来大版本号升级:M2 突袭榜单 + 限免,我们第一时间为你评测

MiniMax 迎来大版本号升级:M2 突袭榜单 + 限免,我们第一时间为你评测

10 月 27 日,国产「好模型」阵营又迎来一位新成员,MiniMax 发布了全新大版本模型 M2,延续了 M1 时代的开源策略。它不仅在 Coding 与 Agent 能力等方面继承了 M1 的优势,更在成本效率、智能水平、响应延迟这 3项关键指标上,同时迈出了一大步。

来自主题: AI资讯
8335 点击    2025-10-27 17:44
打造图像编辑领域的ImageNet?苹果用Nano Banana开源了一个超大数据集

打造图像编辑领域的ImageNet?苹果用Nano Banana开源了一个超大数据集

打造图像编辑领域的ImageNet?苹果用Nano Banana开源了一个超大数据集

在开放研究领域里,苹果似乎一整个脱胎换骨,在纯粹的研究中经常会有一些出彩的工作。这次苹果发布的研究成果的确出人意料:他们用谷歌的 Nano-banana 模型做个了视觉编辑领域的 ImageNet。

来自主题: AI技术研报
9083 点击    2025-10-27 11:13
Seedream 4.0大战Nano Banana、GPT-4o?EdiVal-Agent 终结图像编辑评测

Seedream 4.0大战Nano Banana、GPT-4o?EdiVal-Agent 终结图像编辑评测

Seedream 4.0大战Nano Banana、GPT-4o?EdiVal-Agent 终结图像编辑评测

在 AIGC 的下一个阶段,图像编辑(Image Editing)正逐渐取代一次性生成,成为检验多模态模型理解、生成与推理能力的关键场景。我们该如何科学、公正地评测这些图像编辑模型?

来自主题: AI技术研报
6218 点击    2025-10-25 14:26
腾讯版NotebookLM:专克你的微信文件痛点

腾讯版NotebookLM:专克你的微信文件痛点

腾讯版NotebookLM:专克你的微信文件痛点

鹅厂就给旗下AI原生产品知识库工作台ima过了一周岁生日。还趁热打铁放出了ima 2.0版本,主打任务模式。于是,这个能把微信文件、公众号文章等资源一键变成可提问式知识库的鹅厂版NotebookLM,从只会问答升级到了能生成报告和播客的进阶版。

来自主题: AI资讯
8320 点击    2025-10-24 17:10