AI资讯新闻榜单内容搜索-ima

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: ima
我用Minimax MCP,重新打造了浙江省博物馆

我用Minimax MCP,重新打造了浙江省博物馆

我用Minimax MCP,重新打造了浙江省博物馆

我用MiniMax最近发布的MCP Server,做了一个 《会说话的博物馆》

来自主题: AI资讯
8058 点击    2025-04-29 17:08
刚刚,OpenAI最强图像生成API上线,一张图1毛5

刚刚,OpenAI最强图像生成API上线,一张图1毛5

刚刚,OpenAI最强图像生成API上线,一张图1毛5

OpenAI推出图像生成API,低至0.02美元/张,支持多模态定制。

来自主题: AI资讯
8003 点击    2025-04-24 20:53
刚刚,OpenAI图像生成模型API发布,Token计价,一张图花掉1.4元

刚刚,OpenAI图像生成模型API发布,Token计价,一张图花掉1.4元

刚刚,OpenAI图像生成模型API发布,Token计价,一张图花掉1.4元

上个月,OpenAI 在 ChatGPT 中引入了图像生成功能,广受欢迎:仅在第一周,全球就有超过 1.3 亿用户创建了超过 7 亿张图片。就在刚刚,OpenAI 又宣布了一个好消息:他们正式在 API 中推出驱动 ChatGPT 多模态体验的原生模型 ——gpt-image-1,让开发者和企业能够轻松将高质量、专业级的图像生成功能直接集成到自己的工具和平台中。

来自主题: AI资讯
7679 点击    2025-04-24 09:44
MiniMax没有B计划

MiniMax没有B计划

MiniMax没有B计划

MiniMax尤为特殊,从一开始就跟其他玩家不在同一赛道竞争。通用大模型上,MiniMax坚持“产模一体”的理念,即所有的底座模型都要服务于产品。同处于To C赛道,Kimi主战地在国内,MiniMax战略重点在海外市场。

来自主题: AI资讯
8744 点击    2025-04-13 16:39
生图加入CoT,性能提升80%!微软港中文打造天才画手

生图加入CoT,性能提升80%!微软港中文打造天才画手

生图加入CoT,性能提升80%!微软港中文打造天才画手

AI绘画总「翻车」,不是抓不住重点,就是细节崩坏?别愁!微软和港中文学者带来ImageGen-CoT技术,让AI像人一样思考推理,生成超惊艳画作,性能提升高达80%。

来自主题: AI技术研报
2445 点击    2025-04-08 14:52
GPT-4o多模态生图正式上线 - 用嘴改图,此为王道。

GPT-4o多模态生图正式上线 - 用嘴改图,此为王道。

GPT-4o多模态生图正式上线 - 用嘴改图,此为王道。

在ChatGPT上,当你画图的选项变成这个的时候,就说明用的不是Dalle3了,而是4o。目前,有两个渠道可以使用4o Image Generation。一个事ChatGPT,一个是单独的那个Sora的网站。

来自主题: AI资讯
8808 点击    2025-03-26 08:10
AI换脸App爆火:Reface2.5亿下载背后的“病毒式”增长策略

AI换脸App爆火:Reface2.5亿下载背后的“病毒式”增长策略

AI换脸App爆火:Reface2.5亿下载背后的“病毒式”增长策略

Dima Shvets作为天使投资人兼Reface联合创始人,其打造的AI换脸应用下载量突破2.5亿次。该应用的成功源于"实时换脸"技术的先发优势与病毒式传播特性的双重驱动。以下是Dima分享关于如何成功打造Reface的经验分享

来自主题: AI资讯
6508 点击    2025-03-22 12:03
CVPR 2025|复旦&微软开源StableAnimator: 首个端到端ID一致性人类视频生成,Github Star破千

CVPR 2025|复旦&微软开源StableAnimator: 首个端到端ID一致性人类视频生成,Github Star破千

CVPR 2025|复旦&微软开源StableAnimator: 首个端到端ID一致性人类视频生成,Github Star破千

近年来,扩散模型在图像与视频合成领域展现出强大能力,为图像动画技术的发展带来了新的契机。特别是在人物图像动画方面,该技术能够基于一系列预设姿态驱动参考图像,使其动态化,从而生成高度可控的人体动画视频。

来自主题: AI技术研报
7948 点击    2025-03-20 09:34
长文本向量模型在4K Tokens 之外形同盲区?

长文本向量模型在4K Tokens 之外形同盲区?

长文本向量模型在4K Tokens 之外形同盲区?

2025 年 2 月发布的 NoLiMA 是一种大语言模型(LLM)长文本理解能力评估方法。不同于传统“大海捞针”(Needle-in-a-Haystack, NIAH)测试依赖关键词匹配的做法,它最大的特点是 通过精心设计问题和关键信息,迫使模型进行深层语义理解和推理,才能从长文本中找到答案。

来自主题: AI技术研报
3661 点击    2025-03-12 15:08