AI资讯新闻榜单内容搜索-模型

「开源版GPT-4o」来了！17B国产模型iDream-I1生图效果比肩4o，还可商用

前段时间，GPT-4o 火出了圈，其断崖式提升的生图、改图能力让每个人都想尝试一下。虽然 OpenAI 后来宣布免费用户也可以用，但出图慢、次数受限仍然困扰着没有订阅 ChatGPT 的普通人。

来自主题: AI技术研报

11608 点击 2025-04-15 16:04

「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！

智能语音交互领域，学术研究也能如此酷炫。全球首个纯学术界自研的支持多人实时口语对话的语音情感大模型 ——“交交”，正式推出！

来自主题: AI技术研报

9209 点击 2025-04-15 15:27

AI涌现人类情感！希腊「乐之神」Orpheus开源，单卡可跑语音流式推理

开源语音模型Orpheus让LLM涌现出人类情感！在A100 40GB显卡上，30亿参数模型的流式推理速度甚至超过了音频播放速度。甚至可以zero-shot克隆声音。

来自主题: AI技术研报

8020 点击 2025-04-15 15:26

字节视频基础大模型发布！单GPU就可生成1080P，蒋路领衔Seed视频团队曝光

字节Seed团队视频生成基础模型，来了。

来自主题: AI资讯

7950 点击 2025-04-15 15:17

英伟达含量为零！华为密集模型性能比肩DeepSeek-R1，纯昇腾集群训练

密集模型的推理能力也能和DeepSeek-R1掰手腕了？

来自主题: AI资讯

7443 点击 2025-04-15 15:05

超越ControlNet！复旦联合腾讯优图提出AI生图新框架，解决多条件生成难题

文生图新架构来了！

来自主题: AI技术研报

8377 点击 2025-04-15 15:04

AI能看懂图像却算不好距离，上交时间-空间智能基准难倒9大顶尖多模态模型

多模态大语言模型（MLLM）在具身智能和自动驾驶“端到端”方案中的应用日益增多，但它们真的准备好理解复杂的物理世界了吗？

来自主题: AI技术研报

9494 点击 2025-04-15 14:56

移动GUI智能体迈向实用化！全新验证器架构V-Droid，刷新成功率纪录

移动GUI自动化智能体V-Droid采用「验证器驱动」架构，通过离散化动作空间并利用LLM评估候选动作，实现了高效决策。在AndroidWorld等多个基准测试中任务成功率分别达到59.5%、38.3%和49%，决策延迟仅0.7秒，接近实时响应。

来自主题: AI技术研报

7440 点击 2025-04-15 14:53

免费用！阿里通义大模型上新，超逼真音视频生成SOTA！

近日，阿里通义实验室推出了全新数字人视频生成大模型 OmniTalker，只需上传一段参考视频，不仅能学会视频中人物的表情和声音，还能模仿说话风格。相比传统的数字人生产流程，该方法能够有效降低制作成本，提高生成内容的真实感和互动体验，满足更广泛的应用需求。目前该项目已在魔搭社区、HuggingFace 开放体验入口，并提供了十多个模板，所有人可以直接免费使用。

来自主题: AI技术研报

8671 点击 2025-04-15 14:37

Nature计算科学最新：统计物理x机器学习用于求解组合优化问题

组合优化问题（COPs）在科学和工业领域无处不在，从物流调度到芯片设计，从社交网络分析到人工智能算法，其高效求解一直是研究热点。

来自主题: AI技术研报

7344 点击 2025-04-15 14:35