AI资讯新闻榜单内容搜索-

「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！

智能语音交互领域，学术研究也能如此酷炫。全球首个纯学术界自研的支持多人实时口语对话的语音情感大模型 ——“交交”，正式推出！

来自主题: AI技术研报

9183 点击 2025-04-15 15:27

AI涌现人类情感！希腊「乐之神」Orpheus开源，单卡可跑语音流式推理

开源语音模型Orpheus让LLM涌现出人类情感！在A100 40GB显卡上，30亿参数模型的流式推理速度甚至超过了音频播放速度。甚至可以zero-shot克隆声音。

来自主题: AI技术研报

7992 点击 2025-04-15 15:26

字节视频基础大模型发布！单GPU就可生成1080P，蒋路领衔Seed视频团队曝光

字节Seed团队视频生成基础模型，来了。

来自主题: AI资讯

7929 点击 2025-04-15 15:17

英伟达含量为零！华为密集模型性能比肩DeepSeek-R1，纯昇腾集群训练

密集模型的推理能力也能和DeepSeek-R1掰手腕了？

来自主题: AI资讯

7425 点击 2025-04-15 15:05

超越ControlNet！复旦联合腾讯优图提出AI生图新框架，解决多条件生成难题

文生图新架构来了！

来自主题: AI技术研报

8346 点击 2025-04-15 15:04

AI能看懂图像却算不好距离，上交时间-空间智能基准难倒9大顶尖多模态模型

多模态大语言模型（MLLM）在具身智能和自动驾驶“端到端”方案中的应用日益增多，但它们真的准备好理解复杂的物理世界了吗？

来自主题: AI技术研报

9467 点击 2025-04-15 14:56

移动GUI智能体迈向实用化！全新验证器架构V-Droid，刷新成功率纪录

移动GUI自动化智能体V-Droid采用「验证器驱动」架构，通过离散化动作空间并利用LLM评估候选动作，实现了高效决策。在AndroidWorld等多个基准测试中任务成功率分别达到59.5%、38.3%和49%，决策延迟仅0.7秒，接近实时响应。

来自主题: AI技术研报

7412 点击 2025-04-15 14:53

速递｜Gemini再添教育场景新技能，谷歌课堂AI试题生成器上线

Google Classroom 推出了一项新的人工智能驱动功能，旨在帮助教师生成测验题目的 AI 功能。该工具于周一上线，允许教育工作者基于特定文本输入创建一系列问题。

来自主题: AI资讯

10223 点击 2025-04-15 14:47

独家｜AI员工主导PH产品发布，00后团队如何14天内斩获近百万美金订单？

我们中的许多人已经在 Product Hunt 上发布了一段时间，越来越多的人开始质疑那里的受众是否真实，toB的产品是否仍然值得在他们的平台上发布。

来自主题: AI资讯

9111 点击 2025-04-15 14:44

免费用！阿里通义大模型上新，超逼真音视频生成SOTA！

近日，阿里通义实验室推出了全新数字人视频生成大模型 OmniTalker，只需上传一段参考视频，不仅能学会视频中人物的表情和声音，还能模仿说话风格。相比传统的数字人生产流程，该方法能够有效降低制作成本，提高生成内容的真实感和互动体验，满足更广泛的应用需求。目前该项目已在魔搭社区、HuggingFace 开放体验入口，并提供了十多个模板，所有人可以直接免费使用。

来自主题: AI技术研报

8636 点击 2025-04-15 14:37

AI资讯新闻榜单内容搜索-

「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！

AI涌现人类情感！希腊「乐之神」Orpheus开源，单卡可跑语音流式推理

字节视频基础大模型发布！单GPU就可生成1080P，蒋路领衔Seed视频团队曝光

英伟达含量为零！华为密集模型性能比肩DeepSeek-R1，纯昇腾集群训练

超越ControlNet！复旦联合腾讯优图提出AI生图新框架，解决多条件生成难题

AI能看懂图像却算不好距离，上交时间-空间智能基准难倒9大顶尖多模态模型

移动GUI智能体迈向实用化！全新验证器架构V-Droid，刷新成功率纪录

速递｜​Gemini再添教育场景新技能，谷歌课堂AI试题生成器上线

独家｜AI员工主导PH产品发布，00后团队如何14天内斩获近百万美金订单？

免费用！阿里通义大模型上新，超逼真音视频生成SOTA！

速递｜Gemini再添教育场景新技能，谷歌课堂AI试题生成器上线