AI音效90秒长时可控生成!“狼嚎2秒,蟋蟀鸣8秒”精准搞定!清华&生数科技新研究入选ACM MM 2025
AI音效90秒长时可控生成!“狼嚎2秒,蟋蟀鸣8秒”精准搞定!清华&生数科技新研究入选ACM MM 2025文生音频系统最新突破,实现精确时间控制与90秒长时音频生成!
文生音频系统最新突破,实现精确时间控制与90秒长时音频生成!
7 月 22 日,华盛顿 DC。 美联储举办的“大型银行资本框架综合评估”年会,本是监管部门闭门核算风险权重的场合,却因为一位科技掌门人的一句话突然炸锅:
GTA 工作由中国科学院自动化研究所、伦敦大学学院及香港科技大学(广州)联合研发,提出了一种高效的大模型框架,显著提升模型性能与计算效率。
据海外科技媒体《The Information》报道,OpenAI 正在开发一项重要功能——让 ChatGPT 原生支持并编辑 Excel 和 PowerPoint 文件。这意味着,用户未来可以直接在 ChatGPT 中创建或者打开 .xlsx 和 .pptx 文件,并在 AI 的协助下进行公式输入、图表分析、幻灯片排版等操作,无需依赖传统 Office 软件。
在过去很长一段时间里,科技圈似乎人均都成了“提示词工程师”,大家都在琢磨怎么用最精妙的语言驯服AI。但包括Andrej Karpathy在内的很多行业大佬已经开始反思了,他们认为,决定AI效果的关键,可能早就不是怎么问,而是你给AI喂了什么料。这个思路,就是最近越来越火的上下文工程(Context Engineering)。
目前,由人工智能(AI)驱动的科技浪潮仍在席卷全球,并继续成为跨行业和地区市场的核心议题。
一早,小扎「梦之队」44人明星阵容曝光。这份绝密名单中,完整披露了Meta超级智能实验室团队的「配置」,被硅谷科技圈疯转。值得一提的是,50%研究员来自中国。
作为一个 AI 科技媒体编辑,AI 已经成为我的第一生产力。总结、翻译、查资料、做 PPT,一堆 AI 牛马任我差遣。
稚晖君之后,王兴兴也来到了资本市场门口。创业九年,宇树科技终于走到IPO门前。这次不再是传闻。
MiniMax 在 7 月 10 日面向全球举办了 M1 技术研讨会,邀请了来自香港科技大学、滑铁卢大学、Anthropic、Hugging Face、SGLang、vLLM、RL领域的研究者及业界嘉宾,就模型架构创新、RL训练、长上下文应用等领域进行了深入的探讨。