
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员继去年初的第一代VALL-E模型之后,微软最近又上新了VALL-E 2模型,标志着第一个在合成语音稳健性、相似度、自然程度等方面达到人类水平的文本到语音模型。
继去年初的第一代VALL-E模型之后,微软最近又上新了VALL-E 2模型,标志着第一个在合成语音稳健性、相似度、自然程度等方面达到人类水平的文本到语音模型。
ICML 2024时间检验奖出炉,贾扬清共同一作论文获奖!
传统天气预测、气候模拟,正被 AI 颠覆
基于评测维度,考虑到各评测集关注的评测维度,可以将其划分为通用评测基准和具体评测基准。
谷歌提出了一种新的基于ML的大气环流模型NeuralGCM,比传统的基于物理的模型节省了几个数量级的计算量,计算成本降低了10万倍,相当于高性能计算领域25年的进步速度。对于2-15天的天气预报,这种方法比SOTA物理模型还要准确。
自从2007年MEMS(微机电系统,Micro-Electro-Mechanical System)麦克风和加速度传感器做到iPhone内,这个低调的工业品开始逐渐被人所熟知,成就了苹果、华为、三星、小米、OPPO等各种消费电子品牌。
Scaling Law还没走到尽头,「小模型」逐渐成为科技巨头们的追赶趋势。Meta最近发布的MobileLLM系列,规模甚至降低到了1B以下,两个版本分别只有125M和350M参数,但却实现了比更大规模模型更优的性能。
巴黎奥运会期间,谷歌将首次携NBCUniversal,利用Gemini让AI技术走进赛场,为观众带来前所未有的观赛体验。
多模态大模型(Multimodal Large Language Models,MLLMs)在不同的任务中表现出了令人印象深刻的能力,尽管如此,这些模型在检测任务中的潜力仍被低估。
具身智能狂潮降临的一年多里,物理世界与信息的生产与交互方式发生着革命性变化。