
大规模、动态「语音增强/分离」新基准!清华发布移动音源仿真平台SonicSim,含950+小时训练数据
大规模、动态「语音增强/分离」新基准!清华发布移动音源仿真平台SonicSim,含950+小时训练数据清华大学推出的SonicSim平台和SonicSet数据集针对动态声源的语音处理研究提供了强有力的工具和数据支持,有效降低了数据采集成本,实验证明这些工具能有效提升模型在真实环境中的性能。
清华大学推出的SonicSim平台和SonicSet数据集针对动态声源的语音处理研究提供了强有力的工具和数据支持,有效降低了数据采集成本,实验证明这些工具能有效提升模型在真实环境中的性能。
一文揭秘全球最大AI超算,解析液冷机架和网络系统的创新设计。这台全球最大AI超算Colossus由xAI和英伟达联手建造,耗资数十亿,10万块H100仅半个多月搭建完成,未来规模还将扩大一倍!
OpenAI伦敦开发者日上,首次曝出了o1五大核心能力,还有图像理解。o1两分钟构建应用驾驶无人机、电话订餐、讲解太阳系,现场演示让所有开发者沸腾。
一周Mac三连发,压轴场MacBook Pro终于来了,也宣告着M4全系芯片诞生。最强性能野兽M4 Pro、M4 Max采用第二代3nm工艺,快到起飞续航长达24小时。
三个月前,「LiblibAI 哩布哩布 AI」,一个 AI 模型社区型产品,在一年内完成了三轮共计数亿元的融资。
Arcade 的口号是“将你的想法变为实物”,允许任何人通过几个单词或一张图片,立即创建可用于娱乐、分享、购买或销售的定价实体产品。
今年8月,ChatGPT月活跃度达到2亿,推特方面为5亿,微信则是13亿。
据 TechCrunch 报道,Sierra 由 OpenAI 主席布雷特·泰勒共同创办的人工智能初创公司,在一轮融资中筹集了 1.75 亿美元,估值为 45 亿美元。
今年早些时候,金融软件初创公司 Runway 的高管们想到了一个可以提升销售的主意。
HeyGen是一个帮助人们创建、本地化和个性化视频的AI平台。解决问题的关键在于提升AI的质量,让视频与实际内容更加匹配、更加引人入胜、更能传递信息。
通过深入分析这些 GPU 的性能指标,我们将探讨它们在模型训练和推理任务中的适用场景,以帮助用户在选择适合的 GPU 时做出明智的决策。同时,我们还会给出一些实际有哪些知名的公司或项目在使用这几款 GPU。
大家好!非常荣幸和大家分享一些我对未来社会中人机协作的想法。
前段时间Claude3.5不是更新了嘛,据说各个性能都上升了不少,其中我发现文本撰写能力更是直接上升了20%多。
通过自己照片训练一个自己专属的FLUX模型,利用好FLUX的超强生图能力,从此想生成啥生成啥,实现写真自由
最近,总是收到朋友的询问:有没有 AI 能自动生成 PPT?发现这是大家非常普遍的一个需求。但是似乎目前没有一个特别完美的工具,能一键生成高质量的可用 PPT。
文章详细讨论了如何确保大型语言模型(LLMs)输出结构化的JSON格式,这对于提高数据处理的自动化程度和系统的互操作性至关重要。
前几天在对战平台Artificial Analysis出现了一个神秘的文生图模型"red_panda",而且排行位列第一,超过之前火爆的Flux 1.1 [pro]模型。
如今,人们选择餐厅,多半会打开app搜索一番,再看看排名。然而美国奥斯汀的一家餐厅Ethos的存在证实这种选择机制多么不可靠。Ethos在社交媒体instagram宣称是当地排名第一的餐厅,拥有7万余粉丝。
当代社恐青年的社交解药:跟AI唠嗑上瘾
在当前大语言模型(LLM)蓬勃发展的环境下,Prompt工程师们面临着一个两难困境:要么使用像LangChain这样功能强大但学习曲线陡峭的框架,要么选择自动化程度更高DSPy但牺牲了对提示词精确控制的工具。IBM研究院和UC Davis大学最近推出的PDL(Prompt Declaration Language,提示词声明语言)或许打破了这个困境,让AI开发者能真正拿回Prompt的控制权。
GPT-4o 的语音演示,引燃了行业对于 AI 产品语音实时交互的想象,完全实时、可随时打断的 AI 助手,正成为新的 趋势。
最近有一篇题为《2美元的H100:GPU泡沫是如何破灭的?》的文章异常火热,甚至投资人都认为英伟达坚挺的股价就是被这一篇文章所摧毁。
智东西10月30日消息 ,据《华尔街日报》报道,据知情人士透露,大模型独角兽xAI正寻求筹集数十亿美元的资金,若谈判顺利,这家由特斯拉CEO埃隆·马斯克创立的AI初创公司估值有望突破400亿美元(约合人民币2880亿元),直逼3000亿元人民币大关。
10月29日,全球投资界备受关注的会议——第8届未来投资倡议(FII)峰会在沙特阿拉伯利雅得开幕。
2024年秋招,已临近收尾。 近年来,高校毕业生的数量呈现逐年增长的势态,预计2025年应届生高达1186万人,再刷历史新高。
本期我们邀请到了智能健康戒指RingConn 的联合创始人兼CEO 吴昊。
学术界对广泛监管的主要论点是,政府不应在技术层面上对人工智能或其他技术进行如此严格的监管。
据路透社消息,OpenAI的首款自主研发AI芯片将于2026年亮相。此芯片由博通(Broadcom)负责设计,台积电(TSMC)进行代工,表明OpenAI开始深入硬件领域。该举措旨在通过定制推理芯片,降低运营成本、优化AI推理环节的效率,同时提高芯片供应链的灵活性和安全性。
有了 TEN(Transformative Extensions Network,变革性扩展网络),开发者们终于不用再「绞尽脑汁」了!TEN 是全球首个真正实现实时多模态智能体的框架,不仅能减少开发痛点,还让你轻松从头开始构建下一代 AI 应用。
这两天Github上有一个项目火了。可用于生产环境GraphRAG的开源UI项目kotaemon,更新不到两天后已经有6.6KStar,昨日新增1.3KStar已位居Github Trending榜首。周末抽空部署了一下,还挺简单,推荐给大家。