面壁发布 MiniCPM-o 2.6:音视听三合一的“她”(SHE),不需要联网
面壁发布 MiniCPM-o 2.6:音视听三合一的“她”(SHE),不需要联网不知道还有多少人记得那场发布会。
不知道还有多少人记得那场发布会。
AI编程蓝皮书火了,发布3天,阅读量超过3万!
AI编程蓝皮书火了,发布3天,阅读量超过3万!
o1背后的推理原理,斯坦福和伯克利帮我们总结好了!
2025年AI半导体需求旺盛,EV需求低迷。
继视频、文本模型家族在新年迎来新成员后,MiniMax带来了全新升级的T2A-01系列语音模型,并全球同步上线海螺语音产品。与传统语音生成技术相比,全新升级的T2A-01系列语音模型不仅具有音质稳定清晰、韵律自然、情绪精准表达、高准确度等特点。
2024年,是AI硬件落地的“大年”。
能说会看,还响应快、记性好、算得准——如此完美的AI,ta来了!商汤科技日日新融合大模型交互版(SenseNova-5o),今天正式对外提供实时音视频对话服务,限时免费使用。它是商汤“日日新”融合大模型的交互版本,拥有强大的实时交互、视觉识别、记忆思考、持续对话和复杂推理等能力,能帮助AI与人类更自然、更流畅地交流,让每次互动更加智能与贴心,帮助用户全面提升生活与工作体验。
意图识别及其在智能设计中的应用
Character AI, 一家允许用户与不同的人工智能角色聊天的初创公司,目前正在其桌面和移动网页应用上测试游戏,以提高平台的参与度。
本期,我们邀请到了灵巧手公司 Dexmate 的创始人陈涛和秦誉哲。两位分别在上海交通大学、麻省理工学院(MIT)、卡内基梅隆大学(CMU)和加州大学圣地亚哥分校(UCSD)等知名院校的顶尖实验室积累了丰富的研究经验。这些经历不仅为他们提供了扎实的技术基础,也让他们对产业需求有了深入的理解。
据 TechCrunch 报道,Read.cv,一个与 LinkedIn 竞争的专业社交媒体平台,已被人工智能驱动的搜索引擎Perplexity收购。
能帮你干活的智能体,或许才是大家最希望看到的AI产品。
我一直相信一件事:凡事都是可以自学的。
最近黄叔看到一张图特别震惊:
2025年1月17日,国家超级计算机成都中心迎来了一场科技盛宴——全球首个亿级参数量地震波大模型“谛听”正式发布。这一里程碑式的成果,不仅标志着我国在地震学研究领域迈出了重要一步,更以其卓越的性能和广阔的应用前景,引发了全球科学界的广泛关注。
想要了解最新的ChatGPT统计数据吗?已经为你准备好了。ChatGPT堪称近代历史上最具颠覆性的应用程序之一。自OpenAI推出后,它便在各行各业掀起了巨浪,开启了生成式AI的新纪元。
前面一篇文章从供给侧的视角谈人工智能企业的发展方向,今天这篇主要从使用者的角度,谈一谈在AI时代我们要做什么准备。
经济学研究指出,依赖出售石油等自然资源获得收入而非公民税收的国家,会受到资源诅咒的影响,结果是权贵们攫取了大量财富,却停止了对普通人的投资。当 AGI 实现后,人类是否会面临类似的“智能诅咒”?
AI没有让人人成为导演,但它让想成为导演的人有了造梦的工具。围绕AI视频生成这门新技术,新的影像实验和探索正在发生。一个标志性的变化是,有“AI奥斯卡”之称的Runway人工智能电影节(AIFF)2024年参赛作品数量从300增至3000,实现了10倍增长。
用AI代理技术革新医疗行业。据联合国数据,全球65岁及以上人口将从2020年的7.27亿增至2030年的10亿,占总人口比例从9.3%升至12%。这一人口结构变化使医疗需求大增,也加剧了医疗行业人力资源短缺。预计到2025年,美国注册护士短缺或达45万人,国内全科医生空缺预计达100万。
DeepSeek版o1,有消息了。还未正式发布,已在代码基准测试LiveCodeBench霸榜前三,表现与OpenAI o1的中档推理设置相当。注意了,这不是在DeepSeek官方App已经能试玩的DeepSeek-R1-Lite-Preview(轻量预览版)。
本期《智者访谈》邀请到著名开源语音识别项目 Kaldi 的创始人、小米集团语音首席科学家 Daniel Povey 博士。作为推动全球智能语音处理产业化的关键人物,他见证了语音识别技术从实验室走向大规模应用的全过程。十多年前,他在微软研究院的实习生,如今已成为 Google Gemini 等标志性项目的负责人。
Ben Hylak从最初对o1不满到逐渐掌握使用技巧,成功将其转化为解决重要问题的得力工具。本文探讨了如何正确使用o1,解锁其强大的报告生成和推理分析能力。
【新智元导读】逆龄AI真的被OpenAI实现了!新模型GPT-4b micro通过蛋白质重编程技术,有望将人类寿命延长十年。
家人们,本来咱们想写一篇 TikTok 退出历史舞台的文章,结果小鹿看到:
在 24 年 4 月,我们第一次得知了 Flowith 这个产品,随后便被它创新的交互模式与独特的 AI 生成工作流的 Oracle Agent 所吸引。创始人 Derek 在社交媒体上的帖子也非常振奋人心。与特工们气味相投,有种理想主义的极客风格。
RPA虽然能完成任务的80%,但在20%的失败情况中,仍然需要人工介入;下一代的RPA将由AI Agent来完成,而不是依赖传统的RPA。
据外电报道,就在谷歌与美联社签署协议的第二天,Mistral 还宣布与法新社 (AFP) 达成内容协议,以提高Mistral 聊天机器人产品Le Chat的答案的准确性。对于这家总部位于巴黎的人工智能公司来说,这是第一笔此类交易。这表明 Mistral 不想被视为仅仅一家基础模型制造商。
2024又是AI精彩纷呈的一年。LLM不再是AI舞台上唯一的主角。随着预训练技术遭遇瓶颈,GPT-5迟迟未能问世,从业者开始从不同角度寻找突破。以o1为标志,大模型正式迈入“Post-Training”时代;开源发展迅猛,Llama 3.1首次击败闭源模型;中国本土大模型DeepSeek V3,在GPT-4o发布仅7个月后,用 1/10算力实现了几乎同等水平。