微软开源Markdown工具爆了:支持Office文档,可接多模态LLM直出报告
微软开源Markdown工具爆了:支持Office文档,可接多模态LLM直出报告AI编程蓝皮书火了,发布3天,阅读量超过3万!
搜索
AI编程蓝皮书火了,发布3天,阅读量超过3万!
AI编程蓝皮书火了,发布3天,阅读量超过3万!
o1背后的推理原理,斯坦福和伯克利帮我们总结好了!
2025年AI半导体需求旺盛,EV需求低迷。
继视频、文本模型家族在新年迎来新成员后,MiniMax带来了全新升级的T2A-01系列语音模型,并全球同步上线海螺语音产品。与传统语音生成技术相比,全新升级的T2A-01系列语音模型不仅具有音质稳定清晰、韵律自然、情绪精准表达、高准确度等特点。
2024年,是AI硬件落地的“大年”。
能说会看,还响应快、记性好、算得准——如此完美的AI,ta来了!商汤科技日日新融合大模型交互版(SenseNova-5o),今天正式对外提供实时音视频对话服务,限时免费使用。它是商汤“日日新”融合大模型的交互版本,拥有强大的实时交互、视觉识别、记忆思考、持续对话和复杂推理等能力,能帮助AI与人类更自然、更流畅地交流,让每次互动更加智能与贴心,帮助用户全面提升生活与工作体验。
意图识别及其在智能设计中的应用
Character AI, 一家允许用户与不同的人工智能角色聊天的初创公司,目前正在其桌面和移动网页应用上测试游戏,以提高平台的参与度。
本期,我们邀请到了灵巧手公司 Dexmate 的创始人陈涛和秦誉哲。两位分别在上海交通大学、麻省理工学院(MIT)、卡内基梅隆大学(CMU)和加州大学圣地亚哥分校(UCSD)等知名院校的顶尖实验室积累了丰富的研究经验。这些经历不仅为他们提供了扎实的技术基础,也让他们对产业需求有了深入的理解。
据 TechCrunch 报道,Read.cv,一个与 LinkedIn 竞争的专业社交媒体平台,已被人工智能驱动的搜索引擎Perplexity收购。
能帮你干活的智能体,或许才是大家最希望看到的AI产品。
我一直相信一件事:凡事都是可以自学的。
名称:认知边界拓宽器 Cognition Boundary Expander
最近黄叔看到一张图特别震惊:
2025年1月17日,国家超级计算机成都中心迎来了一场科技盛宴——全球首个亿级参数量地震波大模型“谛听”正式发布。这一里程碑式的成果,不仅标志着我国在地震学研究领域迈出了重要一步,更以其卓越的性能和广阔的应用前景,引发了全球科学界的广泛关注。
在当今AI技术迅猛发展的背景下,大语言模型(LLM)的评估问题已成为一个不可忽视的挑战。传统的做法是直接采用最强大的模型(如GPT-4)进行评估,这就像让最高法院的大法官直接处理所有交通违章案件一样,既不经济也不一定总能保证公正。
想要了解最新的ChatGPT统计数据吗?已经为你准备好了。ChatGPT堪称近代历史上最具颠覆性的应用程序之一。自OpenAI推出后,它便在各行各业掀起了巨浪,开启了生成式AI的新纪元。
前面一篇文章从供给侧的视角谈人工智能企业的发展方向,今天这篇主要从使用者的角度,谈一谈在AI时代我们要做什么准备。
经济学研究指出,依赖出售石油等自然资源获得收入而非公民税收的国家,会受到资源诅咒的影响,结果是权贵们攫取了大量财富,却停止了对普通人的投资。当 AGI 实现后,人类是否会面临类似的“智能诅咒”?
大家好,我是AI产品黄叔,目前给两家大厂做AI产品顾问,在使用Cursor和Windsurf(这两个都是AI编程的软件)开发产品后,意识到这才是创造者的天堂,最近举办了三场线下AI编程培训,根据学员的反馈有了这份手册,我会在本手册里持续更新,不断把更多的技巧,思考分享出来,希望能够帮助想要创造的你走进这个天堂!如果你觉得有帮助,欢迎把文末的图片分享给你的朋友:
AI与新材料的跨界融合正迎来黄金机遇期!北京市发布重磅行动计划,全面布局"人工智能+新材料"创新发展,力争打造国际领先的创新高地,引领材料科技变革新浪潮。
AI没有让人人成为导演,但它让想成为导演的人有了造梦的工具。围绕AI视频生成这门新技术,新的影像实验和探索正在发生。一个标志性的变化是,有“AI奥斯卡”之称的Runway人工智能电影节(AIFF)2024年参赛作品数量从300增至3000,实现了10倍增长。
用AI代理技术革新医疗行业。据联合国数据,全球65岁及以上人口将从2020年的7.27亿增至2030年的10亿,占总人口比例从9.3%升至12%。这一人口结构变化使医疗需求大增,也加剧了医疗行业人力资源短缺。预计到2025年,美国注册护士短缺或达45万人,国内全科医生空缺预计达100万。
DeepSeek版o1,有消息了。还未正式发布,已在代码基准测试LiveCodeBench霸榜前三,表现与OpenAI o1的中档推理设置相当。注意了,这不是在DeepSeek官方App已经能试玩的DeepSeek-R1-Lite-Preview(轻量预览版)。
本期《智者访谈》邀请到著名开源语音识别项目 Kaldi 的创始人、小米集团语音首席科学家 Daniel Povey 博士。作为推动全球智能语音处理产业化的关键人物,他见证了语音识别技术从实验室走向大规模应用的全过程。十多年前,他在微软研究院的实习生,如今已成为 Google Gemini 等标志性项目的负责人。
Ben Hylak从最初对o1不满到逐渐掌握使用技巧,成功将其转化为解决重要问题的得力工具。本文探讨了如何正确使用o1,解锁其强大的报告生成和推理分析能力。
【新智元导读】逆龄AI真的被OpenAI实现了!新模型GPT-4b micro通过蛋白质重编程技术,有望将人类寿命延长十年。
近年来,视觉大模型(Large Vision Language Models, LVLMs)领域经历了迅猛的发展,这些模型在图像理解、视觉对话以及其他跨模态任务中展现出了卓越的能力。然而,随着 LVLMs 复杂性和能力的增长,「幻觉现象」的挑战也日益凸显。
家人们,本来咱们想写一篇 TikTok 退出历史舞台的文章,结果小鹿看到: