
跟GPT4o、o1拜拜,Gemini2.0取代了我的AI应用们
跟GPT4o、o1拜拜,Gemini2.0取代了我的AI应用们上线一周, gemini-2.0-flash-exp、gemini-2.0-flash-thinking-exp 已经成为了我日常对话频率最高的模型之一。
上线一周, gemini-2.0-flash-exp、gemini-2.0-flash-thinking-exp 已经成为了我日常对话频率最高的模型之一。
Orr Zohar的指导老师Serena Yeung-Levy教授于2018年获得斯坦福大学博士学位,师从李飞飞和Arnold Milstein。2017年至2019年期间,Serena Yeung-Levy曾与Justin Johnson和李飞飞共同教授斯坦福大学卷积神经网络课程。
2023年6月,理想汽车推出了自研认知大模型“Mind GPT”,它以“理想同学”App的形式出现在理想汽车的车机中,支持通过自然语言交流、发送指令。2024年,Mind GPT升级到3.0,带来了行业领先的自然语言任务执行功能。
一个全新的模型能力衡量指标诞生了?!
最好的办法就是一开始就保持绝对的真实和坦诚,营造一种真诚和透明的氛围。如果在这种过程中发现不合适,那其实是好事,因为比起在后期出现问题,早期发现不合适要好得多。
数字生命一直是人类几十年来的追求,反映了我们对技术与人类体验交汇的深层探索。近期,复旦大学发表了一篇综述论文,首次系统梳理了角色扮演AI(Role-Playing Language Agents,RPLAs)的研究现状,现已被机器学习顶级期刊TMLR接收。
近年来,视觉-语言-动作模型(Vision-Language-Action, VLA)在诸多机器人任务上取得了显著的进展,但它们仍面临一些关键问题,例如由于仅依赖从成功的执行轨迹中进行行为克隆,导致对新任务的泛化能力较差。
CPU+GPU,模型KV缓存压力被缓解了。 来自CMU、华盛顿大学、Meta AI的研究人员提出MagicPIG,通过在CPU上使用LSH(局部敏感哈希)采样技术,有效克服了GPU内存容量限制的问题。
控制无人机执行敏捷、高机动性的行为是一项颇具挑战的任务。传统的控制方法,比如 PID 控制器和模型预测控制(MPC),在灵活性和效果上往往有所局限。而近年来,强化学习(RL)在机器人控制领域展现出了巨大的潜力。通过直接将观测映射为动作,强化学习能够减少对系统动力学模型的依赖。
视频生成模型卷得热火朝天,配套的视频评价标准自然也不能落后。 现在,北京大学MMCAL团队开发了首个用于视频编辑质量评估的新指标——VE-Bench,相关代码与预训练权重均已开源。
2025 新年将至。对于新的一年和未来几年,你对 AI 领域有什么期待和设想呢?你是否认为 AGI 将要实现了而人类社会的一切都将因之而改变。
DeepSeek新版模型正式发布,技术大佬们都转疯了! 延续便宜大碗特点的基础之上,DeepSeek V3发布即完全开源,直接用了53页论文把训练细节和盘托出的那种。
刚刚,OpenAI宣布了三件事:1、选择一个非营利/营利结构,最有利于使命的长期成功。2、使非营利组织可持续发展。3、使每个部分都能发挥作用。
17日众议院议长约翰逊提交避免行政部门停摆的3800亿美元紧急预算,一千五百页的文件只给议员留了17小时审查时间,按以往经验谁也看不完最后会顺利通过。但这次马斯克的DOGE部门启用AI(Gork)总结文档摘要,查出被塞进去的私货,包括给议员加薪40%、给议员增加健康保险等条款。
AI初创团队狸谱,过去半年间,他们接连推出两款新奇的AI小游戏,在二次元圈和AI圈颇受关注。我们联系到狸谱产品增长负责人Levi,聊了聊AI赛道“一波流”产品的魅力,以及他们打造这些破圈小游戏背后的产品增长经验。
加州大学洛杉矶分校计划在2025年学校的一门比较文学课程将由AI来生成教科书、作业和提供一个随时可以探讨问题的助教。得益于人工智能,2025 年的这门课程格式和材料将呈现出全新的面貌。
在和 AI 没什么关系的东南亚,菲律宾和 AI 正在发生化学反应。
在 AI 生成的这些视频中,你能判断出哪个是 Sora 生成的吗?
今天想跟大家聊一个科技圈和生物医学圈都值得关注的“炸裂”事件。一位顶尖的免疫学专家,Derya Unutmaz博士,刚刚分享了一段让他“震撼到情绪激动”的经历:他把自己和学生撰写的关于MAIT细胞的综述文章,交给o1-Pro进行评估,结果AI给出的评论和洞察碾压了他
OpenAI 前段时间做了 12 天的持续发布,赛博禅心进行了全程追踪:《o3详解,与 12 天发布汇总》
这就是 Google DeepMind 的「DeepMind 部分」——重视它,是保护它的第一步。
AGI的定义,微软和OpenAI早就悄悄谋定了。 主要评判维度不看技术,而是收益。 The Information爆料,2023年双方达成秘密协定——OpenAI需要研发出能够带来1000亿美元收益的AI系统,才能被视为实现AGI。
现在是夜里1点,我准备了一些素材,正打开可灵,想跑一些关于AI拥抱的视频。 然后,发现给我弹了个窗,悄悄的,在深夜,可灵AI里面生图的模型-可图,更新了。
“人类将在2029年实现AGI。” 这是2006年,雷·库兹韦尔(Ray Kurzweil)在波士顿人工智能大会上发出的惊人之语。
我超级喜欢构建一个框架和模式来分析未来各种可能性的思维方式。
OpenAI举报人死去一个月,死者家属终于等到了OpenAI的官方回应,网友们直接看怒了!而死者母亲的采访中透露出更多惊人的关键信息:Balaji死前的一两天,还在外出度假,和朋友们欢庆自己的26岁生日,没有财务压力的他还立志要做医疗AI公益。
据不完全统计,已有24家券商积极拥抱AI大模型,在投研、投顾、风控、运营等多个领域展开了深入探索和应用。
在今天的文章开始前,小雷想问大家一个问题:你的手机上,用的是什么输入法? 小雷问了问身边人,回答无非是:搜狗、讯飞、百度和近些年异军突起的微信输入法,大部分人到手都会安装自己顺手的输入法,其中只有极少人会长期使用自带输入法。
12月10日Sora全网上线,大家也都测试了很多了。坦率地讲,产品完成度很高,但是模型质量,真的有点不及预期。
在 2024 年底,探索通用人工智能(AGI)本质的 DeepSeek AI 公司开源了最新的混合专家(MoE)语言模型 DeepSeek-V3-Base。虽然,目前没有放出详细的模型卡,但官方开源了V3的技术文档PDF。