
不会代码的独立开发者,除了学Cursor,还该会些什么?|十问爆款「小猫补光灯」
不会代码的独立开发者,除了学Cursor,还该会些什么?|十问爆款「小猫补光灯」“十多年前有本书叫《人人都是产品经理》,但现在可能才真正到了「人人都是产品经理」的时刻。” 苹果商店付费榜Top1,这是一个不会代码的独立开发者用Cursor开发App的最佳战绩。
“十多年前有本书叫《人人都是产品经理》,但现在可能才真正到了「人人都是产品经理」的时刻。” 苹果商店付费榜Top1,这是一个不会代码的独立开发者用Cursor开发App的最佳战绩。
今年,生成式 AI 的炒作消息层出不穷,显然应用开发人员也一直在关注这波潮流。以 AI 为卖点的工具几乎在苹果的 App Store 排行榜上占据了每个类别的榜首,包揽了教育、生产力和照片编辑领域的前 10 名。免费图形和设计应用类别中的机遇尤其多,这个类别中充斥着 AI 内容创建工具。
近段时间,世界模型的相关研究成果正如雨后春笋版不断涌现,光是我们报道过的就已有南大周志华团队的世界模型 Whale、Yann LeCun 团队的世界模型研究、李飞飞 World Labs 的空间智能研究、谷歌的强大世界模型 Genie 2 以及刚刚开源的像是能模拟万物的生成式物理引擎 Genesis。
不仅能推理,还能明确展示自己「推理逻辑」的大模型出现了。 OpenAI 的 12 天连续发布已近尾声,但它的热度显然已经被谷歌夺去了许多。从 Gemini 2.0 Flash 到 Veo 2 到今天的 Gemini 2.0 Flash Thinking,谷歌端上来的菜真是一道比一道香。
Meta斯坦福大学联合团队全面研究多模态大模型(LMM)中驱动视频理解的机制,扩展了视频多模态大模型的设计空间,提出新的训练调度和数据混合方法,并通过语言先验或单帧输入解决了已有的评价基准中的低效问题。
英伟达2025年博士奖学金名单揭晓了!今年,共有10位天才学者入选,华人比例占七成,其中不乏有中科大、浙大、上交、上科大、东南大学优秀校友。值得一提的是,5名入围学者全是华人学生。
本文中,香港大学与 Adobe 联合提出名为 UniReal 的全新图像编辑与生成范式。该方法将多种图像任务统一到视频生成框架中,通过将不同类别和数量的输入/输出图像建模为视频帧,从大规模真实视频数据中学习属性、姿态、光照等多种变化规律,从而实现高保真的生成效果。
AutoPatent框架能够自动化生成高质量的专利文档,大幅提高专利撰写效率,有望简化专利申请流程,降低成本,促进创新保护。
将图像中与约束相关的物体或部分提取为更简洁的几何元素(如点、线、面)。通过跟踪和评估这些几何元素在时空中的变化,可以有效地监控约束是否被满足。
2024年,智驾领域最热的词,就是“端到端”。甚至,到了不聊端到端都没法出门的程度。
自动驾驶行业正经历新一轮洗牌。其中,全球自动驾驶第一股图森未来的沉浮,折射出整个行业的阵痛:从 2021 年 IPO 时 85 亿美元的估值,到 2024 年初退市,短短三年间历经管理层动荡、美国监管调查、业务收缩及大幅裁员等一系列剧变。
2024年快要结束了,世界大模型究竟孰强孰弱?刚刚,智源研究院发布了下半年大模型综合评测结果,涵盖了开源闭源100+模型,横跨文本、语音、图像和视频等多个领域。
继视觉和听觉之后,AI已经进化到拥有嗅觉了?? 你没听错,这是来自Osmo公司的最新技术,它们刚刚首次实现了由AI生成的李子味道。 而且生成味道的过程几乎是全自动的——除了放入水果和取出生成结果,全程都不需要人工干预。
AI重构一切,已经实实在在开始在直播间里分一杯羹了。
什么??? 听说有人连一行代码都不会敲,竟然开发了个产品,然后还靠着它营收破百万……
刚刚,2024达摩院青橙奖获奖名单公布! 15名获奖中国青年科学家,平均年龄34岁。
The Information消息,初代GPT论文第一作者Alec Radford也要离开OpenAI,转向独立研究。据了解, Alec于2016年加入OpenAI,从初代GPT到GPT-4o的论文中全都有他的名字,其中前两代还是第一作者。
OpenAI 发布季第十一天,ChatGPT与Mac应用深度集成了—— 此次带来编程和写作两方面的更新。
许多没有任何GPU背景、算力行业经验的上市公司,将智算中心当做他们发展第二曲线的抓手,筹谋向AI领域转型——比如,生产味精的公司(莲花控股)、造染料的公司(锦鸡股份)、甚至还有博彩行业的玩家(鸿博股份)等等。 但到2024年年底,情况出现了逆转。
过去一年,强化学习成为了大模型 AI 领域最热的概念之一。 随着行业内高阶推理模型的推出,再次彰显了强化学习在通往 AGI 道路上的重要性,也标志着大模型 AI 进入了一个全新阶段。
Perplexity专注于改善信息获取,并正在构建全球首个“答案引擎”;Aravind认为模型会越来越商品化;Aravind谈Perplexity使命愿景
提速8倍! 速度更快、效果更好的混元视频模型——FastHunyuan来了! 新模型仅用1分钟就能生成5秒长的视频,比之前提速8倍,步骤也从50步减少到了6步,甚至画面细节也更逼真了。
丸辣!原来AI有能力把研究员、用户都蒙在鼓里: 在训练阶段,会假装遵守训练目标;训练结束不受监控了,就放飞自我。 还表现出区别对待免费用户和付费用户的行为。
给大模型智能体组一桌“大富翁”,他们会选择合作还是相互拆台? 实验表明,不同的模型在这件事上喜好也不一样,比如基于Claude 3.5 Sonnet的智能体,就会表现出极强的合作意识。 而GPT-4o则是主打一个“自私”,只考虑自己的短期利益。
2024年12月19日,智源研究院发布并解读国内外100余个开源和商业闭源的语言、视觉语言、文生图、文生视频、语音语言大模型综合及专项评测结果。
自2022年年末OpenAI发布ChatGPT以来,英伟达的市值就上涨了近5倍,甚至超越苹果成为了全球最值钱的公司。眼看着英伟达如今能够让OpenAI、Meta、xAI等一众AI厂商排队交钱,也就使得越来越多的公司想成为此次AI淘金热中的“卖水人”。
奶茶机器人,有必要吗? 万万没想到,几块钱的奶茶比几十万的汽车更先赛博了起来。 北京地铁站已经开始搞奶茶无人机了,扫码点餐、机械臂制作、全程无人工,妥妥的i人福利。
可控视频生成,对于自动驾驶技术而言,同样非常重要。
从中国人工智能公司的总体分布情况来看,目前在北京有1869家AI公司,是全国AI公司密度最高的城市,占全国27%的比重;广东有1494家AI公司,占比为21%;上海有1081家AI公司,占比15%。全国有超过六成的AI公司分布在北上粤三地。
早在当年微软Edge也转投谷歌Chromium阵营时,外界都以为网络浏览器的故事已经迎来了大结局。