
异军突起的AI代理,会把人类带入一个怎样的新世界?
异军突起的AI代理,会把人类带入一个怎样的新世界?代理型人工智能具有显著的潜力。
代理型人工智能具有显著的潜力。
特朗普刚一上任,就和OpenAI联手了整了个大的:「星际之门计划」正式启动!4年,5000亿美金,美国的AI曼哈顿计划,今日正式开启。
WaveForms致力于开发音频大模型(LLMs),通过创新的端到端音频处理技术,实现更加实时、类人化且情感智能化的语音交互。与传统语音模型不同,WaveForms的音频模型不是语音转文本再转语音,而是能够直接处理音频,实现更自然的对话和情感互动。
自由画布类 AIGC 工具:从近期新品(更新)窥见发展趋势——自律才能给我自由。图像 & 视频多主体一致功能:模型上下文能力的重要体现,未来各家模型的标配。指定 AI 生图里的文字,我找到了 9 种解决方案,其中有 2 种快过时了
早上MiniMax上线TTS,字节上线AI编程Trae;下午字节全量上线豆包实时语音;晚上DeepSeek开源R1性能直接对标OpenAI o1,然后Kimi的k1.5直接正面硬刚。昨天的余温还没过,今天下午,腾讯混元又悄悄开了个闭门发布会,作为混元的老基友,我自然是受邀参加期期不落。
才一上任,特朗普就宣布撤销拜登的AI行政禁令!马斯克、小扎、劈柴、贝索斯、库克等大佬悉数出现在就职典礼上。今天起,历史上最贵「内阁」开始运转,新总统承诺减少监管,加大AI基础设施投入,美国科技巨头的春天来了?
模型蒸馏也有「度」,过度蒸馏,只会导致模型性能下降。最近,来自中科院、北大等多家机构提出全新框架,从两个关键要素去评估和量化蒸馏模型的影响。结果发现,除了豆包、Claude、Gemini之外,大部分开/闭源LLM蒸馏程度过高。
在人工智能基础模型技术飞速发展的今天,SAR 图像解译领域技术创新与发展生态亟待突破。为了解决上述技术挑战,国防科技大学电子科学学院刘永祥&刘丽教授团队提出首个公开发表的SAR图像目标识别基础模型SARATR-X 1.0。
该技术报告的主要作者 Lu Wang, Fangkai Yang, Chaoyun Zhang, Shilin He, Pu Zhao, Si Qin 等均来自 Data, Knowledge, and Intelligence (DKI) 团队,为微软 TaskWeaver, WizardLLM, Windows GUI Agent UFO 的核心开发者。
线性资本和 Linkloud 创始人高宁进行了一场深度对谈,高宁分享了他在最近两年做出海社区的体会,与众多在创业第一天想做全球市场生意的创业者打交道的观察,以及对个别海外发展成功案例的总结。
新年伊始,AI专家Gary Marcus发布长文,公布了他对2025年AI发展最新的25项预测,包括AGI、生成式AI、自动驾驶、人形机器人、视频生成、智能体等多个方向。虽然在2024年对OpenAI估值预测出错,但在最新的预测中仍不看好OpenAI。
在产业界兜兜转转几年后,颜水成再次选择回归学界—— 重返新加坡国立大学NUS,担任计算机系特聘教授。没错,就是他第一个教职所在地,也是他声名鹊起的地方。
我亲眼见证了数据量的爆炸式增长以及行业的巨额投入。当时就很明显,AI是推动这些数据增长背后的关键动力。那是一个非常有趣的时刻——Meta正在完成“移动优先”的过渡,开始迈向“AI 优先”。
昨天晚上,DeepSeek 又开源了 DeepSeek-R1 模型(后简称 R1),再次炸翻了中美互联网: R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。 R1 上线 API,对用户开放思维链输出 R1 在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版,小模型则超越 OpenAI o1-mini
中国版o1刷屏全网。DeepSeek R1成为世界首个能与o1比肩的开源模型,成功秘诀竟是强化学习,不用监督微调。AI大佬们一致认为,这就是AlphaGo时刻。
据 TechCrunch 报道,OpenAI 可能即将发布一款 AI 工具,可以控制用户的电脑并代表用户执行操作。
今天给大家分享一下2024年中国AIGC应用发展年度大报告。QuestMobile数据显示,截止到2024年12月,AI原生APP月度活跃用户已经突破1.2亿,同比增长232%,同时,用户粘性也持续增长,整体月人均使用时长达133.0分钟,月人均使用次数也达到49.6次。
AI生图热潮下,技术与艺术正在不断碰撞中擦出新火花。人们对于生成效果和创意的要求都在悄然提升,同时也开始更加注重其中的实用性与持续性,而非只是单纯的娱乐体验。
设想一场高度智能的模拟游戏,游戏的角色不再是普通的NPC,而是由大语言模型驱动的智能体。在这其中,悄然生出一个趣事——在人类的设计下,这些新NPC的言行不经意间变得过于啰嗦。
李继刚在消失半年后,带着汉语新解重新归来,一出手大家就惊呼李继刚的prompt已经到了next level。但不懂编程的小白又懵逼了!怎么提示词也开始编程了?大语言模型的优势不是通过说话就能达成需求吗?怎么又开始需要编程了?技术在倒退吗?
Grok AI 最近网页版刚刚上线。我看到不少人都在比较 Grok 对标 ChatGPT 等等 LLM 大模型的研究和生成能力。我想说,背靠 X (前推特)数据库的 Grok AI,最好的使用方式难道不是实时监测全球媒体热点吗?
初创公司DeepWriter宣布:世界第一部完全由AI写作的10万字商业竞争书籍诞生了!全程没有人类参与工作,不到4小时,即可完成约10万单词的商业书籍创作。
Cursor、Copilot、 Windsurf、Devin、Bolt.new 等一系列 AI 编程神器经常刷屏程序员圈。可惜,普遍对中文开发者不太友好,我把他们装好后,第一件事儿就是先折腾下汉化。而且时不时因为未知原因就被封号了。终于今天,字节跳动洞察到了这个痛点,发布了一款中文开发者友好的 AI IDE——Trae。虽然是海外版,但支持中文。
如果我们打开阿里的招聘官网,可以发现通义To C的一些招聘细节。在“智能信息”这个事业板块搜索与“通义”相关的可以看到总共有六个岗位,初步发布时间刚好就是去年年底通义To C分拆这一消息刚传出来的时候:
特朗普2.0政府即将开启,科学界又将迎来「几家欢喜几家忧」的变动局面。AI与太空探索成最大赢家,环境气候科学或将再次被特朗普抛弃。
ittor Geometric 1.0是由中国人民大学与东北大学联合开发的图机器学习库,基于国产Jittor框架,高效灵活,可助力处理复杂图结构数据,性能优于同类型框架,支持多种前沿图神经网络模型,已开源供用户使用。
来了来了,月之暗面首个「满血版o1」来了!这是除OpenAI之外,首次有多模态模型在数学和代码能力上达到了满血版o1的水平。
2024一整年,各大科技厂商经历了对RayBan Meta的“质疑-理解-成为-超越”,在AI眼镜领域集结重兵。整个市场也从RayBan Meta的“一枝独秀”,变成了近百家企业参与、数十款新品被推出的火爆局面。
AI具备的能力,本质上来自算法和训练大模型所用的数据,数据的数量和质量会对大模型起到决定性作用。此前OpenAI工作人员表示,因没有足够多的高质量数据,Orion项目(即GPT-5)进展缓慢。不得已之下,OpenAI招募了许多数学家、物理学家、程序员原创数据,用于训练大模型。
Open AI CEO:今年人类会见到第一批就业的“AI智能体”