
150PB工业数据+智能体革命,西门子开启AI制造新纪元
150PB工业数据+智能体革命,西门子开启AI制造新纪元那是 1964 年,德国南部的小城爱尔兰根,阳光洒落在西门子数据中心的窗格上,一台名为 Zuse Graphomat Z64 的绘图仪静静运转着。 它并不懂何为艺术,却在工业数学家 Georg Nees 的指令下,画出了世界上最早一批由计算机生成的图像。
那是 1964 年,德国南部的小城爱尔兰根,阳光洒落在西门子数据中心的窗格上,一台名为 Zuse Graphomat Z64 的绘图仪静静运转着。 它并不懂何为艺术,却在工业数学家 Georg Nees 的指令下,画出了世界上最早一批由计算机生成的图像。
等了50年,AI教父Hinton终于「真人现身」中国了!这位图灵奖+诺奖教父级大神,不仅亲自踏上魔都土地,还与市委书记同框合影,瞬间刷屏全网!最近他再次预言,AI已进入觉醒倒计时。现在全网都在翘首以待,准备迎接明天他的高能演讲。
近期,夸克技术团队和浙江大学联合开源了OmniAvatar,这是一个创新的音频驱动全身视频生成模型,只需要输入一张图片和一段音频,OmniAvatar即可生成相应视频,且显著提升了画面中人物的唇形同步细节和全身动作的流畅性。此外,还可通过提示词进一步精准控制人物姿势、情绪、场景等要素。
如何理解大模型推理能力?现在有来自谷歌DeepMind推理负责人Denny Zhou的分享了。 就是那位和清华姚班马腾宇等人证明了只要思维链足够长,Transformer就能解决任何问题的Google Brain推理团队创建者。 Denny Zhou围绕大模型推理过程和方法,在斯坦福大学CS25上讲了一堂“LLM推理”课。
上周,OpenAI 正式推出了自己的 Agent 产品,ChatGPT agent。 用户只需扔出一句话,它就能像个聪明的助理一样,查资料、写报告、点网页、跑代码,甚至还能做一整套财报分析,再打包成 PPT。
Cursor突然断供,码农AI Coding就像被砍掉了手脚!如今,清华系最强平替MonkeyCode站在了C位,不仅性能炸裂、成本超低,还能应对复杂编程任务,首发支持Kimi K2和Qwen3。
今天带来 Myshell ShellAgent 2.0 的测试和介绍。 发现 Myshell 上了一个 ShellAgent 2.0 的能力,只需要提示词就能生成一个 Agent 应用。他们这个有意思的点是,没有复杂的前端页面都会在一个 Chatbot 里构建类似的交互,这就摆脱了构建前端的复杂流程降低了错误率,Agent 只需要管理工具之间的交互就可以。
AI+精神病学,这两个词居然能合并到一起,不是整活,不是用于人类治疗。这不,Claude团队正式启动了一个“AI精神病学”小组,年薪两百万元招人来专门研究AI的精神状态。
去年被硬件从业者称作 “AI 硬件元年”,然而时至今年,一批 AI 硬件公司已面临困境。
你有没有想过,为什么那些看起来无所不能的 AI agent,在真实工作环境中却总是显得如此笨拙?我们花费数百小时调试提示词、完善指令,但这些智能系统依然无法像人类员工那样从经验中学习和成长。它们不会从错误中汲取教训,也不会在重复性任务中变得更加熟练。这个根本性问题,正是 Composio 刚刚完成 2500 万美元 A 轮融资要解决的核心挑战。
硅谷 AI 投资人 Elad Gil 昨天发布了自己对 AI 领域投资的总结回顾与预测。在他看来,过去四年 AI 经历了从 “技术迷雾”到“商业马拉松” 的变化:随着模型能力的不断提升,过去 12 个月里一系列 AI 应用落地的细分场景在得到验证,头部公司浮现,一定程度上,未来 1-2 年的市场格局初定,AI 应用层正进入收敛周期:
35 人,8 个月,年收入破 1 亿美元。 Lovable 创下了最快的增长速度,超过了 OpenAI、Cursor、Wiz 以及历史上所有其他软件公司。
无需复杂编程,仅通过观看视频就能破解光照、反射等物理规律。Hassabis畅想,在AI驱动的游戏世界,玩家每一步都将触发独特的故事,成为个人化的冒险乐园。
故事是这样的。 后天就WAIC了。 而这一周,我遇到了这两年来,我最痛苦的难题。 WAIC期间,我要参加的活动非常多,有15家厂商参与的大直播、有AR眼镜发布会、有论坛嘉宾、有专访等等等等。
据悉,OpenAI正在寻求新一轮400亿美元融资,迫切需要资金支持其岌岌可危的星际之门项目。 星际之门就是年初OpenAI和软银牵头发起,要在全美建立多个数据中心,被称为“史上最大的人工智能基础设施项目”。
部分人拒绝AI,指出其训练依赖“被盗劳动力”且不道德,担心导致去技能化丧失技能和独立思维,强调人类创造力、情感体验不可替代;历史类比卢德运动表明拒绝难成功,但维护人类主体性至关重要。
就在昨天,来自UCLA的两位研究者黄溢辰和杨林做了一件让整个AI圈都震惊的事。他们用Google的Gemini 2.5 Pro模型,在2025年国际数学奥林匹克竞赛中拿下了金牌水平的成绩,6道题解对了5道。这可不是什么花架子,IMO被公认为是测试AI推理能力的终极试金石,因为它需要的不仅仅是计算,更需要创造性思维和严密的逻辑推理。
AI引入企业管理并非单纯效率工具,而是引发战略定位、组织流程与数据底层的系统性变革。忽视准备将导致混乱而非增效。实现“AI原生”需平衡效率与风险,重构人机协作规则。企业需清晰战略、完善数据基建,并通过文化建设降低员工抵触,方能将AI潜力转化为核心竞争优势,避免误用为裁员工具。
如何让机器人从看懂世界,到理解意图,再到做出动作,是具身智能领域当下最受关注的技术重点。 但真机数据的匮乏,正在使对应的视觉-语言-动作(VLA)模型面临发展瓶颈。
故意为之 当地时间周三(7月23日),美国总统特朗普在华盛顿特区举行的人工智能峰会上发言。
AI只是工具,关键看被谁使用。 在当今时代,虚假图片的逼真程度与日俱增,各种虚虚实实的内容,让人不禁怀疑,“眼见为实”这句话,恐怕将要成为历史。
一位从业20年设计师的自白。7月的杭州,潮湿的空气似乎随时都在酝酿一场暴雨。
2025年8月,OpenAI将正式发布下一代大模型GPT-5!这一备受瞩目的升级版AI由CEO奥特曼亲自预热,集成了o系列推理能力,定位为通往AGI(通用人工智能)的关键一步。
职场人苦“做PPT”久矣。
孙正义,好像被奥特曼忽悠了?才刚投完300亿美元,奥特曼就绕过软银另起炉灶了。后者已经放话「年底要搞定100万块GPU」,结果马斯克直接跟了个5000万!现在,美国AI圈的算力核战争,已经升级到白热化。
大模型的能力再一次被行业验证!7月23日,夸克健康大模型在业界引起广泛关注:其成功通过了中国12门核心学科的主任医师笔试评测,成为国内首个完成此项专业考核的AI大模型。为深入解读其技术路径,我们分享一份关于夸克健康大模型的深度调研报告。
大家好,我是歸藏(guizang),今天给大家带来 Lovart 的正式版一手介绍和体验。Lovart 我们介绍过很多次了,但是每次都会有新东西。 昨晚看到他们的推特,发现发了正式版,就赶紧试了一下。 今天这个设计 Agent 终于变成了一个完全体,而且这次的更新依然非常牛批。
任何足够先进的科技,都与魔法无异。—— 亚瑟・克拉克,科幻小说作家、发明家
YouTube这周宣布,将为Shorts创作者推出一系列全新的AI功能。最吸引眼球的,是一个可以“照片变视频”的生成式工具。你只需要上传一张相册里的图片,AI 就能把它变成一段六秒的短视频。
Manus为迷茫的AI从业者定义了Agent的产品范式,至此,一场以华人为主角的AI Agent创业热潮,正在席卷全球。