AI操作有了“紧急刹车”!通义&自动化所AI决策诊断模型,GUI智能体纠错正确率SOTA
AI操作有了“紧急刹车”!通义&自动化所AI决策诊断模型,GUI智能体纠错正确率SOTAGUI智能体总是出错, 甚至是不可逆的错误。 即使是像GPT-4o这样的顶级多模态大模型,也会因为缺乏常识而在执行GUI任务时犯错。在它即将执行错误决策时,需要有人提醒它出错了。
GUI智能体总是出错, 甚至是不可逆的错误。 即使是像GPT-4o这样的顶级多模态大模型,也会因为缺乏常识而在执行GUI任务时犯错。在它即将执行错误决策时,需要有人提醒它出错了。
美国国防部与OpenAI签订为期一年、价值2亿美元的合同,将采用其人工智能模型
随着大模型的不断发展,多模态数据处理成为了新的热点领域。多模态生成任务主要通过整合多种类型的数据,如文本、图像、音频等,实现不同模态之间的相互转换与生成。
深夜,沉寂已久的Kimi突然发布了新模型—— 开源代码模型Kimi-Dev,在SWE-bench Verified上以60.4%的成绩取得开源SOTA。
在苹果AI中国版一片静默之际,阿里出牌了。
在开源模型领域,DeepSeek 又带来了惊喜。
如果你也在用 Cursor 或者类似的 AI 编程神器,我敢打赌,你每个月的 AI 调用次数(Request)至少浪费了90%!
你有没有想过,那些每天花费数千美元、耗时数月的市场调研项目,竟然可以在几天内完成,成本还能降低81%?当我看到Outset这家仅有14名员工的旧金山创业公司刚刚完成1700万美元A轮融资时,我意识到一个存在了几十年的行业正在被彻底颠覆。
假作真时真亦假,无为有处有还无。
未来AI路线图曝光!谷歌发明了Transformer,但在路线图中承认:现有注意力机制无法实现「无限上下文」,这意味着下一代AI架构,必须「从头重写」。Transformer的时代,真的要终结了吗?在未来,谷歌到底有何打算?
HR部门的AI“军备竞赛”已经打响
图像生成界的“大魔王”Midjourney也来卷视频生成了?!
5月15日晚,区瀚楠、陈睿轩走进了上海浦东的一栋民宿。 这里没有食物、没有智能手机、没有浏览器、没有APP,只有一台预装AI工具的联网电脑、一部非智能手机、一瓶饮用水和100元生存资金,他们将在这个封闭房间里依靠AI工具生存72小时。
CVPR 2025,自动驾驶传来重大进展: Scaling Law,首次在这条赛道被验证!
AI 角色扮演、AI 情感陪伴……更多 AI 交互方式的出现正在重新定义“社交”。
“蔚公子,DeepSeek核对两个Excel表格怎么做啊?”小伙伴上周问我。
AI迈入经验时代,2025 年 6 月 6 日,第七届北京智源大会在北京正式开幕,强化学习奠基人、2025年图灵奖得主、加拿大计算机科学家Richard S. Sutton以“欢迎来到经验时代”为题发表主旨演讲
上周六,我受邀参加了由 TGO 鲲鹏会 举办的全球科技领导力大会(GTLC),回到了熟悉的深圳,做了一场题为《MCP 的发展与未来》的分享。
我们常把LangGraph、RAG、memory、evals等工具比作乐高积木,经验丰富的人知道如何搭配使用,就能迅速解决问题
近日,南京因克斯智能科技有限公司(以下简称“因克斯”)宣布,继2024年10月完成首轮天使轮融资之后,已连续完成两轮新的融资,新投资方包括锦秋基金、德石投资、深创投集团、复星创富等知名投资机构,同时绿洲资本、水木创投、拉尔夫创投等天使轮投资方持续追加投资。明论资本担任独家财务顾问。
百川智能、零一万物、智谱核心高管出走,京东悄悄挖人。 智东西6月16日报道,今年上半年,“大模型六小虎”中的智谱、MiniMax、零一万物、百川智能、阶跃星辰5家企业,共被曝13位AI高管变动,其中有12位出走、1位新入职
从数字工具到数字队友的进化之路 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
特朗普政府的AI大计划还没正式亮相,就在GitHub泄露了!一个叫ai.gov的网站即将上线,要把AI塞进政府每个角落。聊天机器人、超级API、实时监控工具,野心大到吓人,但网友们已经开怼:这靠谱吗?
过去一段时间,“通用 Agent”成了 AI 应用的默认发展方向。无论产品叙事还是技术布局,大家似乎都在追求一个“什么都能做”的智能体。但现实逐渐显露:通用 Agent 在真实世界中并不那么“通用”。
未中顶会,没有发表arXiv,一篇博客却成为OpenAI速通票。天才科学家Keller Jordan仅凭Muon优化器博客加入OpenAI。甚至,它可能被用于训练下一代超级模型GPT-5。
据自媒体“申妈的朋友圈”消息,知情人士透露,字节人工智能实验室 (AI Lab) 负责人李航已经正式卸任,他在内部系统的身份变为劳务/顾问。
「西部世界」真的要来了!科学家们正试图为AI装上人类大脑。最新进展由美国国家实验室主导。
知识以一种奇怪的方式进入了我的大脑。
当学术研究沦为「填空游戏」,利用美国NHANES公共数据集,结合AI工具如ChatGPT,研究者通过套用模板、排列变量,批量生产看似精美却质量堪忧的论文。背后不仅是技术的滥用,更是科研评价体系扭曲的缩影。
当地时间6月15日,据知名科技记者马克·古尔曼透露,苹果AI与机器学习战略高级副总裁约翰·詹南德雷亚(John Giannandrea)已逐渐淡出苹果公司核心管理层,甚至可能在不久后 “离开苹果公司”。