
谷歌「最强图像模型」横扫一切!Gemini 2.5 Flash Image正式上线!PS不存在了
谷歌「最强图像模型」横扫一切!Gemini 2.5 Flash Image正式上线!PS不存在了Gemini 2.5 Flash Image是谷歌最新发布的顶级图像生成与编辑模型,被网友誉为「最强图像模型」。其化身nano-banana在LMArena盲测中以历史最大优势夺冠,凭借角色一致性、提示编辑、原生世界知识和多图像融合四大能力,引发广泛关注。
Gemini 2.5 Flash Image是谷歌最新发布的顶级图像生成与编辑模型,被网友誉为「最强图像模型」。其化身nano-banana在LMArena盲测中以历史最大优势夺冠,凭借角色一致性、提示编辑、原生世界知识和多图像融合四大能力,引发广泛关注。
一觉醒来,AI版地球online,上线了。不是玩梗整活,而是一个真正的,可以容纳十万个AI智能体的在线虚拟世界。 全名叫Aivilization,是一个由港科大研发的,模拟真实世界的大型AI实验。也可以直接叫它,AI小镇。
马斯克宣布了一个疯狂的计划,将在5年内实现5000万张H100的算力,这是什么概念?这将为人类带来怎样的影响?ASI能否在勇敢者的孤注一掷下现身?
智东西8月26日报道,近日,美国浏览器公司Brave发布博客,称该公司在美国知名AI搜索独角兽Perplexity打造的AI浏览器Comet中发现了一个严重安全漏洞,攻击者可通过在网页中发布恶意指令,来操纵AI浏览器登录网站、访问邮箱、获取验证码,并将这些敏感信息发送给外部攻击者。全程耗时两分半,连普通人也能完成这种攻击。
Perplexity 将允许出版商分享 AI 搜索产生的收入,该公司此举旨在应对部分媒体对其内容使用提出的批评和法律诉讼。
如果你拥有了庞大的三维空间数据,你会用来做什么? 大模型时代之后,数据成了支撑模型的承重柱。能否获取足够的可用高质量数据,直接决定了某个领域的 AI 的发展上限。
2023年,AI浪潮席卷全球,无数创业者开始了一场寻找“下一代硬件”的竞赛。
当大多数 AI 教育公司还在为盈利发愁时,成立仅两年的 Praktika,交出的一组运营数据:30人团队支撑起近 2000 万美元年化收入,超500万用户,在2024 年 5 月拿下 Blossom Capital 领投的 3550 万美元 A 轮融资,加上早期种子轮,总融资已达 3800 万美元,这个靠 AI 虚拟外教(Avatar)走红的 App,正在重新定义语言学习的商业模式。
Humain 作为沙特领先的人工智能公司,已推出一款面向阿拉伯和穆斯林群体的对话式 AI 应用,正值沙特寻求在该技术领域获得区域领导地位之际。
在AI客服这个看似红海的赛道里,几乎每个人都遇到过这样的尴尬:明明刚刚告诉AI你的会员账号,转个身的功夫它就不记得了。这种被称为“金鱼脑”的AI失忆现象,正是大模型在企业级应用中最大的痛点。
你有没有想过,一家小企业想要贷款时,为什么总是被迫在两个极端选择之间挣扎?要么选择社区银行的低利率,但要忍受漫长的审批流程和落后的数字化体验;要么转向在线放贷平台的快速审批,却要承受高达60%的年化利率。这种看似无解的困境,正在被一家名为Casca的创业公司彻底颠覆。
头部科技公司已经开始卡位新AI时代软硬件一体能力,一个判断是,只能做硬件或只能做软件的公司或许都会损失一部分竞争力
8 月 25 日,钉钉十周年,8.0 版本发布。但是在发布会现场, CEO 无招却说: 钉钉 8.0 也是 AI 钉钉的 1.0,我们决心清空过去,以归零的心态,为 AI 时代打造一个全新的钉钉。
数据显示,70%的雇主更愿意招一位会AI的新人,而不是拥有该岗位10年经验却不会AI的老手。任何毕业生都需要掌握在日常生活中使用AI的能力。现在随着低代码技术的兴起,以及各种让编程变得更简单的工具出现,我们将走到这样一个阶段:每个学生不仅应该学会如何使用AI,还应该学会用AI来创造,比如创造图像、开发应用、编写代码。
这份来自麻省理工的2025年商业AI现状的研究报告最近在网上炸锅了,该报告称 95% 的人工智能试点都失败了,这吓坏了美国股市的投资者。报告提到大多数公司都陷入了困境,因为 95% 的 GenAI 试点项目都没有产生任何投资回报率,而只有 5% 的公司通过使用可学习、可融入实际工作流程并随着使用而改进的系统获得了成功。
在AI时代,AI能力超越人但无法取代人的独特价值:人因宝贵和不可预测需求必须掌控微决策——即个人冒险决定体现风格与价值观,AI辅助下执行计算,微决策提升工作独特性,前景乐观。
如今,Facebook与Instagram已正式上线Reels短视频的音频翻译功能。该功能依托AI技术,可直接将视频中的人物音频翻译成不同语种,不仅支持双人对话翻译,还能实现嘴型对齐,并根据对话双方的原始音色,合成声线高度相似的翻译音轨。
昨晚,神秘且强大的图像生成与编辑模型 nano banana 终于正式显露真身。没有意外,它果然来自谷歌,并且也获得了一个正式但无趣的名字:gemini-2.5-flash-image-preview。
今天,我们正式开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型,成为行业首个具备“高刷”视频理解能力的多模态模型,看得准、看得快,看得长!高刷视频理解、长视频理解、OCR、文档解析能力同级 SOTA,且性能超过 Qwen2.5-VL 72B,堪称最强端侧多模态模型。
又是一场酣畅淋漓的战斗! 宝可梦主播GPT-5在直播间鏖战一小时,成功击败赤爷(Red),公屏瞬间刷满GG(Good Game)。
朋友,你相信光吗? 在你正式做出回答之前,AI玩具领域已经用行动告诉我们:有人依然相信。 全球首款迪迦奥特曼AI玩具正式发售,国产的。
上周三,DeepSeek 开源了新的基础模型,但不是万众期待的 V4,而是 V3.1-Base,而更早时候,DeepSeek-V3.1 就已经上线了其网页、App 端和小程序。
一个月前在德国被50多家投资人拒绝的AI创业公司,搬到硅谷后却能在一周内完成470万美元的融资,而且投资人几乎全部说"yes"。这不是什么励志鸡汤故事,而是Leaping AI创始人Kevin Wu的真实经历。
十亿美元能买一栋别墅,但买不了梦想? 最近,Meta 内部发生了一些有意思的事情 —— 一边是扎克伯格动辄上亿美金薪资招兵买马,高调组建超级智能团队;另一边是一些老员工宣布开启新的「冒险之旅」,转投其他 AI 公司。
当大语言模型(LLM)走向千行百业,推理效率与显存成本的矛盾日益尖锐。
Macaron(马卡龙)AI 最近挺火的。 8 月 15 日,他们以「世界上第一个 Personal Agent」的称号公开上线了,给扎克伯格想做的 Personal SuperIntelligence 打了个样。
英伟达开源又放大招了! 韩松团队推出了一款全新的基于后神经架构搜索的高效语言模型——Jet-Nemotron。
当地时间周一,马斯克向 OpenAI 和苹果「开炮」了! 据多家外媒报道,马斯克旗下 xAI 一纸讼书,控告它们通过 ChatGPT 和苹果 App Store 进行非法垄断。
英伟达直接把服务器级别的算力塞进了机器人体内。 全新的机器人计算平台Jetson Thor正式发售,基于最新的Blackwell GPU架构,AI算力直接飙升到2070 TFLOPS,比上一代Jetson Orin提高至整整7.5倍,同时能效提高至3.5倍。
在最近与科隆国际游戏展同期举办的Devcom开发者大会上,AI再次赚足了脸面。