
吉卜力风「手游」爆火,可灵+Midjourney生成的!教程已出,支持复刻
吉卜力风「手游」爆火,可灵+Midjourney生成的!教程已出,支持复刻芜湖,吉卜力风的“手游”,原来可以这么好看吗?
芜湖,吉卜力风的“手游”,原来可以这么好看吗?
AI 也看脸, 每一次网购衣服,都是对自我认知的一次刷新。这不是最近 618 大促吗,再次印证了那句“老话”——看买家秀以为是东方不败,到手一穿像衰神二代。
生存法则已然重构,AI制药的生死竞速,才刚刚进入最惊险的赛段。
您有没有这样的体验?一天的工作里,您可能用GPTo3写了个方案,然后切换到Cursor或者Trae里写代码,接着又打开Notion或者飞书整理文档。每个工具都挺聪明,但它们彼此之间就像生活在平行宇宙——写方案的GPT不知道您后来写了什么代码,写代码的Cursor也不清楚您的整体规划是什么。
本文主要作者是 Bytedance Pico 北美高级研究员胡涛博士,近年来研究领域包括3D 重建与 4D 场景和视频生成,致力于得到一种最佳的物理世界表示模型。
当前数学领域的数据生成方法常常局限于对单个问题进行改写或变换,好比是让学生反复做同一道题的变种,却忽略了数学题目之间内在的关联性。
人才就是护城河,得AI人才者得天下。
刚刚,Gemini 系列模型迎来了一波更新:Gemini 2.5 Pro 稳定版发布且已全面可用,其与 6 月 5 日的预览版相比无变化。新推出了 Gemini 2.5 Flash-Lite 并已开启预览。
今年 5 月,一家名为 FutureHouse 的非营利组织宣布推出一款名为 Robin 的新型人工智能(AI)工具,声称其能够极大加速生物学等领域的科学研究进程,该系统不仅能够自主完成从假设提出、实验设计到数据分析等关键科研环节,更在实际应用中,仅历时约 2.5 个月便成功为干性年龄相关性黄斑变性这一复杂眼疾发现了一种新的潜在治疗药物。
高考数学满分AI出现了!豆包旗下的教育产品:豆包爱学首次公开挑战高考数学全国卷,由6位资深名师严格把关,主观题步骤全打分,竟然斩获Ⅰ卷144分、Ⅱ卷150分满分战绩。这个惊艳的成绩或许预示着,AI教育真要变天了。
CVPR 2025落下帷幕,这次关注度和社交参与感,非常深度了。
28 岁的 Jenny Wang 在科技行业工作多年,始终萦绕在她心头的想法是开发一款个人造型助手——它能根据用户的预算、生活方式、天气和日程安排,帮助用户决定穿搭与购物选择。
最近Seedance 1.0 Pro风很大啊,看到我的博主朋友们都在玩,那作为一个至今没有被即梦灰度到首尾帧功能的冤种会员,今天就来玩玩PixVerse,aka 拍我AI吧!
据外媒报道,OpenAI新任招聘主管华金・基尼奥内罗・坎德拉(Joaquín Quiñonero Candela)在社交平台称,人工智能领域的创新速度正推动科技巨头加速争夺顶尖人才,而OpenAI正面临前所未有的增长压力。
当“人工智能”这个词充斥在每一个角落时,一个核心问题随之而来: 对于商业世界的企业,AI究竟是值得下重注的未来,还是一个被过度炒作的泡沫?
近期,人工智能领域对“具身智能”的讨论持续升温——如何让AI不仅能“理解”语言,还能用“手”去感知世界、操作环境、完成任务?相比语言模型的迅猛发展,真正通向Agent的下一步,需要AI具备跨模态感知、动作控制与现实泛化能力。具身智能让AI不仅能“思考”,更能“感知”“行动”。
本次投资人访谈,我们邀请到观正资本合伙人林子钧。LiquidMetal Ventures (观正资本) 作为专注于科技前沿领域的投资机构,始终以全球化视野捕捉技术变革中的投资机遇。
近年来,众多原告——包括书籍、报纸、计算机代码和照片的出版商——起诉人工智能公司使用受版权保护的材料来训练模型。所有这些诉讼中的一个关键问题是,人工智能模型如何轻易地从原告的受版权保护的内容中逐字摘录。
虚假的商战, 不断发布新的模型保持技术优势; 真实的商战,Anthropic 单方面禁止AI编程编辑器 Windsurf 使用 Claude 模型,订阅用户都跑去隔壁 Cursor 了。
编程智能体确实厉害!Transformer作者Llion Jones初创公司,专门收集了NP难题并测试了AI智能体,结果竟在上千人竞赛中排第 21!这意味着,它已经比绝大多数人写得好了。
面对Ai,我们开始感到,无趣了,甚至,失去了原本的那股劲头。
从春晚舞台上扭秧歌、转手绢,到稳健完整跑完半程马拉松…… 过去半年,一系列炫酷的表演,把人们对机器人的认知从想象拉进了现实。
6 月 17 日消息,尽管谷歌拥有庞大的云计算业务和大量人才,但在生成式人工智能竞赛中常常被视为处于劣势的一方。
6月16日,首都医科大学附属北京友谊医院(下简称“友谊医院”)与蚂蚁集团正式签署共建协议
LLM Ensemble(大语言模型集成)在近年来快速地获得了广泛关注。它指的是在下游任务推理阶段,综合考虑并利用多个大语言模型(每个模型都旨在处理用户查询),从而发挥它们各自的优势。大语言模型的广泛可得性,以及其开箱即用的特性和各个模型所具备的不同优势,极大地推动了 LLM Ensemble 领域的发展。
GUI智能体总是出错, 甚至是不可逆的错误。 即使是像GPT-4o这样的顶级多模态大模型,也会因为缺乏常识而在执行GUI任务时犯错。在它即将执行错误决策时,需要有人提醒它出错了。
NVIDIA等研究团队提出了一种革命性的AI训练范式——视觉游戏学习ViGaL。通过让7B参数的多模态模型玩贪吃蛇和3D旋转等街机游戏,AI不仅掌握了游戏技巧,还培养出强大的跨领域推理能力,在数学、几何等复杂任务上击败GPT-4o等顶级模型。
由香港中文大学团队撰写的语音语言模型综述论文《Recent Advances in Speech Language Models: A Survey》已成功被 ACL 2025 主会议接收!这是该领域首个全面系统的综述,为语音 AI 的未来发展指明了方向。
美国国防部与OpenAI签订为期一年、价值2亿美元的合同,将采用其人工智能模型
随着大模型的不断发展,多模态数据处理成为了新的热点领域。多模态生成任务主要通过整合多种类型的数据,如文本、图像、音频等,实现不同模态之间的相互转换与生成。