
高能预警,谷歌神器一句话P图全网震动!PS直接淘汰,模特广告业不存在了?
高能预警,谷歌神器一句话P图全网震动!PS直接淘汰,模特广告业不存在了?谷歌的Gemini 2.0 Flash凭一句话PS的功能,还在全网不断掀起新的风暴!广告业直接被颠覆,模特从此彻底不存在了。去水印、梗图、交叉图像,已经被网友玩疯。甚至有人预言:谷歌已全面超越OpenAI,将率先实现AGI。
谷歌的Gemini 2.0 Flash凭一句话PS的功能,还在全网不断掀起新的风暴!广告业直接被颠覆,模特从此彻底不存在了。去水印、梗图、交叉图像,已经被网友玩疯。甚至有人预言:谷歌已全面超越OpenAI,将率先实现AGI。
“零基础”也能弹奏出好听和弦的无弦吉他,能监测睡眠呼吸和血氧的智能戒指,能听音乐、打电话、做翻译的AI眼镜……近日,位于徐汇西岸的大模型创新生态社区“模速空间”联手潮流电子新零售品牌Z·Pilot,推出上海首家全球AI潮品体验店。500多平方米的店内汇集了500多件科技潮品,让每一位尝鲜者大呼过瘾。
2月26日,北京大学第三医院的心内科诊室里,两种治疗方案在诊台上对峙:左侧是心内科大夫汪京嘉开出的一份用于治疗高血脂的医嘱,右侧是人工智能软件生成的处方。
大模型同样的上下文窗口,只需一半内存就能实现,而且精度无损? 前苹果ASIC架构师Nils Graef,和一名UC伯克利在读本科生一起提出了新的注意力机制Slim Attention。
肝癌是全球癌症相关死亡的第三大原因,手术切除后的复发率高达70%,如何准确预测肿瘤手术切除后复发风险是一个难题。
HuixiangDou 是群聊场景的 LLM 知识助手。
角色扮演 AI(Role-Playing Language Agents,RPLAs)作为大语言模型(LLM)的重要应用,近年来获得了广泛关注。
最近一段时间,智能体(Agent)再次成为 AI 领域热议的焦点。
灵活到像 CG,官方却说是一倍速实拍,国产机器人又整活了。
AI热潮将彻底颠覆编程行业。OpenAI首席产品官Kevin Weil抛出惊人预测,2025年,AI在编程领域将永远超越人类。这不仅仅是一个大胆的预测,更是一个时代拐点的宣告。
长文本任务是当下大模型研究的重点之一。在实际场景和应用中,普遍存在大量长序列(文本、语音、视频等),有些甚至长达百万级 tokens。
文心一言两周年,百度一口气上新两款模型,并且上来就是一个主题:免费。
36氪获悉,近日人形机器人公司松延动力北京科技有限公司(以下简称「松延动力」)完成连续两轮过亿元A轮及A+轮融资。A+轮由彬复领投,华强资本跟投;A轮投资方包括神骐资本、北京未来科学城基金、天启资本、泽然资本、教育科技集团战略方等机构。
“在AI时代,我们必须全面提升先进存力。”
“2025年会是AI智能体元年。” 开年的短暂时间里,关于智能体的押注再次如潮水涌现。
Khan Academy 和 Khanmigo 的创始人萨尔曼·可汗认为,人工智能可以为学生提供个性化的教学,同时让教师能够专注于他们最擅长的事情。
跨模态因果对齐,让机器更懂视觉证据!
在深度学习的多个应用场景中,联合优化多个损失项是一个普遍的问题。典型的例子包括物理信息神经网络(Physics-Informed Neural Networks, PINNs)、多任务学习(Multi-Task Learning, MTL)和连续学习(Continual Learning, CL)。然而,不同损失项的梯度方向往往相互冲突,导致优化过程陷入局部最优甚至训练失败。
最近的研究强调了扩散模型与表征学习之间的相互作用。扩散模型的中间表征可用于下游视觉任务,同时视觉模型表征能够提升扩散模型的收敛速度和生成质量。然而,由于输入不匹配和 VAE 潜在空间的使用,将视觉模型的预训练权重迁移到扩散模型中仍然具有挑战性。
7B小模型+3.8万条训练数据,就能让音频理解和推断评测基准MMAU榜单王座易主?
AI诈骗暴增3000%
这两天不知道为啥,有好几个朋友问我,为啥不把公众号文章做出一个知识库。
货物运营代理市场规模达260亿美元,作为货运代理,经纪人和承运商每天需要对接大量的供应商和零售商的信息,并进行针对性匹配和派单。这种简单重复的信息确认和录入工作大部分依靠人力完成,通过电话、短信、电子邮件和过时的软件解决方案拼凑经营业务,高昂的人力费用使得毛利不高的代理行业雪上加霜,加剧中小企业的压力。
Cursor 也学会「怠工」了?
NYT专栏作家Kevin Roose近期发文称,强人工智能要来,而人类尚未做好准备。当AI在数学奥赛中夺金,完成95%代码,深入到我们日常工作的每个角落时,人类真的做好迎接这个前所未有的技术革命了吗?
一首不因为音乐而火的歌。
AI搜索工具正席卷美国,近四分之一的人已抛弃传统搜索引擎。然而,最新研究揭露,这些工具在引用新闻时错误率高达60%,令人大跌眼镜。
国内首款全流程 AI 互动小说创作工具「谜境 Agent」于近日上线,该工具通过整合剧本生成、美术绘制、交互设计等模块,将传统需要 4-6 个月的开发周期压缩至 10 分钟内完成。
自由与好奇心是学术研究最宝贵的特质,正是对未知的执着探索,才能孕育改变世界的创新。
LMM在人类反馈下表现如何?新加坡国立大学华人团队提出InterFeedback框架,结果显示,最先进的LMM通过人类反馈纠正结果的比例不到50%!