
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术在人工智能领域,大型预训练模型(如 GPT 和 LLaVA)的 “幻觉” 现象常被视为一个难以克服的挑战,尤其是在执行精确任务如图像分割时。
在人工智能领域,大型预训练模型(如 GPT 和 LLaVA)的 “幻觉” 现象常被视为一个难以克服的挑战,尤其是在执行精确任务如图像分割时。
AI,LLM,模型训练,人工智能
一群大模型玩你画我猜,人类一旁围观超起劲儿。 就像下面这张图展示的,由Grok画长颈鹿,一堆大模型根据生成内容猜答案。参赛选手包括GPT-4o、Claude、Llama、Gemini、Grok等。
AI技术日新月异,像Netflix这样的大公司已经开始用AI制作特效,而新的AI模型也在游戏和科学研究中超越了人类。未来一年,我们可能会看到没有编程技能的人也能创造热门应用,甚至AI创作的歌曲也可能登上音乐排行榜前十。
完整版o1图像理解能力,被提前「放出」了?网友曝出o1能够识图,进行推理总结。现在,o1多模态一大波试用已经铺屏全网。
人类世界的一切日常活动,都在《我的世界》中被1:1复刻了。1000亿AI智能体构成的文明,竟是这样的。
AI界也有了自己的“奥斯卡”,哪家大模型角色扮演更入戏? 来自香港科技大学、腾讯、新加坡管理大学的团队提出新综述—— 不仅系统性地回顾了角色扮演语言模型的发展历程,还对每个阶段的关键进展进行了深入剖析,展示了这些进展如何推动模型逐步实现更复杂、更逼真的角色扮演。
Transformer自问世后就大放异彩,但有个小毛病一直没解决: 总爱把注意力放在不相关的内容上,也就是信噪比低。 现在微软亚研院、清华团队出手,提出全新改进版Differential Transformer,专治这个老毛病,引起热议。
不少人怀疑,今年的诺奖“偷懒”了。 除了备受关注的诺贝尔生理学或医学奖“MicroRNA”相关研究外,今年诺贝尔化学奖、物理学奖均被AI相关研究拿下
几个月前,我不是发了篇这个么:《AI 产品沉思录:流量先行,窄业务、小产品/工具》,想着融点钱,攒个小团队,猛搞一番,结果不尽如人意,倒不是说事儿不行,主要是没得到金主相助,也没有稳定的团队快速复制,规模化并没有符合预期(预期是跑通了一个之后,直接复制N份自动跑)。
2024年10月22日,北京市教育委员会等四部门关于印发《北京市教育领域人工智能应用工作方案》的通知发布。
一年多前,ChatGPT 刚冒头的时候,我跟几个老板分享过我的「一人公司」+AI 的一些思路,刚才我翻了以下,大部分内容依然有效,总的来说是两块儿:围绕 AI 进行的内容 + 围绕 AI 开发的工具。
中国科学院上海营养与健康研究所李虹研究组多年来在抗癌药物疗效建模方向持续深耕,发表了基于分子组学预测药物响应和肝癌药物基因组相关的系列论文。但前期研究表明肿瘤用药的计算分析仍存在诸多挑战,例如:肿瘤临床前模型和病人存在差异,计算模型缺乏泛化能力;药物组合的作用机制复杂搜索空间大,对药物联用协同效果的准确和稳健估计仍很困难。
在数字化进程中,人工智能(AI)已经成为推动各行业创新和效率提升的重要力量,AI流程图生成工具以其独特的优势,正在逐渐改变我们的工作方式。
随着开源技术占据各大新兴领域的技术路线,其不断丰富人工智能领域的应用场景。 2023年,Meta 相继发布 Llama 和 Llama2,很快成为广受欢迎的开源大模型,也成为许多模型的基座模型。
他就是Bolt.new。它就像 v0和 Cursor 的结合,在你没有任何代码基础的情况下,可以高效、有效地编辑全栈程序。
Claude ,由 Anthropic 制作的 AI 聊天机器人,现在有了桌面应用程序。您可以从Anthropic 的网站免费下载 Mac 和 Windows 版本的应用程序。
红杉资本合伙人肖恩·马奎尔 在过去一年中因与埃隆·马斯克的友谊而声名鹊起,这帮助公司参与了 SpaceX 和 X 的热门融资轮。通过 X,红杉资本还将获得 xAI,马斯克的人工智能实验室的股份。
Sam Altman认为,人类历史发展的技术进步,就是通过创造更好的工具、再利用这些工具取得更惊人的成就。
改进KV缓存压缩,大模型推理显存瓶颈迎来新突破—— 中科大研究团队提出Ada-KV,通过自适应预算分配算法来优化KV缓存的驱逐过程,以提高推理效率。
只要一个3B参数的大模型,就能控制机器人,帮你搞定各种家务。 叠衣服冲咖啡都能轻松拿捏,而且全都是由模型自主控制,不需要遥控。 关键是,这还是个通用型的机器人控制模型,不同种类的机器人都能“通吃”。
11月2日,“AI你到老 陪伴一生”2024智慧居家养老(重庆)创享会(以下简称“创享会”)在重庆南坪国际会展中心会议中心举行。来自国内养老产业的顶级专家学者、资本以及优秀企业家、创业者们齐聚一堂,共同探讨智慧居家养老的新模式、新机遇。
AI自习室,教育新战场,有人哭有人笑的江湖
从0-500万美元ARR。
MPDS(Movie Posters Dataset)是一个创新的电影海报数据集,旨在解决现有图像生成模型在制作电影海报时面临的挑战。
Allegro 是一款先进的商业级视频生成模型,由Rhymes AI团队开发。它通过将描述性文本转换为动态视觉内容,为用户提供了一种灵活且可控的视频创作方法。
随着扩散生成模型的发展,人工智能步入了属于 AIGC 的新纪元。扩散生成模型可以对初始高斯噪声进行逐步去噪而得到高质量的采样。当前,许多应用都涉及扩散模型的反演,即找到一个生成样本对应的初始噪声。当前的采样器不能兼顾反演的准确性和采样的质量。
AI 智能体可以设计 AI 吗?
开源数据库引擎 SQLite 有 bug,还是智能体检测出来的!
两个月前,我们对 AI 游戏的认知刚刚被谷歌 GameNGen 颠覆。他们实现了历史性的突破,从此不再需要游戏引擎,AI 能基于扩散模型,为玩家生成实时可玩的游戏。