
图像领域再次与LLM一拍即合!idea撞车OpenAI强化微调,西湖大学发布图像链CoT
图像领域再次与LLM一拍即合!idea撞车OpenAI强化微调,西湖大学发布图像链CoTMAPLE实验室提出通过强化学习优化图像生成模型的去噪过程,使其能以更少的步骤生成高质量图像,在多个图像生成模型上实现了减少推理步骤,还能提高图像质量。
MAPLE实验室提出通过强化学习优化图像生成模型的去噪过程,使其能以更少的步骤生成高质量图像,在多个图像生成模型上实现了减少推理步骤,还能提高图像质量。
在近期大热的人形机器人、具身智能赛道,宇树科技是最头部公司之一。
《智能涌现》独家获悉,AI独角兽“智谱”近期完成新一轮融资,金额为30亿元。新投资方包括多家战投及国资,君联资本等老股东继续跟投。
利用数据和AI驱动的方法,建立反馈评估-自学习-验证的闭环,是企业Agent应用加速成功的关键。
大模型的2024,经历了漏斗秩序的残酷检验
在过去的两年里,风险投资圈,以及广泛的技术生态中,关于 AI 原生应用的发展前景展开了深入讨论。我们目睹了技术价值从底层基础设施,逐步向平台和应用层转移的趋势,看到了对 AI Agent 演进的强烈关注,以及关于各个垂直领域 AI 应用发展的众多深入研究。
OpenAI连续12个工作日的直播继续进行,完全版的o1,跳票很久的Sora和GPT-4o的高级语音模式,最新的ChatGPTProjects功能纷纷上线,其中还夹杂着一些关于AGI的符号性植入,仿佛在暗示这场马拉松式新品发布的压轴大戏会与AGI密切相关。
根据Layoffs.fyi的统计数据,截至12月2日,全球科技公司已经至少裁员了14.9万个人。这不是普通的裁员潮,而是一场产业生态的重塑。
ChatGPT今天带来的是搜索功能方面的一些迭代升级(更像谷歌了)。根据用户反馈,优化搜索体验,移动端搜索更快,并能搜索出多模态信息;结合前几日发布的Her功能,可以在实时通话的时候进行语音搜索;
国产大模型,正在引领 AI 技术新方向。 今天上午,月之暗面 Kimi 正式发布了视觉思考模型 k1,并已经上线了最新版的网页版以及安卓和 iOS APP。
Gemini 2.0说说话就能一键P图的功能爆火,把玩不了的大伙儿都馋哭了!
硬氪获悉,万勋科技(深圳)有限公司(以下简称「万勋科技」)近期完成近2亿元A轮、A+轮和A2轮系列融资。A轮投资由昊辰资本领投,蓝驰创投及顺为资本全额追投;A+轮由北京机器人基金领投,蓝驰创投全额追投;A2轮由元钛基金领投、德虎资本跟投。庚辛资本、万世资本共同担任A轮系列融资的财务顾问。
继本月初马斯克向法院申请禁令阻止 OpenAI 转型营利性组织,Meta 近日也向加州总检察长 Rob Bonta 发出一封信,呼吁阻止 OpenAI 将其结构转变为营利性公司。
全球首个端侧全模态理解开源模型来了!
博士级别的ChatGPT可能要来了,但价格比每月工资还高?!
这几天,学术圈的小伙伴肯定都很关注正在加拿大温哥华举办的机器学习顶会——NeurIPS 2024。本届会议于今日落下帷幕,共接收 15671 篇有效论文投稿,比去年增长了 27%,最终接收率为 25.8%。
安全话题,在人工智能(AI)行业一向备受关注。
12 月 12 日,由中国人工智能产业发展联盟(AIIA)指导、北京中关村科金技术有限公司主办的【2024 大模型技术与应用创新论坛】在北京成功举办。
病理是疾病诊断的「金标准」,而我国面临病理诊断人才严重匮乏窘境。近年来癌症发病率不断攀升,如何借助 AI 赋能医生精准诊断,提高工作效率及医疗质量,成为当前世界病理学科的前沿热点。
人工智能技术正以前所未有的速度改变着我们对世界的认知与构建方式。近期,李飞飞教授团队通过单张图片生成三维物理世界的研究,再次向世界展示了空间智能技术的巨大潜力。
前段时间 Menlo VC 对今年 AI 发展情况的总结报告我觉得是写的不错的,这个报告将聚焦点放在了企业级 B 端市场,这也是我观察今年 AI 在应用里发展最明显的一个趋势。
最近,语音人工智能初创公司 ElevenLabs,在他们的 ElevenReader 应用中推出了一个叫做 GenFM 的功能,这个功能能通过我们上传的内容,快速制作一期由两名 AI 对话交流的播客。
印尼如今是东南亚增长最快的经济体之一,商品总值接近2000亿美元,预计到2030年将达到3000亿美元。人工智能将成为推动发展的一大倍增器,可能会让我们的经济增长达到5000亿,影响每个人的生活。
Moonvalley 是一家位于洛杉矶 AI 生成视频公司,在 Discord 上拥有超过 10 万名用户,discord 提供了一个互动平台,用户可以分享经验、反馈和创作。
12月初,豆包和即梦在移动端悄然上线了一项新功能:能够生成带有工整中文字体的图片。一时间,朋友圈被各种AI制作的四格漫画、产品海报、电影海报刷屏。
讯飞医疗的拆分上市,终于有了新的进展。 港交所文件显示,12月12日,讯飞医疗科技股份有限公司通过港交所上市聆讯。该公司今年7月提交上市申请,华泰国际、广发证券(香港)、建银国际为联席保荐人。
AI带来的机遇远比科技行业面临的所有机遇要大,但这需要初创企业转变观念,不再寻求颠覆和摧毁老牌企业,而是改造它们,因为初创企业在很多方面都处于劣势。成功应用AI需要两样东西:大量数据和昂贵的算力。大公司正好拥有这两样东西。
AI应用专业化发展,企业需全员学习用AI。
通用语言模型率先起跑,但通用视觉模型似乎迟到了一步。究其原因,语言中蕴含大量序列信息,能做更深入的推理;而视觉模型的输入内容更加多元、复杂,输出的任务要求多种多样,需要对物体在时间、空间上的连续性有完善的感知,传统的学习方法数据量大、经济属性上也不理性...... 还没有一套统一的算法来解决计算机对空间信息的理解。
12月12日,北京大学-字节跳动“豆包大模型系统软件联合实验室”签约仪式暨“面向大模型的智能化软件技术与生态”学术研讨会在北京大学英杰交流中心隆重举行。