千呼万唤的可灵网页版来了!基础模型重磅升级,新功能“炸场”WAIC
千呼万唤的可灵网页版来了!基础模型重磅升级,新功能“炸场”WAIC“这可能是本届WAIC上欢呼声最多的一场发布”
搜索
“这可能是本届WAIC上欢呼声最多的一场发布”
随着AGI这一生产力背后的生产力的进一步发展进化,我们也期待通过不断的努力和探索,推动AGI的技术突破和价值实现,为人类社会创造更多的福祉。
市值140亿美元的初创公司Scale AI正在招聘博士训练LLM,用人成本的升高让该公司的毛利率在2023年有所下降,但创始人Alexandr Wang预计今年营收将增加两倍,突破十亿美元。
现实中,机器人收据收集可以通过远程操控实现。来自UCSD、MIT的华人团队开发了一个通用框架Open-TeleVision,可以让你身临其境操作机器人,即便相隔3000英里之外。
ChatGPT能耗惊人,该怎么解?谷歌DeepMind新算法JEST问世,让LLM训练的迭代次数降低13倍,计算量减少10倍,或将重塑AI未来。
基于 ChatGPT、LLAMA、Vicuna [1, 2, 3] 等大语言模型(Large Language Models,LLMs)的强大理解、生成和推理能力
7 月 4 日下午,由世界人工智能大会组委会办公室指导,世界人工智能大会组委会办公室主办,国家地方共建人形机器人创新中心、中国电子学会承办,机器之心、《机器人技术与应用》杂志协办的 2024 WAIC 世界人工智能大会人形机器人与具身智能发展论坛将于 7 月 4 日下午在上海世博展览馆举行。
今年是 AI 视频生成爆发的元年,以 Sora 为代表的算法模型和产品应用不断涌现。短短几个月内,我们目睹了几十种视频生成工具的问世,基于 AI 的视频创作方式开始流行起来。
大模型产业发展,需要可信中立的数据深加工平台,如何填补空白?
海明威的《太阳照常升起》中,迈克·坎贝尔说出了那个简短的名言:“逐渐地,然后突然地”( Gradually,and then suddenly)。
想象一下你在刷短视频,系统想要推荐你可能会喜欢的内容。
两分钟端到端从需求到应用,WAIC上这个国产开发神器火了!
什么?现在公务员处理政务,也都能用上模型了???
做最有挑战的事:把生成式 AI 送到每个人手上。
AI到底应该是什么样的
WPS AI如何重塑办公?
OpenAI迟迟不上线GPT-4o语音助手,其它音频生成大模型成果倒是一波接着一波发布,关键还是开源的。
只要10k数据,就能让大模型的数学成绩增长5.6%。
AIGC时代,视频创作这事儿真的不一样了。
没等到GPT-4o,商汤先把《Her》给发布出来了!
最近,一个对标 GPT-4o 的开源实时语音多模态模型火了。
“一天到晚就是跑分,刷榜,谁谁谁又超越GPT4了,OpenAI又出来sora了,又出来GPT-4o了等等。今天这个震撼发布,明天那个史诗级更新,但是我要问,应用在哪里?谁从中获益了?”
搜索技术是计算机科学中最难的技术挑战之一,迄今只有很少一部分商业化产品可以把这个问题解决得很好。大多数商品并不需要很强的搜索,因为这和用户体验并没有直接关系。
囤 GPU 真的像修铁路一样,是一项划算的投资吗?
在训练大型语言模型(LLM)时,Adam(W) 基本上已经成为了人们默认使用的优化器。
一转眼,2024 年已经过半。我们不难发现,AI 尤其是 AIGC 领域出现一个越来越明显的趋势:文生图赛道进入到了稳步推进、加速商业落地的阶段,但同时仅生成静态图像已经无法满足人们对生成式 AI 能力的期待,对动态视频的创作需求前所未有的高涨。
10年之后,90%的软件开发人员将拿不到他们从前的薪资。AI当道,是时候从「极客」开发者转型成为「六边形战士」——独立制作者了,越快越好!
谷歌的Gemma 2刚刚发布,清华和北航的两名博士生就已经成功推出了指令微调版本,显著增强了Gemma 2 9B/27B模型的中文通用对话、角色扮演、数学、工具使用等能力。
马斯克为Grok 3要豪掷近40亿美元狂买10万张H100,GPT-6的训练则可能要耗资百亿。然而红杉和高盛近日都给行业泼了冷水:每年要挣6000亿美元才能支付的巨额硬件支出,换来的却只是OpenAI 34亿美元的收入,绝大多数初创连1亿美元都达不到。而如果全世界的AI泡沫都被戳破,很可能就会导致新的经济危机。
AI 手机的「第一次世界大战」已经打响。