240万亿巨量数据被洗出,足够训出18个GPT-4!全球23所机构联手,清洗秘籍公开
240万亿巨量数据被洗出,足够训出18个GPT-4!全球23所机构联手,清洗秘籍公开是时候把数据Scale Down了!Llama 3揭示了这个可怕的事实:数据量从2T增加到15T,就能大力出奇迹,所以要想要有GPT-3到GPT-4的提升,下一代模型至少还要150T的数据。好在,最近有团队从CommonCrawl里洗出了240T数据——现在数据已经不缺了,但你有卡吗?
搜索
是时候把数据Scale Down了!Llama 3揭示了这个可怕的事实:数据量从2T增加到15T,就能大力出奇迹,所以要想要有GPT-3到GPT-4的提升,下一代模型至少还要150T的数据。好在,最近有团队从CommonCrawl里洗出了240T数据——现在数据已经不缺了,但你有卡吗?
网络安全厂商上海螣龙科技有限公司(以下简称“螣龙安科”),近日宣布成功完成数千万元A轮融资,由靖亚资本领投,老股东顺为资本跟投,密码资本担任独家财务顾问。资金将继续强化产品力及公司核心竞争力,为更多客户创造价值。
6月中旬,Iambic Therapeutics宣布完成超额认购的5000万美元B轮融资,由新投资者 Mubadala Capital 和 Exor Ventures 领投,卡塔尔投资局 (QIA) 以及老股东Abingworth、Illumina Ventures、Nexus Venture Partners、Coatue 和 Tao Capital Partners 参投。
或许是个朱啸虎看好的项目。 根据外媒消息,成立不到1年的日本人工智能初创公司SakanaAI,即将斩获超1亿美元融资,估值飚至1800亿日元(约合人民币82亿,11.5亿美元),即将跻身AI独角兽行列。
很长一段时间内,月之暗面都不会推出 Kimi 之外的第二款产品。
小红书作为一个深受年轻人喜爱的内容社交平台,似乎在AI领域一直保持低调。但实际上,小红书在AI方面也暗中做了不少工作。今天我们就来揭秘小红书的AI功能,看看它是如何悄然融入我们日常生活的。
上周,不少人发现微软官网忽然更新了一条“GPT Builder 即将停用”的通知。宣布将从7月10日起终止对Copilot GPT的支持,并会在四天内把平台上所有已创建的GPT连同相关数据全部删除。
AI的终点是电力。因为数据中心最终要实现可持续发展,净零碳排放,AI的真正的终点是清洁电力。
百度港股的市盈率从一年前的20多倍,跌到了11,不仅远低于携程的22,还低于不少消费股(海底捞市盈率17,安踏体育市盈率20,泡泡玛特市盈率43)。
等待下一个C端爆款 。从去年3月文心一言发布至今,百模大战这一年诞生了不少明星玩家,却仍走不出一个实打实的超头部模型。
不用打标签,也能解决视觉大模型的偏好对齐问题了。
入选CVPR 2024 Highlight的三维语义高斯泼溅最新成果,查询速度比之前的SOTA方法LERF快了199倍!
坏了!AI被发现偷偷篡改自己的奖励函数,并且欺骗研究人员,隐瞒这一行为。
何恺明入职MIT副教授后,首次带队的新作来了!
纽约大学计算机科学助理教授、图灵奖得主Yann LeCun的学生Alfredo Canziani开新课了!
3D场景理解让人形机器人「看得见」周身场景,使汽车自动驾驶功能能够实时感知行驶过程中可能出现的情形,从而做出更加智能化的行为和反应。而这一切需要大量3D场景的详细标注,从而急剧提升时间成本和资源投入。
在人工智能领域的发展过程中,对大语言模型(LLM)的控制与指导始终是核心挑战之一,旨在确保这些模型既强大又安全地服务于人类社会。早期的努力集中于通过人类反馈的强化学习方法(RLHF)来管理这些模型,成效显著,标志着向更加人性化 AI 迈出的关键一步。
或许从诞生那天起,LangChain 就注定是一个口碑两极分化的产品。
在英伟达市值猛涨、各家科技巨头囤芯片的热潮中,我们往往会忽视GPU芯片是如何转变为数据中心算力的。最近,一篇SemiAnalysis的技术文章就深入解读了10万卡H100集群的构建过程。
如何判断一个AI模型是否属于开源阵营?开源or闭源,到底哪种系统才更安全?最近,两位荷兰学者发表的一篇ACM FAccT论文给出了富有卓见的回答。
AI淘汰大部分人类似乎就是一场终局。OpenAI CTO在采访中称,一些创意性的工作会消失。今天,她再次发长文佐证自己的观点。而现在,AI取代大厂的一大批员工真真实实发生了。
中科大、上海AI实验室等组成的ShareGPT4V团队,推出了新的视频数据集,登顶HuggingFace排行榜!
每个人都能拥有有检测AI造假的“照妖镜”了!
刚刚,OpenAI收购了数据库初创公司Rockset。
“鸿蒙原生智能”Harmony Intelligence来了!
明明是最懂大 DAU 应用的大模型创业者,却最晚发布 toC 应用;
老朋友新朋友们大家好!欢迎来到全新的一期!
刚刚AI搜索又出新产品了,这次是前百度高管离职后创业融资6千万美元,推出的首个AI产品——Genspark。
“从横向来看,我们显然仍与国际顶尖工作如Sora和GPT-4o有显著差距;同时,从纵向来看,我们已经从十几年的nobody,快速成长为人工智能科技创新的关键推动者。面向即将到来的AGI时代,我们应该更加自信积极地投身其中。”