基础模型、长文本、数据库、应用落地:读懂大模型行业的关键问题
基础模型、长文本、数据库、应用落地:读懂大模型行业的关键问题3 月 23 日-24 日,聚焦全球开发者精英,由上海市人工智能行业协会(SAIA)主办的 2024 全球开发者先锋大会(2024 GDC)在上海举办。
3 月 23 日-24 日,聚焦全球开发者精英,由上海市人工智能行业协会(SAIA)主办的 2024 全球开发者先锋大会(2024 GDC)在上海举办。
在上个月推出视频生成模型 Sora 后,就在昨天,OpenAI 又发布了一系列创意工作者借助 Sora 进行的创作,效果极为惊艳。毫无疑问,就生成质量,Sora 是迄今为止最强的视频生成模型,它的出现不仅会直接对创意行业带来冲击,也会影响对机器人、自动驾驶领域的一些关键问题的解决。
3月24日,一加发布了他们新的性价比旗舰,一加ACE 3V。看起来这似乎并不算一场很重磅的发布会,但它却是第一批拥抱AI的中端智能手机,有着挺重要的象征意义。
在生成式人工智能(Generative AI)的信息技术跃迁背景下,如何看待知乎当下和未来,有三个基本的视角:
大模型技术革命爆发一年多,对大众来说,大模型神秘的样子逐渐清晰,AI 创业也从兴奋期慢慢开始务实。
随着现代医学的进步,机器人辅助手术技术日益成为业界焦点。手术机器人不仅提升了手术的精準度,也為为疗专业人员及患者带来了更优质的治疗经验
当我们感慨 AI 快把人类一锅端了时,有大聪明发现了 AI 的一生之敌——弱智吧。
中美AI投资和创业,有很大不同。
什么AI导演?明明就是个AI傀儡
8年未见马拉松,但时间到了2024年,hacker house的意义我们找到了。
近年来,人工智能发展迅速,尤其是像ChatGPT这样的基础大模型,在对话、上下文理解和代码生成等方面表现出色,能够为多种任务提供解决方案。
好家伙,现在随便打开一个大模型应用,支持的文本都有那————么长。
验证 GenAI 的商业价值,成为新老 Players 的共同课题。
谷歌就此成为了第一家因为训练数据而被罚款的人工智能公司。
Kimi的难题是商业模式,大厂的难题是获客。
AI 的发展让很多人直呼饭碗被抢了,以前是艺术家、程序员…… 现在配音员也要失业了?前有女歌星霉霉(泰勒・斯威夫特)大秀中文、小品演员蔡明在吐槽大会上说英文。现在又一款配音研究走红,即来自人工智能视频制作平台 Pipio 的视频自动 AI 配音工具 Pipio。
今年升级的重点在于引入了多模态大模型能力。
2024年3月14日,拜耳与德国Aignostics GmbH宣布将就几项应用于精准肿瘤药物研发的人工智能方法展开战略合作。Aignostics是世界一流医院柏林夏里特大学(Charité-Universitätsmedizin Berlin)的衍生公司,也是利用计算病理学将复杂的生物医学数据转化为生物学见解的全球领先企业。
3月27日,中央广播电视总台在博鳌亚洲论坛举办AI新品发布会,多部由总台制作的解读中华古籍典藏、诠释中国古典神话的AI新品与观众见面。来自全球26个国家的媒体记者,在现场见证了中华优秀传统文化与AI技术的“美妙相遇”。
AI 时代,在大模型能力还在进化、还在苦苦寻找 PMF 之前,创业者之间的交流和共识似乎变得更为重要。一次成功的尝试,或者是失败的反思;或者是最近的创业新方向和新收获;或者是对于某个垂直领域的新观察。
对于硕博来说,SCI论文写作是必备的科研技能,但很多同学都因为语言问题,对此有所恐惧....今年开始,有很多同学和我们说他们在用ChatGPT在协助中翻英写SCI,乐此不疲。
这一期,大家看封面也大概能知道,产品有点二次元风格。没错!这次我们介绍的均是娱乐属性比较强比较好玩的AI产品。个人尤其喜欢第三个,且随特工少女和特工大叔,来看看~
大连理工大学信息检索研究室在始智AI wisemodel.cn开源社区发布了司法大模型--太令(TaiLing)1.0版,“太令”是专门为司法领域定制的大语言模型,其训练基础是庞大的通用中文语料库,并结合了裁判文书、合同、司法考试材料以及司法问答等专业司法数据进行深度训练。
上下文长度真的能形成护城河吗?
Sora问世后,AI的话题声浪愈发高涨。 在舆论场上,“AI复活”已故明星遭到了家属和众多网友的抵制;国际时事中,英国凯特王妃的发声视频被质疑为AI所为,欧盟的《人工智能法案》已进入立法的最后阶段;互联网领域,字节跳动的AI新部门Flow推出AI社交APP“话炉”,加码探索AI赛道。
除了没有成熟商业模式,Stability AI更缺乏能力证明他们可以继续开发顶尖大模型。
由ChatGPT引发的AI浪潮席卷而来,在过去1年多时间里声势浩荡地渗入到每一个领域,AI PC、AI手机,甚至于AI家电。AI让人们的生活、工作、娱乐变得更加轻松、快捷,但现阶段仍存在算力不足的问题。
2022年底,OpenAI(美国人工智能研究公司)发布的大模型ChatGPT(对话生成式预训练大模型)引发了广泛关注。在“大模型+大数据+大算力”的加持下,ChatGPT能够通过自然语言交互完成多种任务,具备了多场景、多用 途、跨学科的任务处理能力。
随着 Sora 的成功发布,视频 DiT 模型得到了大量的关注和讨论。设计稳定的超大规模神经网络一直是视觉生成领域的研究重点。DiT [1] 的成功为图像生成的规模化提供了可能性。
图是组织信息的一种有用方式,但LLMs主要是在常规文本上训练的。谷歌团队找到一种将图转换为LLMs可以理解的格式的方法,显著提高LLMs在图形问题上超过60%的准确性。