果然来了!GPT-4.5贵有贵的道理?微软Phi-2精准超越谷歌;LLM怪诞心理学;斯坦福创业课精华笔记
果然来了!GPT-4.5贵有贵的道理?微软Phi-2精准超越谷歌;LLM怪诞心理学;斯坦福创业课精华笔记OpenAI GPT-4.5 遭泄露,我们即将见识「加强版」多模态大模型
OpenAI GPT-4.5 遭泄露,我们即将见识「加强版」多模态大模型
AI 视频生成有多卷?最近 Pika 的火热,重新带动了人们对 AI 视频生成的关注,甚至带动创始人父亲的上市公司接连涨停。
从设计、编码到测试、部署,甚至是运维……软件开发的整个流程,可以通通交给AI了!一款覆盖软件开发全生命周期的端到端AI智能助手,让分散的软件开发操作变得集成化、智能化。
斯坦福吴佳俊团队打造AI版“爱丽丝梦游仙境”巨作!
大语言模型(LLM)被越来越多应用于各种领域。然而,它们的文本生成过程既昂贵又缓慢。这种低效率归因于自回归解码的运算规则:每个词(token)的生成都需要进行一次前向传播,需要访问数十亿至数千亿参数的 LLM。这导致传统自回归解码的速度较慢。
尽管我们无法预料大模型会生成什么,也不知道算力和数据的极限在哪里,但生成式 AI 革命是不可阻挡的。
AI初创公司面临融资困境,投资者对于技术未经证实的公司持谨慎态度。大公司如OpenAI成为竞争对手,使初创公司面临更大市场压力。
「我要做一个星期七天的黄金时段新闻,」这是近期热播剧《新闻女王》里的一句台词。该剧讲述了几位主播在电视台内部明争暗斗的故事。人人都挖空心思,想全年无休连播七天黄金档。观众不禁感慨,他们真的太爱上班了。
甲方说的话太模糊,让你全靠想象?最新模型Creative Agents帮你实现创造式任务!
Gemini Pro API今天上线即免费,开发者可以通过Vertex AI定制自己的Gemini。同时,Gemini也将支持谷歌的AI代码助手——Duet AI。
过去我们谈AIGC,谈的是生成算法模型的突破创新,谈的是多模态技术的融合……而从来没有一个时刻像2023这般让我们距AI如此之近。
毋庸置疑,2023 年科技行业最重要的产品技术突破都来自大模型和生成式 AI 技术,上到各国政要精英,下到普通网友都见识到了大模型带来的突破性改变。年初,微软创始人比尔·盖茨在接受德国商报采访时就感慨:
“AIGC不会取代作家,它是创作的金手指。
今年10月,《时代》杂志发布了一份「2023最佳发明」榜单,为了呼应AI浪潮,《时代》从去年开始就特别设置了「AI单元」。在今年入选的十几个应用中,排在老牌软件巨头Adobe和屠龙少年OpenAI之后的就是大火的文生视频应用——Runway Gen-2。
即使经历了 11 月堪称「狗血」的 OpenAI 逼宫事件,Sam Altman 仍然无愧于时代周刊(TIME)颁发的年度 CEO 的称号,从 YC 到 OpenAI,Sam Altman 用他天才的商业头脑在一步步推动世界的改变,夸张点说,「以一己之力带领世界进入了 AGI 时代」。
彭博社报道,Mistral 正在完成 4.87 亿美元的融资,估值 20 亿美元,其中英伟达、Salesforce 参与,a16z 领投。
主打 AI 内容搜索和问答的产品 Perplexity AI 近日宣布他们的 iOS App 用户量突破 100 万,而 12 月 8 日也是 Perplexity AI 成立一周年。
本文讲述了一场拍卖会在AI领域引起的巨头间的人才争夺战,以及这场拍卖对科技巨头在人工智能领域的影响。一家在会议前紧急成立的公司以4400万美元的高价被拍卖,吸引了谷歌、微软、DeepMind和百度等巨头参与竞拍
让GPT-4操纵人形机器人,事先不做任何编程or训练,能搞成啥样儿? 答案是:太 猎 奇 了!
ChatGPT近期偷懒严重,有了一种听起来很离谱的解释:模仿人类,自己给自己放寒假了~
Transformer作者创立的大模型公司,再获5650万美元投资,换算成人民币有四亿多。
教大模型调用工具,已经是AI圈关注度最高的话题之一了。这不,又有一项研究登上最新NeurIPS 2023——它是一个叫做Chameleon(变色龙)的框架,号称能将大语言模型直接变成魔法师的工具箱,来自微软与加州大学洛杉矶分校(UCLA)。
开源模型正展现着它们蓬勃的生命力,不仅数量激增,性能更是愈发优秀。图灵奖获得者 Yann LeCun 也发出了这样的感叹:「开源人工智能模型正走在超越专有模型的路上。
上个月,微软 CEO 纳德拉在 Ignite 大会上宣布自研小尺寸模型 Phi-2 将完全开源,在常识推理、语言理解和逻辑推理方面的性能显著改进。
本文介绍了一个名为Alph-CLIP的框架,它在原始的接受RGB三通道输入的CLIP模型的上额外增加了一个alpha通道。在千万量级的RGBA-region的图像文本对上进行训练后,Alpha-CLIP可以在保证CLIP原始感知能力的前提下,关注到任意指定区域。通过替换原始CLIP的应用场景,Alpha-CLIP在图像识别、视觉-语言大模型、2D乃至3D生成领域都展现出强大作用。
最近,来自南大等机构的研究人员开发了一个通用的框架,用一段音频就能让照片上的头像讲多国语言。不论是头部动作还是嘴型都非常自然,看到很多不错的
最近,一张美国科技大厂的薪酬表曝出,OpenAI以500万起薪领衔。初创公司给出的薪酬,竟然超过了所有大型科技公司。不过初级码农,时薪却低至85元。
在视频生成场景中,用 Transformer 做扩散模型的去噪骨干已经被李飞飞等研究者证明行得通。这可算得上是 Transformer 在视频生成领域取得的一项重大成功。
都快到年底了,大模型领域还在卷,今天,Microsoft发布了参数量为2.7B的Phi-2——不仅13B参数以内没有对手,甚至还能和Llama 70B掰手腕!
随着大型语言模型(LLM)的发展,从业者面临更多挑战。如何避免 LLM 产生有害回复?如何快速删除训练数据中的版权保护内容?如何减少 LLM 幻觉(hallucinations,即错误事实)? 如何在数据政策更改后快速迭代 LLM?这些问题在人工智能法律和道德的合规要求日益成熟的大趋势下,对于 LLM 的安全可信部署至关重要。