像调鸡尾酒一样调制多技能大模型,智源等机构发布LM-Cocktail模型治理策略
像调鸡尾酒一样调制多技能大模型,智源等机构发布LM-Cocktail模型治理策略随着大模型技术的发展与落地,「模型治理」已经成为了目前受到重点关注的命题。只不过,在实践中,研究者往往感受到多重挑战。
随着大模型技术的发展与落地,「模型治理」已经成为了目前受到重点关注的命题。只不过,在实践中,研究者往往感受到多重挑战。
各家大模型纷纷卷起上下文窗口,Llama-1时标配还是2k,现在不超过100k的已经不好意思出门了。然鹅一项极限测试却发现,大部分人用法都不对,没发挥出AI应有的实力。
仅次于GPT-4,李开复零一万物Yi-34B-Chat最新成绩公布——在Alpaca经认证的模型类别中,以94.08%的胜率,超越LLaMA2 Chat 70B、Claude 2、ChatGPT!
EMNLP顶会落下帷幕,各种奖项悉数颁出。最佳长论文奖被北大微信AI团队收入囊中,由北大孙栩老师和微信周杰、孟凡东合作指导。
谁能想到,大模型风暴袭来,钢铁侠里的贾维斯俨然成了最忙碌的“漫威英雄”。原因无他,实在是超级助手这个概念太火爆,从手机到PC再到智能座舱,哪里都要被cue上一轮。
大模型长期以来一直存在一个致命的问题,即生成幻觉。由于数据集的复杂性,难免会包含过时和错误的信息,这使得输出质量面临着极大的挑战。过多的重复信息还可能导致大型模型产生偏见,这也算是一种形式的幻觉。
啥?AI都能自己看电影大片了?贾佳亚团队最新研究成果,让大模型直接学会了处理超长视频。
用多模态大模型来做语义分割,效果有多好?一张图+文字输入想分割的物体,大模型几秒钟就能识别并搞定!
大模型就是「造梦机」!幻觉是LLM与生俱来的特性,而非缺陷。OpenAI科学家Andrej Karpathy独特视角在AI社区掀起了激烈的讨论。
亮点与难点交相呼应;记得ChatGPT刚刚推出的时候,我见到的第一个应用案例是这样的:一位IT工程师朋友发朋友圈,说要带孩子出去郊游,但老师布置了作文。于是他干脆让ChatGPT写了一篇替孩子交差,不仅没被发现,还得了高分。