北大千问团队推出数学专用版CriticGPT,“找茬”让大模型进步更快
北大千问团队推出数学专用版CriticGPT,“找茬”让大模型进步更快批评不仅能让人进步,也能让大模型的能力提升。
批评不仅能让人进步,也能让大模型的能力提升。
ChatGPT能耗惊人,该怎么解?谷歌DeepMind新算法JEST问世,让LLM训练的迭代次数降低13倍,计算量减少10倍,或将重塑AI未来。
基于 ChatGPT、LLAMA、Vicuna [1, 2, 3] 等大语言模型(Large Language Models,LLMs)的强大理解、生成和推理能力
OpenAI迟迟不上线GPT-4o语音助手,其它音频生成大模型成果倒是一波接着一波发布,关键还是开源的。
只要10k数据,就能让大模型的数学成绩增长5.6%。
没等到GPT-4o,商汤先把《Her》给发布出来了!
最近,一个对标 GPT-4o 的开源实时语音多模态模型火了。
“一天到晚就是跑分,刷榜,谁谁谁又超越GPT4了,OpenAI又出来sora了,又出来GPT-4o了等等。今天这个震撼发布,明天那个史诗级更新,但是我要问,应用在哪里?谁从中获益了?”
囤 GPU 真的像修铁路一样,是一项划算的投资吗?
谷歌的Gemma 2刚刚发布,清华和北航的两名博士生就已经成功推出了指令微调版本,显著增强了Gemma 2 9B/27B模型的中文通用对话、角色扮演、数学、工具使用等能力。