若愚科技推出九天机器人大脑,大模型总参数规模达130亿
若愚科技推出九天机器人大脑,大模型总参数规模达130亿若愚科技与哈工深联合研发了语言大模型基座---立知和多模态大模型基座---九天,总参数规模达130亿,训练数据超1500B tokens, 能完成多任务、多轮对话、中英翻译、思维链、工具使用等多种类型的指令数据
搜索
若愚科技与哈工深联合研发了语言大模型基座---立知和多模态大模型基座---九天,总参数规模达130亿,训练数据超1500B tokens, 能完成多任务、多轮对话、中英翻译、思维链、工具使用等多种类型的指令数据
想将一份文档图片转换成Markdown格式?这一次,只需一句话命令,多模态大模型Vary直接端到端输出结果:
12 月 15 日-12 月 17 日,由 Founder Park、飞桨、文心大模型联合主办的 AGI Hackathon 经过两天的创新开发和第三日的路演,目前已全部结束。
游戏行业真在加速拥抱大语言模型等AI技术,不论是大厂还是独立游戏制作人,都开始依靠LLM的技术创立全新的AI NPC体验。
AI时代,中国大模型进展到哪了?12月20日,「数字力量,探索无穹」2023探索大会上,新智元创始人&CEO杨静,与百川智能技术联创陈炜鹏、商汤科技数字文娱事业部总经理栾青、蓝驰创投投资合伙人石建平共话中国大模型的创新探索。
生成式AI将成为未来企业在竞争中优势的重要来源。企业现在面临的关键问题已经不是要不要上大模型,而是如何让大模型落地,为企业创造真正的价值。
激发大模型解决复杂问题的重要技术之一CoT,如今要被颠覆了?谷歌DeepMind斯坦福UC伯克利共同提出了「代码链」(CoC),让LLM在代码中学会了思考。
谷歌发布Gemini以后,一直宣称Gemini Pro要优于GPT-3.5,而CMU的研究人员通过自己实测,给大家来了一个客观中立第三方的对比。结果却是GPT-3.5几乎还是全面优于Gemini Pro,不过双方差距不大。
在Transformer占据多模态工具半壁江山的时代,大核CNN又“杀了回来”,成为了一匹新的黑马。
身价1050亿美元,每天还在亲自动手敲代码!?就连谷歌最新大招Gemini大模型的核心贡献者名单中,也有他的名字。