概述
chatgpt及百度文心一言等产品是通用大语言模型,本项目将立足本国国情,研发一个垂类法律领域的大语言模型。从垂类这个角度出发,对标的是彭博社产品:BloombergGPT: A Large Language Model for Finance,整个项目预计研发费用投入5000万元。
需求详情
一、项目概述:chatgpt及百度文心一言等产品是通用大语言模型,本项目将立足本国国情,研发一个垂类法律领域的大语言模型。从垂类这个角度出发,对标的是彭博社产品:BloombergGPT: A Large Language Model for Finance,整个项目预计研发费用投入5000万元。二、核心需求描述:1、本次项目需要协助构建一个具有涌现能力但模型精巧设计的垂类法律领域的大语言模型,能够满足法律领域相关工作的需求,同时能够快速训练和部署,解决该领域中信息处理和知识获取的难题;2、该垂类法律领域的大语言模型的目标是优化法律领域中文本分析、知识提取和模型预测等关键工作;3、模型的设计应该考虑以下几个方面:灵活性、可解释性、训练效率、推理时间、技术架构,可以适应各种场景和任务;4、模型的技术架构基于Transformer架构,并使用深度学习技术对其进行训练。模型应该使用恰当的正则化手段以避免过拟合,同时可以考虑使用增量学习的方法以使模型更加灵活。该模型应该在云端上托管,通过API接口的方式,提供给调用方访问;5、在法律领域,由于特殊性和专业性,模型需要具有涌现能力与精巧涉及,40B左右规模,在模型效果和模型训练的效率之间取得平衡。该模型可为法律领域相关工作提供更加高效和更精准的自然语言处理应用服务。三、交付需求:需提供需解决技术问题方案,根据整个项目进展确认交付时间,达到我方要求满意为止。四、研发成果简介1.研发所处阶段目前,研究项目已经启动1个月,处于初始阶段。数据集已经采购了50万,因此数据清洗和标注工作也已开始。已组织数10名算法人员、并且匹配多个数据收集人员与产品经理和数据标注管理人员进行协同开发。为了确保项目的顺利开展,正在积极进行前期需求调研和技术探索。通过这些调研和探索,将能够更好地把握市场需求和技术趋势,确保项目产品能够顺利地开展运作。2.已投入资金介绍本项目仅为解决整个大项目其中一处模型设计相关难点,整个大项目已投入400万人民币资金来购置服务器设备。这些设备使用一机十卡H100,其中每个H100显卡的算力等同于9个40G的A100显卡。为保障项目在进行训练阶段,拥有足够计算资源。据统计,计算环境下,可以在大约5天内完成单个数据模型训练。3.已投入人力资源项目初始团队由12名专业资深算法人员、并且匹配多名数据收集人员与产品经理和数据标注管理人员进行协同开发组成。组成高效研发团队协同工作,以确保在时间和预算方面都能够控制好进展。算法人员主要负责在研发阶段设计和实现机器学习算法;数据收集人员主要负责在数据采集阶段从各种网络来源采集数据;产品人员主要负责产品的设计、开发和推广;数据标注管理人员主要负责数据集的质量管理和标注。4.成果应用在成果应用方面,本项目最终成果将是一个高质量的预训练模型,能够显著地提高模型的性能和降低模型成本。通过降低模型成本,公司可以更容易地推广和销售该模型。因此,本项目的成果应用具有重要的战略意义,将为公司带来长远的商业价值。由于目前处于项目启动阶段,现有科技成果正在产出中。 对揭榜方要求 1、宝山区AGI研发企业; 2、初创公司。最好不超过三年; 3、团队研发人员在85%以上,团队算法研发人员在70%以上; 4、高学历团队,硕士学位占比80%以上; 5、聚焦实战,一线研发人员要占比70%以上; 6、有过AGI研发案例,有相关顶会ICLR、AAAI、ACL、IJCAI、SIGIR等论文发表。
技术参数
产权归属、利益分配等要求研发活动所产生的一系列成果都归上海特赛发信息科技有限公司所有,本次项目所产生的效益也都归上海特赛发信息科技有限公司所有。