



近日,国务院国资委集中发布了首批10余个行业30项央企人工智能行业高质量数据集优秀建设成果,中国电科司法领域高质量数据集成功入选。
中国电科在国务院国资委的指导下,以央企“AI+”专项行动为契机,以司法领域高质量数据集为抓手,全面推进人工智能科技创新、产业发展和赋能应用,已形成一批标志性成果,并赋能行业高质量发展。
最高人民法院联合中国电科组建的中国司法大数据研究院是我国公共数据资源授权运营的先行先试单位,自成立以来便在司法领域高质量数据集建设方面积极探索。组建数据标注团队,构建基于法律知识体系指引的数据标注系统,通过“人机协同”方式,长期开展专业领域数据标注。以积累的“法律法规、司法解释、指导案例、裁判文书”等作为基础数据源,归纳形成包括“法律问答、法条推荐、案件认知”等在内的27类司法语料库,共计550万对精调语料,精心打造数亿条知识条目,形成一套专业的法律大模型语料和知识库。结合法律实务,发布法律大模型测试数据集,可在问题记忆、问题理解、逻辑推理、结论生成和内容安全方面对法律大模型进行全面的质量评估。
后续,中国电科将联合重点行业主管部门与产业链相关企业,加快汇聚行业内跨区域、跨层级的通识类和专识类数据集,牵引带动产业各方深化数据要素协同共享、优化数据资源高效安全开发利用,加快推进高质量数据集落地验证与迭代优化,营造更加繁荣活跃的数据产业生态。