发展时间线
- 2022年11月30日,国外OPenAI公司的ChatGPT发布,大语言模型开始普及
- 2023年2月,国内ChatGPT开始进入国内视野大量媒体报道
- 2023年5月开始,基于开源ai大语言模型上用国内的法律条文和案例训练的国产法律大模型开始发布(以高校为主)
- 2023年底。随着llama模型升级,国产法律大模型更加智能,同时商业化落地产品开始出现
- 2024年由案例检索,合同审查为典型应用场景的国内法律AI产品开始推广应用
国内法律大语言模型现状
国内法律行业的大语言模型对比
大模型名称 | 日期 | 发布人 | 基础模型 | 推荐指数 |
---|---|---|---|---|
ChatLaw | 2023-06-28 | 北京大学深圳信息工程学院 | Anima-33B | 4星 |
LaWGPT | 2023-04-12 | 南京大学 | LLaMA | 4星 |
LexiLaw | 2023-05-16 | 清华大学 | ChatGlM 6B | 2星 |
獬豸(LawGPT_zh) | 2023-04-09 | 上海交通大学 | ChatGlM 6B | 3星 |
Lawyer LLaMA | 2023-04-13 | 北京大学 | LLaMA | 2星 |
韩非(HanFei) | 2023-05-30 | 香港中文大学 | LLaMA | 1星 |
lychee_law-律知 | 2023-07-13 | 德国萨尔大学,中国南京大学 | GLM-10B | 1星 |
智海-录问 | 2023-08-08 | 浙江大学,ali达摩院,华院计算 | Baichuan-7B | 1星 |
DISC-LawLLM | 2023-09-26 | 复旦大学 | Baichuan-13B-Base | 1星 |
夫子•明察 | 2023-08-31 | 山东大学,浪潮云,中国政法大学 | ChatGLM | 1星 |
国内法律大模型介绍
ChatLaw-法律大模型
- 地址:https://github.com/PKU-YuanGroup/ChatLaw
- 简介:由北大开源的一系列法律领域的大模型,包括ChatLaw-13B(基于姜子牙Ziya-LLaMA-13B-v1训练而来),ChatLaw-33B(基于Anima-33B训练而来,逻辑推理能力大幅提升),ChatLaw-Text2Vec,使用93w条判决案例做成的数据集基于BERT训练了一个相似度匹配模型,可将用户提问信息和对应的法条相匹配。
LaWGPT:基于中文法律知识的大语言模型
- 地址:https://github.com/pengxiao-song/LaWGPT
- 简介:该系列模型在通用中文基座模型(如 Chinese-LLaMA、ChatGLM 等)的基础上扩充法律领域专有词表、大规模中文法律语料预训练,增强了大模型在法律领域的基础语义理解能力。在此基础上,构造法律领域对话问答数据集、中国司法考试数据集进行指令精调,提升了模型对法律内容的理解和执行能力。
LexiLaw:中文法律大模型
- 地址:https://github.com/CSHaitao/LexiLaw
- 简介:LexiLaw 是一个基于 ChatGLM-6B微调的中文法律大模型,通过在法律领域的数据集上进行微调。该模型旨在为法律从业者、学生和普通用户提供准确、可靠的法律咨询服务,包括具体法律问题的咨询,还是对法律条款、案例解析、法规解读等方面的查询。
獬豸(LawGPT_zh): 中文法律对话语言模型
- 地址:https://github.com/LiuHC0428/LAW-GPT
- 简介: 本项目开源的中文法律通用模型由ChatGLM-6B LoRA 16-bit指令微调得到。数据集包括现有的法律问答数据集和基于法条和真实案例指导的self-Instruct构建的高质量法律文本问答,提高了通用语言大模型在法律领域的表现,提高了模型回答的可靠性和专业程度。
Lawyer LLaMA:中文法律LLaMA
- 地址:https://github.com/AndrewZhe/lawyer-llama
- 简介:开源了一系列法律领域的指令微调数据和基于LLaMA训练的中文法律大模型的参数。Lawyer LLaMA 首先在大规模法律语料上进行了continual pretraining。在此基础上,借助ChatGPT收集了一批对中国国家统一法律职业资格考试客观题(以下简称法考)的分析和对法律咨询的回答,利用收集到的数据对模型进行指令微调,让模型习得将法律知识应用到具体场景中的能力。
韩非(HanFei)
- 地址: https://github.com/siat-nlp/HanFei
- 简介: HanFei-1.0(韩非)是国内首个全参数训练的法律大模型,参数量7b,主要功能包括:法律问答、多轮对话、撰写文章、检索等。
lychee_law-律知
- 地址:https://github.com/davidpig/lychee_law
- 简介:该项目由德国萨尔大学团队和中国南京大学团队合作开发,开源一系列中文司法领域大模型,如Law-GLM-10B: 基于 GLM-10B 模型, 在 30GB 中文法律数据上进行指令微调得到的。
智海-录问(wisdomInterrogatory)
- 地址:https://github.com/zhihaiLLM/wisdomInterrogatory
- 简介:该项目由浙江大学、阿里巴巴达摩院以及华院计算三家单位共同设计研发的法律大模型,基于baichuan-7b进行了法律领域数据的二次预训练与指令微调,并设计了知识增强的推理流程。
DISC-LawLLM
- 地址:https://github.com/FudanDISC/DISC-LawLLM
- 简介:该项目由由复旦大学数据智能与社会计算实验室 (Fudan-DISC) 开发并开源的法律领域大模型,包括数据集,基于 Baichuan-13B-Base 进行微调的模型,且增加了检索增强模块。
夫子•明察司法大模型
- 地址:https://github.com/irlab-sdu/fuzi.mingcha
- 简介:该项目由是由山东大学、浪潮云、中国政法大学联合研发,以 ChatGLM 为大模型底座,基于海量中文无监督司法语料(包括各类判决文书、法律法规等)与有监督司法微调数据(包括法律问答、类案检索)训练的中文司法大模型。该模型支持法条检索、案例分析、三段论推理判决以及司法对话等功能
法律AI应用
1. MetaLaw(秘塔)–收费
- 地址:https://www.meta.law/
- MetaLaw是一个案例检索的工具网站(meta.law),其检索逻辑为“争议焦点——类案判决——类案判决AI总结、判决引用法条”。其核心优点是:相关案例检索
- 今年2月份一位律师朋友出“巨资”要求写一个AI案例检索应用。尝试了几个版本,效果都不好。(她甚至威胁要收回前期的订金)后来当秘塔AI开始商用的时候,试用的时候我们一致认可这个产品就是我们想做而没有做成功的ai案例检索应用。甚至比我们想象中的还要更加优秀。
- 类似的案例检索产品还有:
- 火眼AI助手
- 北大法宝,威科先行,法信,律商网等常规检索(非AI)
- 无讼
- 得理法搜
2.通义法睿
- 地址:https://tongyi.aliyun.com/farui
- 通义法睿是阿里云旗下AI法律顾问,拥有法律领域理解和推理能力,能够基于自然语言与人对话、回答法律问题、推送裁判类案、辅助案情分析、生成法律文书、检索法律知识。
- 背靠阿里ai全家桶,利用阿里通义千问能力的一个法律方向的助手。现在还有点弱,未来看阿里的资源投入了
3.得理法搜
- 地址:https://data.delilegal.com/
- 得理法搜是由深圳得理科技有限公司联合中科院先进院-得理法律人工智能实验室历经5年潜心研发推出的“AI驱动的法律数据智能引擎”。内含有1.3亿+篇裁判文书、300万+条法律法规、500万+法律知识、3.5亿+域名数据、6000万+商标数据、7000万+专利数据、200万+行业资讯等海量数据。在海量的数据基础上,得理法搜可进行专业的法律检索,内嵌的小理AI可基于自然语言与人对话,回答法律问题、生成法律文书。
4.星火法律咨询
- 地址:https://data.delilegal.com/
- 星火法律咨询提供了一个基于讯飞星火法律大模型的AI法律咨询服务,由科大讯飞研发。以下是该产品的一些关键特点和信息:
- AI专属顾问:利用讯飞星火法律大模型,为用户提供专业的法律咨询服务。
- 法律问答效果行业领先:通过全量法律法规、海量案例及问答数据训练,提供专业的法律依据和分析建议。
- 全案由覆盖:服务覆盖各种法律案由,满足不同法律咨询需求。
- 自定义知识库及功能插件:允许用户根据需要定制法律知识库和相关功能。
- 全场景灵活适配:提供Web、H5、外呼等多种产品形态,支持互联网SaaS及私有化部署,适用于不同的法律咨询场景。
5.其他法律ai
- 法唠AI:法律咨询 https://chatlaw.cn/
- 海瑞智法:法律对话 https://www.hairuilegal.cn/
- 一码千言:法律文书生成 https://ai.okwords.cn/
- 法小开:法务助理 https://www.huashikai.com/
- GenieAI:法律文档助手 https://www.genieai.co/
- LawGeex:合同助手 https://www.lawgeex.com/
- …
总结
- 在2024年4月,国内的AI法律应用开始步入商业化运营阶段。
- 我们注意到,国内自训练的法律大模型开始享受来自国外开源基础模型升级带来的智能加速。然而,也有一部分由于资金短缺而开始落后于版本更新的法律大模型。
- 当前商业化成功的国内法律大模型主要应用在案例检索、文书生成以及合同审查等领域。