ChatLaw是由北京大学团队开源的AI法律大语言模型,它通过法律领域特定的数据集,旨在提高法律问题处理的准确性和效率。
该模型利用先进的自然语言处理技术,能够理解和生成法律相关的咨询和解答,同时减少法律数据筛选中的模型幻觉问题。
ChatLaw的设计考虑了法律语言的复杂性和法律知识更新的快速性,力图为法律专业人士和普通用户提供高质量的法律信息服务。
算网上线镜像 ChatLaw-Text2Vec,是一个基于近百万条真实法律案例精调而成的 embedding,它能将复杂的法条与诉求转化为精准的高维数字指纹,从而实现毫秒级的法律知识对齐与关联检索。
该模型利用了 936,727 条 全国真实案例库数据集进行深度训练。它擅长理解“法律黑话”,能识别出“股权转让”与“对价协议”之间的深层语义联系。
构建法律向量数据库、智能纠错、类案检索等 RAG(检索增强生成)系统应用场景,它是“心脏”。
如何部署?
首先打开官网:https://sumw.com.cn/,立即体验。
输入手机号,接收验证码登录。
进入算力市场选择GPU。
下拉找到镜像,社区镜像,点击选择ChatLaw镜像,选择版本,确认租用。
等待启动。
点击jupyterlab登录。
登录后界面是这样的。
然后按下列步骤完成即可体验。
1,激活虚拟环境
首先,确保进入预装了 torch_mlu 和相关依赖的 Python 环境。
source /torch/venv3/pytorch_infer/bin/activate
2,进入项目目录
进入存放模型和脚本的指定目录。注意: 这里的目录路径需与你的实际存放位置一致。
cd /mnt/ChatLaw-Text2Vec
3,运行演示脚本
执行我们精心准备的 legal_emb_demo.py。该脚本会自动完成:CPU加载 -> FP16转换 -> MLU搬迁 -> 向量化计算 -> 相似度排序。
python legal_emb_demo.py