
售前電話
135-3656-7657
售前電話 : 135-3656-7657
國家高新技術企業 省級專精特新企業
咨詢熱線:135-3656-7657 400-6333-661
外部法律數據庫的建設,設有專門的法律編輯及技術團隊,需要安排專門的時間、地點進行工作,對于絕大多數律所而言,這并不經濟。
新三板上市文件可以堆積1.5米之高,律師團隊積攢7年的郵件也會超過10w+;前者人工整理1人至少需要3天,后者則需要3人整理2個月。
▲ 自動為郵箱中的文件打上標簽
而這些或許都可以借助AI技術,以效率更高,成本更少,成果更優的方式來實現。
整理的第一步是分類醫療智能問答系統的作用,分類是從文件資料中識別不同的特征進行標簽,而后進行區分整理。
利用NLP算法訓練出標簽分類模型,提取出關鍵知識維度,比如行業分類(醫療、房地產…)、文檔類型(訴狀、意見書…)、專業分類(民法、刑法…),自動進行標簽分組。實踐證明用該算法整理前述郵件,只用了2天。
▲ 構建標簽體系
這類標簽應用于律所內部數據,即形成一套律所專屬標簽體系,如同鑰匙碼,串聯起不同維度的律所知識成果,進行有效整理和應用。
3 搜索引擎:更好地應用數據
標簽建立的目的在于數據的有效應用,其有效提升的,是檢索效率。而檢索本身也有自己的技術突破,比如語義檢索。
《著作權法》、《專利法》和《商標法》統稱為“知識產權相關法律”。
在關鍵詞檢索下,輸入“知識產權”,結果多為《中華人民共和國知識產權海關保護條例》這樣明確帶有“知識產權”字符的行政法規;
▲ 知識產權關鍵詞檢索結果(左) 知識產權語義檢索結果(右)
而語義理解檢索,則能基于法律體系理解上位法與下位法之間的關系,在“知識產權”的檢索條件下,可以檢索出《著作權法》、《專利法》和《商標法》等知識產權相關法律文件。
語義檢索也是NLP技術的應用場景之一,其需要構建大量專業領域的數據集,并訓練出算法模型。
目前清華大學人工智能研究院自然語言處理與社會人文計算研究中心推出的多領域中文預訓練模型倉庫。
其中民事文書BERT(預訓練的語言表征模型)在超過2千萬篇法律民事文書上進行訓練,在民事文書相關任務領域,相比于世界搜索引擎巨頭中文BERT,其學習速度更快,詳見下圖。
▲ 民事文書BERT在訓練集上的學習速度
刑事文書領域亦如是。
該算法模型不僅可以用于公開領域的數據檢索,亦可用于律所內部數據的檢索,可以有效提高知識的檢索效率,結合標簽體系,形成律師個人或團隊的獨有知識庫。
未來:從知識管理到知識發現
智能引擎已經逐漸從搜索引擎走向推薦引擎,律所知識庫建設也從管理走向發現,未來的知識世界,將從人去找知識進化為知識來找人。
1 知識的主動推薦
當律師在寫作X公司專利侵權相關法律文件時,系統將會主動推薦相應信息。
比如:X公司相關知識產權、訴訟案件、企業信用等信息;與案件相關的判例、研究報告等;主審法官的歷審案例醫療智能問答系統的作用,對手律師的相關案例等;以及本所律師相關案件、知識成果等。
主動推薦不僅可以有效提高律師的信息獲取效率,也能起到查漏補缺的效用。
機器將從幫助人更具效率地完成工作轉變為幫助人發現其原本發現不了的機會點。
▲ 知識的智能推薦
同時,也會根據律師個人或常聯系人員近期的關注領域、在辦案件等,主動推薦相關行業熱點、公開報告等,進行個性化推薦,提高律師專業領域的信息嗅覺。
對于律所而言,則有利于共享社區建設,類似于知乎、豆瓣等社區推薦引擎,聚合同專業、同領域或相同關注點的律所成員,強化專業領域的交流,交流信息沉淀下來亦是一重知識成果,有利于律師協同,助力法律服務產品的研發。