哈工大訊飛聯(lián)合實驗室發(fā)布的中文ELECTRA系列預(yù)訓(xùn)練模型再迎新成員。我們基于大規(guī)模法律文本訓(xùn)練出中文法律領(lǐng)域ELECTRA系列模型,并且在法律領(lǐng)域自然語言處理任務(wù)中獲得了顯著性能提升。歡迎各位讀者下載試用相關(guān)模型。
項目地址:http://electra.hfl-rc.com
中文法律領(lǐng)域ELECTRA
我們在20G版(原版)中文ELECTRA的基礎(chǔ)上加入了高質(zhì)量2000萬裁判文書數(shù)據(jù)進行了二次預(yù)訓(xùn)練,在不丟失大規(guī)模通用數(shù)據(jù)上學(xué)習(xí)到的語義信息,同時使模型對法律文本更加適配。本次發(fā)布以下三個模型:
legal-ELECTRA-large, Chinese:24-layer,1024-hidden, 16-heads, 324M parameters
legal-ELECTRA-base, Chinese:12-layer,768-hidden, 12-heads, 102M parameters
legal-ELECTRA-small, Chinese: 12-layer, 256-hidden, 4-heads, 12M parameters
快速加載
哈工大訊飛聯(lián)合實驗室發(fā)布的所有中文預(yù)訓(xùn)練語言模型均可通過huggingface transformers庫進行快速加載訪問,請登錄我們的共享頁面獲取更多信息。
https://huggingface.co/HFL
模型鍵值如下:
hfl/chinese-legal-electra-large-discriminator
hfl/chinese-legal-electra-large-generator
hfl/chinese-legal-electra-base-discriminator
hfl/chinese-legal-electra-base-generator
hfl/chinese-legal-electra-small-discriminator
hfl/chinese-legal-electra-small-generator
效果評測
我們在罪名預(yù)測以及要素抽取任務(wù)上進行了基線測試。其中罪名預(yù)測任務(wù)使用的是CAIL 2018數(shù)據(jù),要素抽取任務(wù)為in-house實際應(yīng)用??梢钥吹奖敬伟l(fā)布的法律領(lǐng)域ELECTRA模型均相比通用ELECTRA模型獲得了顯著性能提升。
表1罪名預(yù)測任務(wù)

表2要素抽取任務(wù)

其他相關(guān)資源
TextBrewer知識蒸餾工具
http://textbrewer.hfl-rc.com
中文BERT、RoBERTa、RBT系列模型
http://bert.hfl-rc.com
中文XLNet系列模型
http://xlnet.hfl-rc.com
中文MacBERT模型
http://macbert.hfl-rc.com
責(zé)任編輯:xj
原文標(biāo)題:哈工大訊飛聯(lián)合實驗室發(fā)布法律領(lǐng)域ELECTRA預(yù)訓(xùn)練模型
文章出處:【微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
算法
+關(guān)注
關(guān)注
23文章
4810瀏覽量
98622 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5610瀏覽量
124663 -
訓(xùn)練模型
+關(guān)注
關(guān)注
1文章
37瀏覽量
4082
原文標(biāo)題:哈工大訊飛聯(lián)合實驗室發(fā)布法律領(lǐng)域ELECTRA預(yù)訓(xùn)練模型
文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
沐曦股份聯(lián)合上海人工智能實驗室發(fā)布高性能GPU算子生成系統(tǒng)Kernel-Smith
深化產(chǎn)學(xué)研協(xié)同 | 成都觀巖科技到訪嘉善復(fù)旦研究院,聯(lián)合實驗室合作再提速
NVIDIA 成立由全球領(lǐng)先 AI 實驗室組成的 Nemotron Coalition,推動開放前沿模型發(fā)展
3年10億,攜手攻堅:“AI計算開放架構(gòu)聯(lián)合實驗室”協(xié)同創(chuàng)新計劃正式啟動
北京化工大學(xué)與昱櫟技術(shù)聯(lián)合實驗室正式揭牌
中國汽研與國芯科技成立未來車芯驗證轉(zhuǎn)化聯(lián)合實驗室
科大訊飛發(fā)布訊飛星火X1.5及系列AI產(chǎn)品
強強聯(lián)合:之江實驗室與沐曦股份共建智算集群聯(lián)合實驗室
光峰科技與深圳技術(shù)大學(xué)簽署聯(lián)合實驗室合作協(xié)議
兆易創(chuàng)新與納微半導(dǎo)體數(shù)字能源聯(lián)合實驗室揭牌,加速高效電源管理方案落地
傳音控股與DXOMARK聯(lián)合影像實驗室落成
高鴻信安出席飛騰基礎(chǔ)軟件聯(lián)合實驗室第四屆年會
飛騰基礎(chǔ)軟件聯(lián)合實驗室第四屆年會暨技術(shù)交流分享會順利召開
愛普生與南山電子晶體電路評估聯(lián)合測試實驗室成立
奧迪威攜手華南理工大學(xué)共建聯(lián)合創(chuàng)新實驗室,校企深度合作助力產(chǎn)業(yè)升級
哈工大訊飛聯(lián)合實驗室發(fā)布的中文ELECTRA系列預(yù)訓(xùn)練模型再迎新成員
評論