日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

什么是句法分析

深度學習自然語言處理 ? 來源:CS的陋室 ? 作者:CS的陋室 ? 2020-11-24 09:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

自然語言處理課程的第二天今天總算是補完了,課程的時間有限,但是內(nèi)容繁多,而且都是能深挖的大坑,我的主要研究重點不在這里,所以無法展開,下面是我對這次課的簡單介紹和筆記,來自深藍學院。

什么是句法分析 1

按照百度百科的解釋就是指對句子中的詞語語法功能進行分析,例如“我來晚了”中,“我”是主語,“來”是謂語,“晚了”就是補語。這塊內(nèi)容其實在語言學等領域已經(jīng)有比較深入的研究,但是隨著數(shù)據(jù)的逐漸增多,這種分析就需要利用計算機自動化,句法分析就是這樣誕生的。

那么句法分析到底有什么用呢?句法分析的結果是一句話的句子成分分析,其實就可以用來做知識發(fā)現(xiàn)和挖掘,例如“張三是李四的兒子”,通過句法分析,能夠知道主謂賓等關系,能夠抽取具體的消息,例如這里能夠獲取一個關系——張三和李四是父子關系,根據(jù)這些知識,無論是做知識圖譜,還是做問答機器人等,都有大的作用,可見,句法分析是知識抽取的重要基礎。

句法分析的評價指標 2

要深入研究句法分析,首先要知道,什么樣的句法分析算是好的句法分析,所以句法分析方法的評價是首要思考的問題,目前進行句法分析,主要是用依存句法分析,其具體的評價指標有下面5種。

無標記依存正確率(UAS):所有詞中找到正確的頭詞所占的百分比,對于沒有頭詞的根節(jié)點,只要根節(jié)點是對的,也將這個根節(jié)點算作其中(Nivre et al., 2004)

根正確率(RA):所有句子中找到正確根的句子所占的百分比(Yamada and Matsumoto, 2003)

完全匹配率(CM):所有句子中無標記依存結構完全正確的句子所占的百分比(Yamada and Matsumoto, 2003)

帶標記依存正確率(LAS):所有詞中找到正確的頭詞并分配到正確標記的詞所占的百分比,對于沒有頭詞的根節(jié)點,只要根節(jié)點是對的,也將這個根節(jié)點算作其中(Nivre et al., 2004)

標記正確率(LA):所有詞中依存標記正確的詞所占的百分比,只要根節(jié)點是對的,也將這個根節(jié)點算作其中(Nivre et al., 2004)

對現(xiàn)行方法的簡單評價 3

首先看看英文的,英文畢竟是目前自然語言處理的主力和焦點,而且英語具有相對嚴禁的語法結構。

本身UAS的定義相比CM,就較弱,而且USA是無監(jiān)督的方法,所以會比CM的正確率高很多。從CM看來,正確率不足50%,其實并不高,可見依存句法分析任重道遠。

然后看中文,中文的自然語言處理相對比較難,一方面是中文本身的語法特性,另一方面中文分詞的時候本就有誤差,再進行句法分析會產(chǎn)生誤差疊加。

可以明顯地看到,UAS和CM相比英文會更加低,說明中文的難度會比英文高,目前的潛力仍比較強。

綜上所述,目前雖然已經(jīng)有比較豐富的方法,但是準確度還有比較大的上升空間。

句法分析的主要方法 4

糾結了很久,想了要怎么寫,要是詳細些,這就不是公眾號,是書了,要是不詳細寫,又怕你們罵我,于是我想了一個比較中和的方案,那就是我弄綜述,參考文獻給你們,有興趣的你們自己去看,你們覺得怎么樣?

句法分析,尤其針對依存句法分析,主要有基于動態(tài)規(guī)劃,基于決策,基于融合的方法,當然還有一些擴展性的方法。

基于動態(tài)規(guī)劃的方法

基于動態(tài)規(guī)劃的方法,其實就是直接對依存樹進行分析。早期,采用的方法是將依存圖中的節(jié)點看作短語結構中的節(jié)點,從而可以應用上下文無關文法中成熟的CKY算法(Gaifman, 1965),然而時間復雜度非常可怕地達到了O(n5),后來提出了雙詞匯語法,其方法主要分為產(chǎn)生式方法(Eisner, 1996)和判別式方法(McDonald et al., 2005; McDonald, 2006),成功地將復雜度降低到O(n3)。

生成式和判別式和機器學習里面的生成和判別相同,生成式方法采用聯(lián)合概率模型生成一系列依存句法樹并賦予其概率分值,然后采用相關算法找到概率打分最高的分析結果作為最后的輸出,說白了就是把概率分布求出來,然后根據(jù)概率分布進行下一步的分析和決策,在句法分析中將詞與詞之間的依存關系看作是成分結構,用類似于短語結構句法分析的方法來獲取依存關系,其優(yōu)點是能夠得到每種決策的概率關系,決策更加全面,但是缺點是畢竟在相同的信息下,相比判別式整體決策精度可能會下降,其信息消耗花在進行計算概率分布上太多,導致最后拍板的時候受到約束。

判別式將依存分析看作是在一個依存圖上尋找最大生成樹(MST)的問題,該生成樹滿足上述三個約束條件:連通、單一父節(jié)點、無環(huán),并不需要求概率分布,相比生成式,其優(yōu)點是操作更為簡單,可以運用更多的機器學習方法,而且出現(xiàn)下溢的情況更少(計算機在計算10的負好多次方的時候會出現(xiàn)下溢情況,精度會大大下降),復雜度相對較低,最終精度偏高。

基于決策的方法

基于決策的方法把分析過程看成是分析序列,建立詞之間的聯(lián)系,Covington(2001) 將決策的過程從句子的左端開始,逐個接受每個詞,并嘗試連接每個詞與先前的詞并將其作為頭詞或依存詞,這種算法簡單易懂,但是窮舉法計算低效而且受到語料庫約束較大;Yamada和Matsumoto(2003)通過將關系分為左依存、右依存和無依存三種情況進行動作分析從而得到句法結構;Nivre和Scholz(2004)在Yamada和Matsumoto(2003)的基礎上提出新的數(shù)據(jù)結構和動作分析方法,依存句法分析器主要由一個三元組構成,其中S表示一個棧結構, I表示剩余輸入詞序列, A表示在當前分析狀態(tài)下所得到的依存關系集合,將動作從原來的3個升級為Left-arc, right-arc, reduce, shift四個。

從整體而言,基于決策的方法模型直觀清晰,但是決策過程是貪婪的,局部的,精度收到很大限制,誤差還會傳遞,所以仍存在較大問題。

基于融合的方法

機器學習中有基本的支持向量機、決策樹等優(yōu)秀的方法,但是卻各有問題,于是提出了bagging,而基于融合的方法,將上述兩個方法的優(yōu)點結合。

基于搜索策略融合的方法(Duan et al., 2007)認為整個決策式依存句法分析過程可以看作是馬爾科夫鏈。在每一步分析中會有若干個候選分析動作。句法分析的目標是在馬爾科夫假設下尋找最有可能的分析動作序列,這樣既可以利用豐富的上下文特征,又從全局的視角對決策動作建模,而算法的復雜度介于決策式方法和動態(tài)規(guī)劃方法之間。按照他的說法進行實驗得到的精度是這樣的,可見優(yōu)化了不少。

基于特征的融合方法(Nivre and McDonald, 2008)在McDonald和Nivre(2007)的“不同的句法分析器產(chǎn)生不同的錯誤”觀點下提出兩種思路,如下圖所示(符號太復雜所以我就截圖了):

最后還有基于模型的融合方法,Zhang和Clark(2008)將動態(tài)規(guī)劃的方法和決策的方法進行加權組合。

擴展性工作

受限于樹庫規(guī)模較小,尤其是有標注的材料太少,所以句法分析的性能一直受到嚴重限制,目前有部分學者開始在有限的標注材料和較多的無標注材料下,使用半監(jiān)督或者無監(jiān)督的方法。

面臨的挑戰(zhàn) 5

前人尚且已經(jīng)在句法分析上有豐碩的成果,但是下面幾個方面仍有巨大的研究價值和研究潛力。

句法分析的準確度仍十分有限;

句法分析的評價指標是否合理目前尚無定論,CoNLL仍有一些問題,而且有人針對多個角度,例如語種等,有無更加靈活的機制;

句法分析的魯棒性仍不夠高,和評價指標的靈活性類似;

句法分析的速度,目前仍無法投入大數(shù)據(jù)的實現(xiàn),然而速度和精度的兩大矛盾體的存在性導致兩者相互制約;

運用在互聯(lián)網(wǎng)中的研究仍處起步階段,主要針對句法分析的下游技術,面向信息抽取的句法分析,面向社區(qū)問答的句法分析等;

句法分析并不是上游技術,需要依賴分詞、詞性標注等關鍵技術,這些技術同樣具有較大誤差等問題,于是誤差的傳遞下句法分析的性能受到較大約束。

小結 6

句法分析不是我的主要研究重點,也沒太關注過這個重點,經(jīng)過一些相關材料的閱讀和學習,感覺還是有很大的研究空間,后續(xù)可能會有一些深入的閱讀,擴充自己的知識面,也讓自己應對各種問題多了一把新的有力武器。

責任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4810

    瀏覽量

    98610
  • CM
    CM
    +關注

    關注

    0

    文章

    29

    瀏覽量

    23676
  • 自然語言處理

    關注

    1

    文章

    630

    瀏覽量

    14737

原文標題:句法分析綜述

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    VirtualLab:光柵的優(yōu)化與分析

    | | 光柵是光學工程師使用的最基本的工具。為了設計和分析這類組件,快速物理光學建模和設計軟件VirtualLab Fusion為用戶提供了許多有用的工具。其中包括參數(shù)優(yōu)化,以輕松優(yōu)化系統(tǒng),以及參數(shù)
    發(fā)表于 04-23 08:17

    頻譜分析儀與信號分析儀的區(qū)別

    在現(xiàn)代電子測量領域,頻譜分析儀與信號分析儀是兩種廣泛應用且功能強大的儀器,它們在無線通信、雷達系統(tǒng)、電子對抗及科研開發(fā)中發(fā)揮著不可替代的作用。盡管兩者均用于信號的采集與分析,功能上亦有交集,但其設計定位、
    的頭像 發(fā)表于 03-17 15:29 ?268次閱讀
    頻譜<b class='flag-5'>分析</b>儀與信號<b class='flag-5'>分析</b>儀的區(qū)別

    網(wǎng)絡分析儀時域分析:原理、操作與應用

    當需要定位傳輸線故障、分析阻抗連續(xù)性或觀察寬帶響應時,網(wǎng)絡分析儀(VNA)的時域分析功能比傳統(tǒng)頻域測量更直觀有效。它通過數(shù)學變換將頻域S參數(shù)轉(zhuǎn)化為時間或距離函數(shù),揭示被測器件(DUT)的內(nèi)部特征
    的頭像 發(fā)表于 02-03 13:59 ?276次閱讀
    網(wǎng)絡<b class='flag-5'>分析</b>儀時域<b class='flag-5'>分析</b>:原理、操作與應用

    API數(shù)據(jù)分析:淘寶流量來源分析,渠道優(yōu)化!

    ? 在電商領域,流量來源分析是優(yōu)化營銷策略的核心。淘寶作為中國領先的電商平臺,其流量數(shù)據(jù)可通過API(應用程序接口)高效獲取和分析。本技術帖將逐步指導您如何利用淘寶API進行流量來源分析,并基于數(shù)據(jù)
    的頭像 發(fā)表于 01-23 13:42 ?430次閱讀
    API數(shù)據(jù)<b class='flag-5'>分析</b>:淘寶流量來源<b class='flag-5'>分析</b>,渠道優(yōu)化!

    移動BI可視化分析助力決策分析應用

    ?在數(shù)聚股份看來,移動商務智能(Mobile Business Intelligence, 以下均簡稱移動BI) 是指通過使用移動終端設備,使得用戶能夠隨時隨地獲取所需的業(yè)務數(shù)據(jù)及分析展現(xiàn),完成獨立
    的頭像 發(fā)表于 12-03 16:48 ?710次閱讀

    紅外光譜技術應用與原理分析

    分析檢測領域,紅外光譜分析技術作為一種高效、準確的分析檢測手段,能夠快速準確地識別各類化合物的分子結構特征。這項技術基于一個簡單卻精妙的原理:當紅外光照射樣品時,分子中的化學鍵會吸收特定波長
    的頭像 發(fā)表于 11-11 15:21 ?1324次閱讀
    紅外光譜技術應用與原理<b class='flag-5'>分析</b>

    vivado時序分析相關經(jīng)驗

    vivado綜合后時序為例主要是有兩種原因?qū)е拢?1,太多的邏輯級 2,太高的扇出 分析時序違例的具體位置以及原因可以使用一些tcl命令方便快速得到路徑信息
    發(fā)表于 10-30 06:58

    同步熱分析儀的聯(lián)用技術的應用

    同步熱分析儀是一款可同時測量樣品的tg和dsc信號的熱分析儀器,被廣泛應用在材料科學、高分子工程師、醫(yī)藥生物、能源等領域。隨著同步熱分析儀性能技術的不斷提升,同步熱分析儀可與其他儀器聯(lián)
    的頭像 發(fā)表于 08-28 16:04 ?1128次閱讀
    同步熱<b class='flag-5'>分析</b>儀的聯(lián)用技術的應用

    如何用FIB截面分析技術做失效分析?

    在半導體器件研發(fā)與制造領域,失效分析已成為不可或缺的環(huán)節(jié),F(xiàn)IB(聚焦離子束)截面分析,作為失效分析的利器,在微觀世界里大顯身手。它運用離子束精準切割樣品,巧妙結合電子束成像技術,實現(xiàn)對樣品內(nèi)部結構
    的頭像 發(fā)表于 08-15 14:03 ?1477次閱讀
    如何用FIB截面<b class='flag-5'>分析</b>技術做失效<b class='flag-5'>分析</b>?

    Virtuallab Fusion應用:光柵的偏振分析

    ,通過了一致的矢量處理,它不僅包括場和光柵本身,也包括可能包含光柵的光學系統(tǒng)。其次,Virtuallab Fusion提供了對光柵的矢量特征進行詳細的分析的必要工具。 在下面的示例中,我們將深入介紹偏振
    發(fā)表于 06-16 08:50

    FRED 應用于照明系統(tǒng)的分析及模擬

    FRED強調(diào)物件建構的視覺效果。 范例:(一)ARC 燈泡的范例 在FRED 之中你可以建立一個ARC 燈泡及反射罩進行反射罩設計的分析分析出光射到量測面是否有達到要求的亮度,如下所示 在FRED
    發(fā)表于 06-06 08:53

    有償邀請企業(yè)或個人分析此圖,并提供分析報告

    有償邀請企業(yè)或個人分析此圖,并提供分析報告,
    發(fā)表于 06-01 18:40

    VirtualLab:光柵的優(yōu)化與分析

    光柵是光學工程師使用的最基本的工具。為了設計和分析這類組件,快速物理光學建模和設計軟件VirtualLab Fusion為用戶提供了許多有用的工具。其中包括參數(shù)優(yōu)化,以輕松優(yōu)化系統(tǒng),以及參數(shù)運行,它
    發(fā)表于 05-23 08:49

    如何利用EPR分析USB PD?

    嗨,英飛凌社區(qū), 我一直在研究 USB PD 3.1,根據(jù)我找到的信息,EPR 是 USB PD 3.1 規(guī)范的一部分。 我對使用CY4500 EZ-PD協(xié)議分析儀很感興趣,但我在以下鏈接中發(fā)現(xiàn)它不
    發(fā)表于 05-21 06:40

    FRED 應用于照明系統(tǒng)的分析及模擬

    FRED強調(diào)物件建構的視覺效果。 范例:(一)ARC 燈泡的范例 在FRED 之中你可以建立一個ARC 燈泡及反射罩進行反射罩設計的分析分析出光射到量測面是否有達到要求的亮度,如下所示 在FRED
    發(fā)表于 05-14 08:51
    牟定县| 罗山县| 莆田市| 康定县| 永登县| 鄂尔多斯市| 建阳市| 七台河市| 即墨市| 开平市| 册亨县| 麻江县| 仪征市| 和政县| 滕州市| 连南| 海伦市| 龙陵县| 沙田区| 德兴市| 大理市| 吴忠市| 久治县| 慈溪市| 绥棱县| 柳林县| 特克斯县| 台湾省| 久治县| 新丰县| 和林格尔县| 玉溪市| 湘潭市| 巴中市| 龙井市| 社会| 武清区| 义乌市| 井冈山市| 宝应县| 丽江市|