日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

一種新聞關(guān)鍵信息的提取算法

大?。?/span>0.87 MB 人氣: 2017-12-13 需要積分:0

  針對網(wǎng)頁正文提取算法缺乏通用性,以及對新聞網(wǎng)頁的提取缺乏標(biāo)題、時(shí)間、來源信息的問題,提出一種新聞關(guān)鍵信息的提取算法newsExtractor。該算法首先通過預(yù)處理將網(wǎng)頁轉(zhuǎn)換成行號和文本的集合,然后根據(jù)字?jǐn)?shù)最長的一句話出現(xiàn)在新聞?wù)牡母怕蕵O高的特點(diǎn),從正文中間開始向兩端尋找正文的起點(diǎn)和終點(diǎn)提取新聞?wù)?,根?jù)最長公共子串算法提取標(biāo)題,構(gòu)造正則表達(dá)式并以行號輔助判斷提取時(shí)間,根據(jù)來源的格式特點(diǎn)并輔以行號提取來源;最后構(gòu)造了數(shù)據(jù)集與國外開源軟件newsPaper進(jìn)行提取準(zhǔn)確率的對比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,newsExtractor在正文、標(biāo)題、時(shí)間、來源的平均提取準(zhǔn)確率上均優(yōu)于newsPaper,具有通用性和魯棒性。

一種新聞關(guān)鍵信息的提取算法

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價(jià):好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關(guān)規(guī)定!

      ?
      樟树市| 青海省| 阿荣旗| 丁青县| 仙游县| 咸阳市| 乌拉特中旗| 靖西县| 黄龙县| 罗江县| 眉山市| 和硕县| 南平市| 娱乐| 龙南县| 黄骅市| 凤台县| 和硕县| 徐汇区| 浮梁县| 德令哈市| 旬邑县| 视频| 莫力| 邵阳县| 冀州市| 湘西| 宿迁市| 阿巴嘎旗| 普陀区| 忻州市| 九台市| 邹平县| 通河县| 宽甸| 曲阳县| 呼和浩特市| 延吉市| 永年县| 永胜县| 昌吉市|