日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能出擊:破解梵蒂岡神秘卷宗之謎

向上 ? 來(lái)源:網(wǎng)絡(luò)整理 ? 作者:工程師李察 ? 2018-06-17 15:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導(dǎo)讀: 由于傳統(tǒng)OCR技術(shù)是把單詞分割成一個(gè)個(gè)字母來(lái)識(shí)別的,所以對(duì)于這類(lèi)連體字,OCR無(wú)法識(shí)別字母。有人想出了一個(gè)方案,直接讓OCR去識(shí)別一個(gè)個(gè)的單詞,但是,如何讓OCR掌握成千上萬(wàn)的拉丁文單詞呢?大概需要一個(gè)排的中世紀(jì)拉丁文專(zhuān)家來(lái)辨認(rèn)不同單詞的圖形。

這個(gè) AI 認(rèn)識(shí)中世紀(jì)手寫(xiě)拉丁文

“以后青銅銘文也交給 AI 來(lái)識(shí)別好了!”

AI 識(shí)別文字已經(jīng)不算是什么難事,但是如果字體是手寫(xiě),而且還是古文呢?

這似乎聽(tīng)起來(lái)具有相當(dāng)?shù)碾y度!

梵蒂岡秘密檔案館(Vatican Secret Archives)可謂全球最偉大的歷史藏品之一,但其珍藏的許多文件從未轉(zhuǎn)錄。近日,一個(gè)名為 Codice Ratio 項(xiàng)目,利用人工智能光學(xué)字符識(shí)別(簡(jiǎn)稱(chēng) OCR)軟件的組合重現(xiàn)這些被忽視的文本,并將其重新呈現(xiàn)在世人面前。

這座恢宏的建筑坐落在梵蒂岡城墻之內(nèi),毗鄰使徒圖書(shū)館、位于西斯廷大教堂北側(cè),擁有著可追溯于1200年之前的總長(zhǎng)達(dá)53英里的書(shū)架。除了將Martin Luther逐出教會(huì)的《教皇詔書(shū)》之外,其中還包括蘇格蘭瑪麗女王被處決之前發(fā)給教皇西克斯五世的函件。在規(guī)模與范圍方面,其中的收藏幾乎著稱(chēng)無(wú)與倫比。

然而,梵蒂岡秘密檔案館對(duì)現(xiàn)代學(xué)者卻沒(méi)多大現(xiàn)實(shí)意義。因?yàn)樵谶@長(zhǎng)達(dá)53英里的書(shū)架當(dāng)中,只有極少數(shù)書(shū)頁(yè)經(jīng)過(guò)掃描以提供在線版本,這當(dāng)中的一小部分轉(zhuǎn)錄為計(jì)算機(jī)文本以供內(nèi)容搜索。如果我們打算閱讀其它任何內(nèi)容,則必須申請(qǐng)?zhí)厥獾脑L問(wèn)權(quán)限,一路前往羅馬,并親自動(dòng)手翻開(kāi)這些古籍。

傳統(tǒng) OCR 技術(shù)只適用于經(jīng)過(guò)嚴(yán)格排版的文字,而對(duì)于字母之間缺少間隔空間(即臟分割)的手寫(xiě)卷宗形式則無(wú)法識(shí)別。對(duì)此, Codice Ratio 項(xiàng)目利用拼圖分割法將單詞理解為一種單筆筆劃,軟件只需要知曉哪些組塊代表真實(shí)的字母,而哪些只是連筆造成的假象即可。該軟件的手寫(xiě)字母判斷準(zhǔn)確率已經(jīng)高達(dá)96%。如果成功,這項(xiàng)技術(shù)還將被用于處理世界各地其它歷史檔案庫(kù)當(dāng)中數(shù)不勝數(shù)的其它記錄文件。

人工智能出擊:破解梵蒂岡神秘卷宗之謎

利用拼圖分割法讓 OCR 識(shí)別連體字

由于傳統(tǒng)OCR技術(shù)是把單詞分割成一個(gè)個(gè)字母來(lái)識(shí)別的,所以對(duì)于這類(lèi)連體字,OCR無(wú)法識(shí)別字母。有人想出了一個(gè)方案,直接讓OCR去識(shí)別一個(gè)個(gè)的單詞,但是,如何讓OCR掌握成千上萬(wàn)的拉丁文單詞呢?大概需要一個(gè)排的中世紀(jì)拉丁文專(zhuān)家來(lái)辨認(rèn)不同單詞的圖形。

除了請(qǐng)專(zhuān)家辨認(rèn)單詞外,還有更簡(jiǎn)單的方法幫助OCR識(shí)別手寫(xiě)字母,只要找實(shí)習(xí)生就可以搞定了。

我們知道,無(wú)論中文還是英文,連體字中粗的部分是筆畫(huà),細(xì)的部分是筆尖移動(dòng)造成的虛線,并不是筆畫(huà)的一部分。根據(jù)這個(gè)原則,In Codice Ratio的專(zhuān)家們發(fā)明了新的方法——拼圖分割法。拼圖分割法改變了傳統(tǒng)OCR把單詞分成字母的傳統(tǒng)方式,而是是把連在一起的單詞按照筆畫(huà)分隔開(kāi),在此之后,該軟件會(huì)進(jìn)一步進(jìn)行字母繪制,并最終生成以下一系列拼圖碎片:

這些拼圖碎片本身作用不大,但該軟件能夠?qū)⑵渫ㄟ^(guò)多種方式組合起來(lái)以生成可能的字母。具體來(lái)講,軟件只需要知曉哪些組塊代表真實(shí)的字母,而哪些只是連筆造成的假象即可。

為了教會(huì)軟件這項(xiàng)能力,研究人員們選擇了不同尋常的導(dǎo)師——高中生。該團(tuán)隊(duì)在意大利的24所學(xué)校當(dāng)中招募了一批高中生用于建立項(xiàng)目的記憶庫(kù)。學(xué)生們?cè)诘卿浵嚓P(guān)網(wǎng)站后,會(huì)看到如下圖所示的三分屏幕界面:

人工智能出擊:破解梵蒂岡神秘卷宗之謎

之后,就要讓識(shí)別系統(tǒng)判斷對(duì)錯(cuò):識(shí)別出的字母,哪些是真正的字母,哪些是虛線的誤判。

通過(guò)一次次點(diǎn)擊,學(xué)生們努力教授該軟件如何識(shí)別22個(gè)中世紀(jì)拉丁字母(a-i,l-u,以及s與d的某些替代形式)。 22個(gè)中世紀(jì)拉丁文字母都學(xué)會(huì)之后,這個(gè)識(shí)別系統(tǒng)就成為了一個(gè)能認(rèn)識(shí)手寫(xiě)體中世紀(jì)拉丁文的AI。

當(dāng)然,最終學(xué)生們也不再需要參與其中。當(dāng)訓(xùn)練進(jìn)行到一定階段之后,該軟件即可獨(dú)立拼圖,并自行判斷字母的具體位置。這,正是人工智能的價(jià)值所在。

在另一方面,這也證明單靠拼圖碎片還不足以組合出正確的字母。計(jì)算機(jī)仍然需要額外的幫助才能破解手寫(xiě)文本的秘密。想象一下,大家正在讀信,并在其中看到下面這句:

中間的單詞到底是“clear”還是“dear”?很難判斷,因?yàn)椤癲”與“cl”的筆畫(huà)構(gòu)成實(shí)際上完全相同。OCR軟件也面臨著同樣的問(wèn)題,特別是在處理高度風(fēng)格化的文本時(shí)更是如此。以下圖為例:

在經(jīng)過(guò)不同的拼圖組合之后,OCR認(rèn)為可能的選項(xiàng)包括aimo、amio、aniio、aiino甚至是aiiiio。但這個(gè)詞實(shí)際上是anno,也就是拉丁語(yǔ)中的年。該軟件認(rèn)準(zhǔn)了a和o,但卻弄不清中間的四個(gè)豎到底該如何劃分。

為了解決這個(gè)問(wèn)題,Codice Ratio團(tuán)隊(duì)不得不為自己的軟件提供一些常識(shí)性的知識(shí)。他們建立起一套包含150萬(wàn)個(gè)經(jīng)過(guò)數(shù)字化的拉丁詞匯語(yǔ)料庫(kù),并對(duì)其中的雙字母與三字母組合進(jìn)行了檢查。通過(guò)這種方式,他們確定了哪些字母組合較為常見(jiàn),而哪些永遠(yuǎn)不會(huì)出現(xiàn)。通過(guò)將這些統(tǒng)計(jì)信息提供給OCR軟件,其能夠了解到不同字符串的具體出現(xiàn)概率,從而意識(shí)到nn比iiii的可能性高得多。

隨著這樣的改進(jìn),OCR終于能夠自行閱讀部分文本了。該團(tuán)隊(duì)決定為其提供一些來(lái)自梵蒂岡秘密歸案館的資料。這是一份超過(guò)18000頁(yè)的檔案集合,其中包括寫(xiě)給歐洲國(guó)王的信件、關(guān)于法律問(wèn)題的裁決以及其它信件。

最初的結(jié)果有好有壞。在迄今為止的全部轉(zhuǎn)錄文本中,有三分之一文檔中包含一處或多處拼寫(xiě)錯(cuò)誤——意味著OCR作出了錯(cuò)誤的判斷。然而,該軟件仍然帶來(lái)了高達(dá)96%的手寫(xiě)字母判斷準(zhǔn)確率。Merialdo表示,即使是“不完美的轉(zhuǎn)錄結(jié)果,亦可提供關(guān)于手稿內(nèi)容及背景的大量有價(jià)值信息?!?/p>

經(jīng)過(guò)對(duì)AI更專(zhuān)業(yè)的訓(xùn)練后,它可以識(shí)別各大文明的古代文獻(xiàn)并電子化。

所以,為了給AI提升難度,青銅銘文了解一下?

梵蒂岡秘密檔案館(Vatican Secret Archives):由教皇保羅五世(Pope Paul V)主導(dǎo)創(chuàng)立,是歐洲教會(huì)中收藏檔案最豐富,最古老的檔案館。梵蒂岡秘密檔案館擁有著可追溯于1200年之前的總長(zhǎng)達(dá)53英里的書(shū)架,其中保存著各種古籍、歷史事件檔案、教皇的私人信件以及一些有關(guān)超自然現(xiàn)象和神秘學(xué)的資料。梵蒂岡秘密檔案館收錄了許多重要史料,除了將 Martin Luther 逐出教會(huì)的《教皇詔書(shū)》之外,還包括蘇格蘭瑪麗女王被處決之前發(fā)給教皇西克斯五世的函件。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41426

    瀏覽量

    302759
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50385

    瀏覽量

    267109
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    淺談人工智能(2)

    接前文《淺談人工智能(1)》。 (5)什么是弱人工智能、強(qiáng)人工智能以及超人工智能? 弱人工智能(Weak AI),也稱(chēng)限制領(lǐng)域
    的頭像 發(fā)表于 02-22 08:24 ?388次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    開(kāi)發(fā)智能體配置-內(nèi)容合規(guī)

    智能體上架前,需完成“人工智能生成合成內(nèi)容標(biāo)識(shí)”和“大模型備案信息”填寫(xiě) ,以供平臺(tái)審核;可在智能體【配置】-【內(nèi)容合規(guī)】中填寫(xiě)。 人工智能生成合成內(nèi)容標(biāo)識(shí) “
    發(fā)表于 02-07 11:44

    微軟與新思科技分享智能人工智能技術(shù)的行業(yè)影響

    在2025年世界移動(dòng)通信大會(huì)(MWC 2025)上,微軟(Microsoft)與新思科技(Synopsys)兩家科技巨頭攜手登臺(tái),分享了他們對(duì)人工智能(AI)發(fā)展的最新洞見(jiàn)、智能人工智能
    的頭像 發(fā)表于 11-30 09:48 ?561次閱讀

    人工智能6S店開(kāi)放日直播通道開(kāi)啟

    你可能已經(jīng)聽(tīng)說(shuō),一個(gè)名為「人工智能6S店」的新物種即將誕生。明天,它將首次揭開(kāi)神秘面紗。但在那之前,我們想邀請(qǐng)你正式認(rèn)識(shí)一下:它,到底是什么?人工智能體驗(yàn)店,到底是什么?人工智能6S店
    的頭像 發(fā)表于 09-27 18:22 ?936次閱讀
    <b class='flag-5'>人工智能</b>6S店開(kāi)放日直播通道開(kāi)啟

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹這對(duì)開(kāi)發(fā)人員意味著什么,以及使用 Neuton 模型如何改進(jìn)您的開(kāi)發(fā)和終端
    發(fā)表于 08-31 20:54

    人工智能+”,走老路難賺到新錢(qián)

    昨天的“人工智能+”刷屏了,這算是官方第一次對(duì)“人工智能+”這個(gè)名稱(chēng)定性吧?今年年初到現(xiàn)在,涌現(xiàn)出了一大批基于人工智能的創(chuàng)業(yè)者,這已經(jīng)算是AI2.0時(shí)代的第三波創(chuàng)業(yè)潮了,第一波是基礎(chǔ)大模型,第二波
    的頭像 發(fā)表于 08-27 13:21 ?920次閱讀
    “<b class='flag-5'>人工智能</b>+”,走老路難賺到新錢(qián)

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實(shí)驗(yàn)箱,必須來(lái)給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開(kāi)箱即學(xué),便捷拉滿 這個(gè)實(shí)驗(yàn)箱真的是為使用者
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實(shí)驗(yàn)箱,必須來(lái)給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開(kāi)箱即學(xué),便捷拉滿 這個(gè)實(shí)驗(yàn)箱真的是為使用者
    發(fā)表于 08-07 14:23

    關(guān)于人工智能處理器的11個(gè)誤解

    本文轉(zhuǎn)自:TechSugar編譯自ElectronicDesign人工智能浪潮已然席卷全球,將人工智能加速器和處理器整合到各類(lèi)應(yīng)用中也變得愈發(fā)普遍。然而,圍繞它們是什么、如何運(yùn)作、能如何增強(qiáng)
    的頭像 發(fā)表于 08-07 13:21 ?1279次閱讀
    關(guān)于<b class='flag-5'>人工智能</b>處理器的11個(gè)誤解

    超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級(jí)芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機(jī)器 學(xué)習(xí)模型更易于使用。它創(chuàng)建的模型比競(jìng)爭(zhēng)對(duì)手的框架小10 倍,速度也快10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹
    發(fā)表于 07-31 11:38

    迅為RK3588開(kāi)發(fā)板Linux安卓麒麟瑞芯微國(guó)產(chǎn)工業(yè)AI人工智能

    迅為RK3588開(kāi)發(fā)板Linux安卓麒麟瑞芯微國(guó)產(chǎn)工業(yè)AI人工智能
    發(fā)表于 07-14 11:23

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門(mén)學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會(huì)發(fā)展的當(dāng)下,無(wú)論是探索未來(lái)職業(yè)方向,還是更新技術(shù)儲(chǔ)備,掌握大模型知識(shí)都已成為新時(shí)代的必修課。從職場(chǎng)上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    如何構(gòu)建邊緣人工智能基礎(chǔ)設(shè)施

    隨著人工智能的不斷發(fā)展,其爭(zhēng)議性也越來(lái)越大;而在企業(yè)和消費(fèi)者的眼中,人工智能價(jià)值顯著。如同許多新興科技一樣,目前人工智能的應(yīng)用主要聚焦于大規(guī)模、基礎(chǔ)設(shè)施密集且高功耗的領(lǐng)域。然而,隨著人工智能
    的頭像 發(fā)表于 06-09 09:48 ?1232次閱讀

    人工智能是做什么的

    在當(dāng)今科技日新月異的時(shí)代,人工智能(ArtificialIntelligence,簡(jiǎn)稱(chēng)AI)已成為推動(dòng)社會(huì)進(jìn)步和經(jīng)濟(jì)發(fā)展的重要力量。本文旨在深入探討人工智能的核心功能、應(yīng)用領(lǐng)域,并通過(guò)具體實(shí)例解析其
    的頭像 發(fā)表于 05-30 10:04 ?1045次閱讀
    <b class='flag-5'>人工智能</b>是做什么的

    是德科技如何破解人工智能的基礎(chǔ)設(shè)施困局

    人工智能正在改變世界。然而,它需要大量的處理能力。需求每 100 天翻一番,這推動(dòng)了人工智能基礎(chǔ)設(shè)施的投資熱潮。
    的頭像 發(fā)表于 05-09 15:53 ?986次閱讀
    安阳市| 新邵县| 虹口区| 柳河县| 揭东县| 眉山市| 常州市| 西充县| 五原县| 遂宁市| 玛纳斯县| 桓仁| 盖州市| 宾阳县| 镇远县| 军事| 聂拉木县| 曲松县| 锡林郭勒盟| 平乡县| 秦皇岛市| 辰溪县| 苗栗县| 宝鸡市| 蕲春县| 塔河县| 南木林县| 宾阳县| 武城县| 房产| 陇南市| 增城市| 喀喇| 无为县| 河东区| 淄博市| 遵义县| 咸宁市| 宁远县| 汝城县| 武平县|