日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一款工具,借助深度學(xué)習(xí)模型可以一鍵摳去漫畫(huà)中的文字

m3Fp_almosthuma ? 來(lái)源:機(jī)器之心 ? 2020-01-27 11:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

漫畫(huà)摳圖是漢化組翻譯中必不可少而又工作量很大的一項(xiàng)工作,主要內(nèi)容是將漫畫(huà)中的文字摳去,以便替換成另一種語(yǔ)言?,F(xiàn)在,這項(xiàng)工作可以自動(dòng)化地完成了,一位韓國(guó)的開(kāi)發(fā)者開(kāi)源了一款工具,借助深度學(xué)習(xí)模型可以一鍵摳去漫畫(huà)中的文字,連背景圖中的文字都可以被摳去,效果十分驚人。

很多人都喜歡看日本漫畫(huà),不少作品已經(jīng)成為很多人心中的童年回憶。但是對(duì)于漫畫(huà)的翻譯人員來(lái)說(shuō),他們需要去除原有漫畫(huà)的對(duì)話框和背景文字,并將其替換為讀者使用的語(yǔ)言。由于一本漫畫(huà)可能有數(shù)萬(wàn)個(gè)對(duì)話框和對(duì)話,因此工作量是很大的。

現(xiàn)在,摳圖的工作人員可以基本上解放他們的雙手了。只要你有 TensorFlow,就可以快速實(shí)現(xiàn)一鍵摳圖,將漫畫(huà)圖像中的所有文字一鍵去除。

SickZil-Machine,一鍵摳圖

SickZil 是韓文中的作者提供了一個(gè)視頻,用于展示這一工具的效果。

作者同時(shí)提供了自動(dòng)工具摳圖的案例。

對(duì)話框中的文字可以被完全消除。

有時(shí)候會(huì)有些文字消除不干凈的情況,但基本不影響畫(huà)面(漫畫(huà)右上角標(biāo)題符號(hào))。同時(shí),背景中被去掉文字后,背景畫(huà)面可以被自動(dòng)補(bǔ)全,基本不改變畫(huà)面效果(畫(huà)面右上角背景文字)。

從視頻中可以看出,這一工具非常的方便。只需要選擇待處理的漫畫(huà),然后運(yùn)行工具即可。如果有一些畫(huà)面被誤去除,或者有一些去除不干凈的情況下,用戶可以手動(dòng)修改需要被去除的文字。

那么,這一工具背后是什么技術(shù)呢?

技術(shù)

模型架構(gòu)

據(jù)項(xiàng)目作者介紹,這一工具背后使用了兩個(gè)模型,第一個(gè)是 Seg Net,用于檢測(cè)漫畫(huà)中的問(wèn)題。另一個(gè)則是 Compl Net,用于處理漫畫(huà)圖像,去除文字并補(bǔ)全缺失的圖像部分。

Seg Net 使用的是 U-NET。這是一種編碼器-解碼器架構(gòu)。編碼器逐漸減少池化層的空間維度,解碼器逐步修復(fù)物體的細(xì)節(jié)和空間維度。

U-Net 的架構(gòu),將輸入圖像逐步池化后進(jìn)行上采樣,從而還原圖像細(xì)節(jié)。

而 Compl Net 使用的是 deepfill v2,這是一個(gè)用于對(duì)任意被 mask 的圖像進(jìn)行修復(fù)的模型,可以適應(yīng)各種 mask 的方式(塊狀遮蓋或線條遮蓋都可以)。deepfill 是 Adobe 等機(jī)構(gòu)提出一系列圖像修復(fù)工具,機(jī)器之心也曾用過(guò) deepfill v1,但是效果似乎沒(méi)有論文展示的那么好。

目前 deepfill v2 并沒(méi)有官方開(kāi)源,但 GitHub 上有其他開(kāi)發(fā)者復(fù)現(xiàn)。

deepfill v2 的模型架構(gòu),可以進(jìn)行圖像修復(fù)。

有了這兩大神器,基本上可以實(shí)現(xiàn)漫畫(huà)文字的檢測(cè)識(shí)別和去除文本后的圖像補(bǔ)全。

數(shù)據(jù)集和訓(xùn)練

有了模型還不夠,很多讀者想知道,整個(gè)系統(tǒng)是怎樣訓(xùn)練的。

在 Seg Net 上,作者使用了原始的漫畫(huà)圖像和文本內(nèi)容遮蓋數(shù)據(jù),用于覆蓋原始漫畫(huà)中所有的文字部分。在 Compl Net 上,模型的輸入為被移除了文字的漫畫(huà)圖像。模型使用了 285 個(gè)圖像-遮蓋對(duì)和 31500 張漫畫(huà)圖像,其中有將近 12000 張漫畫(huà)是有文字的,因此訓(xùn)練的數(shù)據(jù)比較平衡。

安裝和使用

作者沒(méi)有透露訓(xùn)練模型的相關(guān)參數(shù),但是提供了開(kāi)發(fā)者需要準(zhǔn)備的硬件配置。 對(duì)于開(kāi)發(fā)者而言,運(yùn)行代碼需要準(zhǔn)備 NVIDIA 驅(qū)動(dòng) 410.x,CUDA 10.0,CUDNN >= 7.4.1,TensorFlow 需要大于 1.13 版本。

配置代碼步驟如下:

首先克隆相關(guān)代碼:git clone https://github.com/KUR-creative/SickZil-Machine.git; cd SickZil-Machine

下載 zip 文件,地址:https://github.com/KUR-creative/SickZil-Machine/releases。

解壓并復(fù)制文件:SickZil-Machine-0.1.1-pre0-win64-cpu-eng/resource/cnet 和 SickZil-Machine-0.1.1-pre0-win64-cpu-eng/resource/snet 到文件目錄:SickZil-Machine/resource.

進(jìn)入目錄并安裝:pip install -r requirements.txt

運(yùn)行主程序:cd src; python main.py

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3850

    瀏覽量

    52306
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4980

    瀏覽量

    74468
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5612

    瀏覽量

    124697

原文標(biāo)題:漫畫(huà)漢化組福音:深度學(xué)習(xí)工具一鍵摳圖

文章出處:【微信號(hào):almosthuman2014,微信公眾號(hào):機(jī)器之心】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI 大數(shù)據(jù)賦能電商,選品上架一鍵通全

    被繁瑣的上架流程消耗大量時(shí)間精力,最終陷入“費(fèi)力不討好”的運(yùn)營(yíng)僵局。而AI大數(shù)據(jù)模型的強(qiáng)勢(shì)介入,徹底打破了這困境,真正實(shí)現(xiàn)“AI 大數(shù)據(jù)賦能電商,選品上架一鍵通全局”,讓電商運(yùn)營(yíng)從“被動(dòng)摸索”走向“主動(dòng)掌控”
    的頭像 發(fā)表于 05-12 16:03 ?40次閱讀

    告別觸屏,開(kāi)口即控!語(yǔ)音一鍵順控,讓開(kāi)關(guān)柜聽(tīng)懂你的“指令”

    蜀瑞創(chuàng)新為你科普:語(yǔ)音一鍵順控,就像是給開(kāi)關(guān)柜裝上了靈敏的“耳朵”和“嘴巴”。它不僅僅是個(gè)簡(jiǎn)單的語(yǔ)音識(shí)別模塊,更是基于AI語(yǔ)義理解的深度控制邏輯。它將復(fù)雜的倒閘操作指令,簡(jiǎn)化為最自然的語(yǔ)言交流。
    的頭像 發(fā)表于 05-07 14:24 ?115次閱讀
    告別觸屏,開(kāi)口即控!語(yǔ)音<b class='flag-5'>一鍵</b>順控,讓開(kāi)關(guān)柜聽(tīng)懂你的“指令”

    AIBOX + JishuShell:一鍵部署端側(cè) AI,把本地龍蝦“裝”進(jìn)小盒子

    JishuShell:一款能夠?qū)埼r一鍵部署到本地的工具,讓AIAgent更方便實(shí)現(xiàn)本地運(yùn)行。目前,F(xiàn)ireflyAIBOX-3576和AIBOX-3588已成功跑通Ji
    的頭像 發(fā)表于 04-15 16:35 ?612次閱讀
    AIBOX + JishuShell:<b class='flag-5'>一鍵</b>部署端側(cè) AI,把本地龍蝦“裝”進(jìn)小盒子

    一鍵上貨工具與API接口的深度集成:技術(shù)實(shí)現(xiàn)詳解

    ? 在電商運(yùn)營(yíng)中,高效的商品上架流程至關(guān)重要。傳統(tǒng)手動(dòng)上貨耗時(shí)耗力,而 一鍵上貨工具 結(jié)合 API接口 的自動(dòng)化方案,可大幅提升效率。本文將深入解析其技術(shù)實(shí)現(xiàn)邏輯,并提供核心代碼示例。 、API
    的頭像 發(fā)表于 04-01 17:14 ?688次閱讀
    <b class='flag-5'>一鍵</b>上貨<b class='flag-5'>工具</b>與API接口的<b class='flag-5'>深度</b>集成:技術(shù)實(shí)現(xiàn)詳解

    請(qǐng)問(wèn)CW32系列MCU的調(diào)試工具是哪一款?

    CW32系列MCU的調(diào)試工具是哪一款?
    發(fā)表于 01-07 07:11

    碳足跡算不清?全鏈路能源系統(tǒng),一鍵生成碳排報(bào)告

    在 “雙碳” 目標(biāo)推進(jìn)下,碳足跡核算已成為企業(yè)高質(zhì)量發(fā)展必經(jīng)之路。全鏈路能源系統(tǒng)憑借 “數(shù)據(jù)自動(dòng)采集、核算精準(zhǔn)智能、報(bào)告一鍵生成” 的核心優(yōu)勢(shì),讓碳核算從 “耗時(shí)費(fèi)力的難題” 變?yōu)?“高效便捷的工具”,既為合規(guī)經(jīng)營(yíng)護(hù)航,也為節(jié)能降碳提供數(shù)據(jù)支撐。
    的頭像 發(fā)表于 11-19 09:45 ?543次閱讀
    碳足跡算不清?全鏈路能源系統(tǒng),<b class='flag-5'>一鍵</b>生成碳排報(bào)告

    靈動(dòng)微電子最新最火熱的一款芯片推薦

    希望找一款靈動(dòng)微電子最新最火熱的一款芯片,我們想做個(gè)圖形化的界面配置,供大家以后直接創(chuàng)建工程,用國(guó)產(chǎn)工具McuStudio做,McuStudio支持任何內(nèi)核任何廠家的芯片,希望大家有
    發(fā)表于 10-29 17:15

    借助電商 API,多平臺(tái)客戶評(píng)價(jià)一鍵抓取

    出錯(cuò)。借助電商平臺(tái)的 API(Application Programming Interface),我們可以實(shí)現(xiàn)一鍵抓取多平臺(tái)客戶評(píng)價(jià),高效自動(dòng)化這過(guò)程。本文將
    的頭像 發(fā)表于 08-11 14:49 ?886次閱讀

    告別多設(shè)備!揭秘QM系列閃測(cè)儀如何一鍵搞定多元檢測(cè)

    QM 系列一鍵閃測(cè)儀作為方案核心,搭載雙視野雙遠(yuǎn)心鏡頭與 2000 萬(wàn)像素 CMOS 傳感器,測(cè)量精度可達(dá) ±1μm。其內(nèi)置的 AI 深度學(xué)習(xí)系統(tǒng)經(jīng)過(guò)海量工業(yè)樣本訓(xùn)練,能一鍵識(shí)別 50
    的頭像 發(fā)表于 08-11 13:43 ?1210次閱讀
    告別多設(shè)備!揭秘QM系列閃測(cè)儀如何<b class='flag-5'>一鍵</b>搞定多元檢測(cè)

    把Gerber變成電磁波:推薦一款基于Gerber的openEMS仿真工具 - gerber2ems

    :把“Gerber + 鉆孔+ 疊層”一鍵翻譯成 openEMS 能吃的 3D 模型,跑完還能跟 VNA 實(shí)測(cè)對(duì)波。
    的頭像 發(fā)表于 08-03 11:21 ?4623次閱讀
    把Gerber變成電磁波:推薦<b class='flag-5'>一款</b>基于Gerber的openEMS仿真<b class='flag-5'>工具</b> - gerber2ems

    寧暢與與百度文心大模型展開(kāi)深度技術(shù)合作

    與部署。 憑借覆蓋訓(xùn)練、推理、微調(diào)全流程的AI?服務(wù)器產(chǎn)品矩陣,寧暢幫助企業(yè)在大模型時(shí)代一鍵打通算力與應(yīng)用“任督二脈”,顯著縮短模型落地周期。 在已啟動(dòng)的深度技術(shù)合作中,雙方將基于文心
    的頭像 發(fā)表于 07-07 16:26 ?1068次閱讀

    HarmonyOS應(yīng)用一鍵置灰指南

    一鍵置灰通常應(yīng)用于如下場(chǎng)景 1. 重大悼念活動(dòng): 在國(guó)家發(fā)生重大災(zāi)難、事故或舉行悼念日等特殊時(shí)期,為了表達(dá)對(duì)逝者的尊重和哀悼,許多 APP 會(huì)將界面置灰。例如,在些地震、空難等災(zāi)難事件發(fā)生后,以及
    的頭像 發(fā)表于 06-27 00:08 ?749次閱讀

    一鍵尺寸測(cè)量?jī)x在醫(yī)療領(lǐng)域的應(yīng)用具體是什么?

    一鍵尺寸測(cè)量?jī)x作為種先進(jìn)的測(cè)量工具,憑借其高精度、快速批量測(cè)量以及自動(dòng)化與智能化的特點(diǎn),正逐漸成為五金行業(yè)不可或缺的精密測(cè)量新利器。
    的頭像 發(fā)表于 05-27 15:12 ?887次閱讀
    <b class='flag-5'>一鍵</b>尺寸測(cè)量?jī)x在醫(yī)療領(lǐng)域的應(yīng)用具體是什么?

    ESP8266燒錄與機(jī)智云一鍵配網(wǎng)教程

    ESP8266模塊因其低成本和高性能,廣泛應(yīng)用于智能家居和工業(yè)自動(dòng)化等領(lǐng)域。機(jī)智云平臺(tái)提供了一鍵配網(wǎng)功能,簡(jiǎn)化了設(shè)備的聯(lián)網(wǎng)過(guò)程。本教程將詳細(xì)介紹如何使用ESP8266進(jìn)行燒錄,并通過(guò)機(jī)智云實(shí)現(xiàn)一鍵
    的頭像 發(fā)表于 05-24 11:04 ?2494次閱讀
    ESP8266燒錄與機(jī)智云<b class='flag-5'>一鍵</b>配網(wǎng)教程

    電源一鍵多用:POWER_ON從開(kāi)機(jī)到場(chǎng)景指揮官!

    按鍵,即開(kāi)關(guān)機(jī),在結(jié)構(gòu)設(shè)計(jì)上可以實(shí)現(xiàn) 一鍵多用 ——既可以有效減少結(jié)構(gòu)的按鍵設(shè)計(jì),也可以使整機(jī)更加簡(jiǎn)潔。 本文以Air8000核心板為例,
    的頭像 發(fā)表于 05-15 14:10 ?4477次閱讀
    電源<b class='flag-5'>鍵</b>的<b class='flag-5'>一鍵</b>多用:POWER_ON從開(kāi)機(jī)到場(chǎng)景指揮官!
    兴和县| 改则县| 高青县| 祁连县| 若尔盖县| 旬邑县| 芜湖市| 安顺市| 尤溪县| 武安市| 马边| 辽中县| 乌鲁木齐市| 同心县| 浦江县| 淳安县| 霍林郭勒市| 扶沟县| 田阳县| 陵水| 合阳县| 启东市| 天气| 无棣县| 新平| 宁都县| 彭山县| 星座| 叙永县| 仪陇县| 威信县| 博爱县| 定南县| 张家口市| 延川县| 尼勒克县| 彰化市| 曲沃县| 杭锦旗| 清涧县| 木里|