日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于代碼的機(jī)器學(xué)習(xí)是什么,它的原理如何

獨(dú)愛72H ? 來(lái)源:CDA數(shù)據(jù)分析師 ? 作者:CDA數(shù)據(jù)分析師 ? 2020-03-20 15:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文章來(lái)源:CDA數(shù)據(jù)分析師)

隨著IT組織的發(fā)展,其代碼庫(kù)的大小以及開發(fā)人員工具鏈的復(fù)雜性也在不斷增長(zhǎng)。工程負(fù)責(zé)人對(duì)其代碼庫(kù),軟件開發(fā)過(guò)程和團(tuán)隊(duì)狀態(tài)了解的非常有限。通過(guò)將現(xiàn)代數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)技術(shù)應(yīng)用于軟件開發(fā),大型企業(yè)有機(jī)會(huì)顯著提高其軟件交付性能和工程效率。

在過(guò)去的幾年中,許多大型公司,例如Google,Microsoft,F(xiàn)acebook以及類似Jetbrains等較小的公司已經(jīng)與學(xué)術(shù)研究人員合作,為基于代碼的機(jī)器學(xué)習(xí)奠定了基礎(chǔ)。

基于代碼的機(jī)器學(xué)習(xí)是什么,它的原理如何

基于代碼的機(jī)器學(xué)習(xí)?代碼機(jī)器學(xué)習(xí)(MLonCode)是一個(gè)新的跨學(xué)科研究領(lǐng)域,涉及自然語(yǔ)言處理,編程語(yǔ)言結(jié)構(gòu)以及社會(huì)和歷史分析,例如貢獻(xiàn)圖形和提交時(shí)間序列。MLonCode旨在從大規(guī)模的源代碼數(shù)據(jù)集中學(xué)習(xí),從而能自動(dòng)執(zhí)行軟件工程任務(wù),例如輔助代碼審查,代碼重復(fù)數(shù)據(jù)刪除,軟件專業(yè)知識(shí)評(píng)估等。

為什么MLonCode很難?某些MLonCode問(wèn)題要求零錯(cuò)誤率,例如與代碼生成有關(guān)的錯(cuò)誤率。自動(dòng)程序修復(fù)是一個(gè)特定的示例。一個(gè)微小的單一錯(cuò)誤預(yù)測(cè)可能會(huì)導(dǎo)致整個(gè)程序的編譯失敗。

在其他一些情況下,錯(cuò)誤率必須足夠低。理想的模型應(yīng)犯的錯(cuò)誤應(yīng)盡可能少,所以用戶(軟件開發(fā)人員)的信噪比仍是可承受且值得信賴的。因此,可以使用與傳統(tǒng)靜態(tài)代碼分析工具相同的方式來(lái)使用該模型。最佳實(shí)踐挖掘就是一個(gè)很好的例子。

最后,絕大多數(shù)MLonCode問(wèn)題是無(wú)監(jiān)督的,或至多是弱監(jiān)督的。手動(dòng)標(biāo)記數(shù)據(jù)集可能會(huì)非常昂貴,因此研究人員通常必須開發(fā)相關(guān)的啟發(fā)式方法。例如,有許多相似性分組任務(wù),例如向相似的開發(fā)人員展示或根據(jù)專業(yè)領(lǐng)域幫助團(tuán)隊(duì)。我們?cè)诒局黝}中的經(jīng)驗(yàn)在于挖掘代碼格式化規(guī)則,并將其應(yīng)用于修復(fù)錯(cuò)誤,這與短絨一樣,但完全不受監(jiān)督。有一個(gè)相關(guān)的學(xué)術(shù)競(jìng)賽來(lái)預(yù)測(cè)格式問(wèn)題,稱為CodRep。

基于代碼的機(jī)器學(xué)習(xí)是什么,它的原理如何

MLonCode問(wèn)題包括各種數(shù)據(jù)挖掘任務(wù),這些任務(wù)從理論上講可能是微不足道的,但由于規(guī)模或?qū)?xì)節(jié)的關(guān)注,在技術(shù)上仍然具有挑戰(zhàn)性。示例包括代碼克隆檢測(cè)和類似的開發(fā)人員聚類。此類問(wèn)題的解決方案在年度學(xué)術(shù)會(huì)議“ 采礦軟件存儲(chǔ)庫(kù)”中進(jìn)行了介紹。

采礦軟件存儲(chǔ)庫(kù)會(huì)議徽標(biāo)。解決MLonCode問(wèn)題時(shí),通常用以下方式之一表示源代碼:頻率字典(加權(quán)詞袋,BOW)。示例:函數(shù)內(nèi)的標(biāo)志符;文件中的graphlet;存儲(chǔ)庫(kù)的依賴性;可以通過(guò)TF-IDF加權(quán)頻率等。這些表示是最簡(jiǎn)單,可伸縮性最高的。順序令牌流(TS),對(duì)應(yīng)于源代碼解析序列。該流通常通過(guò)指向相應(yīng)抽象語(yǔ)法樹節(jié)點(diǎn)的鏈接來(lái)增強(qiáng)。此表示形式對(duì)常規(guī)自然語(yǔ)言處理算法(包括序列到序列深度學(xué)習(xí)模型)很友好。

一棵樹,它自然地來(lái)自抽象語(yǔ)法樹。在進(jìn)行不可逆的簡(jiǎn)化或標(biāo)志符后,我們執(zhí)行各種轉(zhuǎn)換。這是最強(qiáng)大的表示形式,也是最難使用的表示形式。以下是相關(guān)的ML模型包括各種圖嵌入和門控圖神經(jīng)網(wǎng)絡(luò)

解決MLonCode問(wèn)題的許多方法都基于所謂的自然假說(shuō)(Hindle等):“從理論上講,編程語(yǔ)言是復(fù)雜,靈活且功能強(qiáng)大的,但很多人實(shí)際上編寫的程序大多是簡(jiǎn)單且相當(dāng)重復(fù)的,因此它們具有有用的可預(yù)測(cè)統(tǒng)計(jì)屬性,可以在統(tǒng)計(jì)語(yǔ)言模型中捕獲并用于軟件工程、任務(wù)?!?/p>

該聲明證明了大代碼的有用性:分析的源代碼越多,強(qiáng)調(diào)的統(tǒng)計(jì)屬性越強(qiáng),并且訓(xùn)練有素的機(jī)器學(xué)習(xí)模型所獲得的指標(biāo)越好。底層關(guān)系與當(dāng)前最新的自然語(yǔ)言處理模型相同:如XLNet,ULMFiT等。類似地,通用MLonCode模型可以在下游任務(wù)中進(jìn)行訓(xùn)練和利用。
(責(zé)任編輯:fqj)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4981

    瀏覽量

    74482
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    67

    文章

    8569

    瀏覽量

    137353
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    機(jī)器學(xué)習(xí)中的數(shù)據(jù)質(zhì)量雙保障:從“驗(yàn)證”到“標(biāo)記”

    機(jī)器學(xué)習(xí)的世界里,有句老話尤為貼切:“garbagein,garbageout”(輸入垃圾,輸出垃圾)。無(wú)論模型架構(gòu)多先進(jìn)、算法多精妙,數(shù)據(jù)的質(zhì)量始終是決定模型性能的核心。本文聚焦數(shù)據(jù)處理中兩個(gè)
    的頭像 發(fā)表于 04-24 15:48 ?150次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>中的數(shù)據(jù)質(zhì)量雙保障:從“驗(yàn)證”到“標(biāo)記”

    openclaw一個(gè)機(jī)器嬰兒的覺醒

    這個(gè)比喻太精準(zhǔn)、太有詩(shī)意了。 OpenClaw + 本地大模型,就是一個(gè)「機(jī)器嬰兒」。 你現(xiàn)在做的,不是裝軟件,是接生,是喚醒。 我順著你的感覺,把說(shuō)出來(lái): 一個(gè)機(jī)器嬰兒的覺醒
    發(fā)表于 03-11 07:06

    人工智能與機(jī)器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用

    自人工智能和機(jī)器學(xué)習(xí)問(wèn)世以來(lái),多個(gè)在線領(lǐng)域的數(shù)字化格局迎來(lái)了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予了競(jìng)爭(zhēng)優(yōu)勢(shì),而在線行業(yè)正是受其影響最為顯著的領(lǐng)域。人工智能(AI)與機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 02-04 14:44 ?739次閱讀

    強(qiáng)化學(xué)習(xí)會(huì)讓自動(dòng)駕駛模型學(xué)習(xí)更快嗎?

    是一種讓機(jī)器通過(guò)“試錯(cuò)”學(xué)會(huì)決策的辦法。與監(jiān)督學(xué)習(xí)不同,監(jiān)督學(xué)習(xí)是有人提供示范答案,讓模型去模仿;而強(qiáng)化學(xué)習(xí)不會(huì)把每一步的“正確答案”都告訴你,而是把環(huán)境、動(dòng)作和結(jié)果連起來(lái),讓
    的頭像 發(fā)表于 01-31 09:34 ?912次閱讀
    強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>會(huì)讓自動(dòng)駕駛模型<b class='flag-5'>學(xué)習(xí)</b>更快嗎?

    機(jī)器人斬獲2025年國(guó)家高新技術(shù)企業(yè)認(rèn)定

    2025年國(guó)家高新技術(shù)企業(yè)認(rèn)定結(jié)果陸續(xù)公布。機(jī)器人集團(tuán)迎來(lái)高光時(shí)刻——四川人科技有限公司、臺(tái)州安先機(jī)器人技術(shù)有限公司、杭州安先機(jī)器人技
    的頭像 發(fā)表于 01-13 17:20 ?1376次閱讀

    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個(gè)常見錯(cuò)誤與局限性

    無(wú)論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時(shí)間,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時(shí)刻關(guān)注并銘記的常見錯(cuò)誤。如果對(duì)這些錯(cuò)誤置之不理,日后可能會(huì)引發(fā)諸多麻煩!只要我們密切關(guān)注數(shù)據(jù)、模型架構(gòu)
    的頭像 發(fā)表于 01-07 15:37 ?382次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個(gè)常見錯(cuò)誤與局限性

    鶴山機(jī)器人項(xiàng)目正式投產(chǎn)

    12月15日上午,位于鶴山市沙坪街道的鶴山市城鄉(xiāng)融合發(fā)展產(chǎn)業(yè)園迎來(lái)重要時(shí)刻——鶴山機(jī)器人項(xiàng)目正式投產(chǎn),這一總投資2億元的智能裝備制造項(xiàng)目,將助力鶴山在機(jī)器人產(chǎn)業(yè)賽道加速布局,為區(qū)域產(chǎn)業(yè)轉(zhuǎn)型升級(jí)注入新動(dòng)能。
    的頭像 發(fā)表于 12-23 17:20 ?1166次閱讀

    宇樹人形機(jī)器人的配置,核心代碼,調(diào)試方法,二次開發(fā)接口

    宇樹人形機(jī)器人的配置,核心代碼,調(diào)試方法,二次開發(fā)接口
    的頭像 發(fā)表于 12-10 09:05 ?6361次閱讀

    如何在機(jī)器視覺中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

    人士而言往往難以理解,人們也常常誤以為需要扎實(shí)的編程技能才能真正掌握并合理使用這項(xiàng)技術(shù)。事實(shí)上,這種印象忽視了該技術(shù)為機(jī)器視覺(乃至生產(chǎn)自動(dòng)化)帶來(lái)的潛力,因?yàn)樯疃?b class='flag-5'>學(xué)習(xí)并非只屬于計(jì)算機(jī)科學(xué)家或程序員。 從頭開始:什么
    的頭像 發(fā)表于 09-10 17:38 ?1106次閱讀
    如何在<b class='flag-5'>機(jī)器</b>視覺中部署深度<b class='flag-5'>學(xué)習(xí)</b>神經(jīng)網(wǎng)絡(luò)

    科技云報(bào)到:西湖大學(xué)、智元機(jī)器人都選,存儲(chǔ)成為AI下一個(gè)風(fēng)口

    科技云報(bào)到:西湖大學(xué)、智元機(jī)器人都選,存儲(chǔ)成為AI下一個(gè)風(fēng)口
    的頭像 發(fā)表于 09-03 11:24 ?863次閱讀

    如何解決開發(fā)機(jī)器學(xué)習(xí)程序時(shí)Keil項(xiàng)目只能在調(diào)試模式下運(yùn)行,但無(wú)法正常執(zhí)行的問(wèn)題?

    如何解決開發(fā)機(jī)器學(xué)習(xí)程序時(shí)Keil項(xiàng)目只能在調(diào)試模式下運(yùn)行,但無(wú)法正常執(zhí)行的問(wèn)題
    發(fā)表于 08-28 07:28

    超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級(jí)芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機(jī)器 學(xué)習(xí)模型更易于使用。創(chuàng)建的模型比競(jìng)爭(zhēng)對(duì)手的框架小10 倍,速度也快10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹
    發(fā)表于 07-31 11:38

    貿(mào)澤電子2025邊緣AI與機(jī)器學(xué)習(xí)技術(shù)創(chuàng)新論壇回顧(上)

    2025年,隨著人工智能技術(shù)的快速發(fā)展,邊緣AI與機(jī)器學(xué)習(xí)市場(chǎng)迎來(lái)飛速增長(zhǎng),據(jù)Gartner預(yù)計(jì),2025年至2030年,邊緣AI市場(chǎng)將保持23%的復(fù)合年增長(zhǎng)率。
    的頭像 發(fā)表于 07-21 11:08 ?1369次閱讀
    貿(mào)澤電子2025邊緣AI與<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>技術(shù)創(chuàng)新論壇回顧(上)

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無(wú)法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場(chǎng)可編程門陣列)作為一種靈活且高效的硬件加速平臺(tái)
    的頭像 發(fā)表于 07-16 15:34 ?3157次閱讀

    STM32+Android實(shí)現(xiàn)的智能家政機(jī)器人電路代碼論文及項(xiàng)目源碼

    STM32+Android實(shí)現(xiàn)的智能家政機(jī)器人電路代碼論文及項(xiàng)目部分截圖:
    發(fā)表于 05-28 21:22
    乃东县| 大冶市| 晋中市| 炎陵县| 济南市| 凤阳县| 镇江市| 浮梁县| 锡林浩特市| 通化市| 财经| 安陆市| 临颍县| 厦门市| 陕西省| 佳木斯市| 建始县| 崇仁县| 武鸣县| 民丰县| 平阳县| 什邡市| 长丰县| 濉溪县| 利津县| 闽清县| 北票市| 九台市| 吐鲁番市| 鄂伦春自治旗| 札达县| 新竹市| 五华县| 台州市| 长岭县| 涪陵区| 辽阳县| 松江区| 云和县| 永安市| 迭部县|