日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

公開機(jī)器學(xué)習(xí)模型代碼可能會有哪些風(fēng)險?

DPVg_AI_era ? 來源:lp ? 2019-03-08 09:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作為個人開發(fā)者,應(yīng)不應(yīng)該將自己的項目或模型、數(shù)據(jù)等進(jìn)行開源?公開這些數(shù)據(jù)有哪些風(fēng)險?本文作者是斯坦福大學(xué)博士,長期從事開源機(jī)器學(xué)習(xí)研究,經(jīng)常接觸和處理敏感數(shù)據(jù),他結(jié)合自己的經(jīng)驗,為這個問題提供了一些建議。

公開機(jī)器學(xué)習(xí)模型代碼可能會有哪些風(fēng)險?

OpenAI 最近因為創(chuàng)造了多項機(jī)器學(xué)習(xí)新任務(wù)的最優(yōu)性能記錄,但卻不開放源代碼而遭到越來越多的指摘。OpenAI發(fā)推表示,“由于擔(dān)心這些技術(shù)可能被用做惡意目的,不會放出訓(xùn)練后的模型代碼?!?/p>

對OpenAI這個決定的批評之聲不少,比如這樣會對其他團(tuán)隊重現(xiàn)研究這些研究結(jié)果造成阻礙,而研究結(jié)果的可重現(xiàn)性是確保研究真實的基礎(chǔ)。而且,這樣做也可能導(dǎo)致媒體對人工智能技術(shù)產(chǎn)生一種由于未知而生的恐懼。

上面這段Twitter引起了我的注意。Anima Anandkumar在彌合機(jī)器學(xué)習(xí)的研究和實際應(yīng)用之間的差距方面擁有豐富的經(jīng)驗。我們是亞馬遜AWS的同事,最近還在一起討論了如何將機(jī)器學(xué)習(xí)技術(shù)從博士實驗室推向市場的問題。

Stephen Merity對社交媒體的回應(yīng)進(jìn)行了總結(jié),他表示,機(jī)器學(xué)習(xí)社區(qū)在這方面的經(jīng)驗其實不多:

OpenAI不公開模型源代碼是對是錯?這事各位可以自行判斷。不過在我看來,OpenAI在兩個方面做得不夠好,應(yīng)該就是否可以檢測到虛假內(nèi)容進(jìn)行調(diào)查,并以多種語言發(fā)布模型,以對抗對英語產(chǎn)生的單語種偏見。

對于個人機(jī)器學(xué)習(xí)項目而言,下面給出一些關(guān)于是否應(yīng)該公開發(fā)布模型或數(shù)據(jù)集的決策時的一些常見問題:

在開源我的模型之前是否應(yīng)該三思?

是的。如果你的模型是基于私有數(shù)據(jù)構(gòu)建的,則可以對其進(jìn)行逆向工程以提取出這些數(shù)據(jù)。

如果我的模型100%來自公共數(shù)據(jù),那我是否還要考慮將模型開源?

是的。如果要在新的語言環(huán)境重新發(fā)布數(shù)據(jù),已發(fā)布的數(shù)據(jù)可能會變成敏感數(shù)據(jù),而且,聚合后的數(shù)據(jù)(包括機(jī)器學(xué)習(xí)模型)可能比分散的各個數(shù)據(jù)點更加敏感。你需要考慮:重新構(gòu)建數(shù)據(jù)或數(shù)據(jù)模型會產(chǎn)生哪些影響,要不要由我自己或我所在的組織公開發(fā)布?

即使單個數(shù)據(jù)點并非敏感數(shù)據(jù),聚合數(shù)據(jù)被視為敏感也是很常見的情況。這是許多軍事組織的標(biāo)準(zhǔn)做法:當(dāng)他們匯總來自一組來源的數(shù)據(jù)時,他們會根據(jù)其敏感程度重新評估該匯總信息。聚合通常是統(tǒng)計學(xué)或無監(jiān)督機(jī)器學(xué)習(xí)的結(jié)果,但是基于該數(shù)據(jù)構(gòu)建的監(jiān)督模型同樣適用。

所以,你應(yīng)該經(jīng)常自問:我的模型中的聚合數(shù)據(jù)是否比單個數(shù)據(jù)點更為敏感?

我應(yīng)該如何評估開源風(fēng)險?

在安全性方面考慮,可以將每個策略視為“可被攻破的”。風(fēng)險防范的基本目標(biāo)是使攻破某些安全措施的成本高于被保護(hù)數(shù)據(jù)的價值。

所以要考慮的問題是,從你的研究論文中復(fù)制模型的成本,是否值得為那些想要出于負(fù)面目的使用這些技術(shù)的人付出這樣的努力?應(yīng)該要明確這一點。這是決定是否將模型開源的一個重要因素。

我最近與Facebook進(jìn)行了長時間的會談,討論的是出任一個職位,專門負(fù)責(zé)發(fā)現(xiàn)假新聞。從一個行內(nèi)人的角度來看,我最想知道的是這樣一件事:我能否以編程的方式成功檢測這種模型輸出,以便對抗假新聞?

我認(rèn)為在Facebook上打擊假新聞是任何人都可以做的最重要的事情之一,來自O(shè)penAI的這項研究將會對此有所幫助。而且,如果能夠創(chuàng)建一個可以識別生成內(nèi)容的模型池,那么假新聞可能會更難以蒙混通過自動檢測系統(tǒng)。

如果你能夠定量地證明,對項目數(shù)據(jù)的惡意使用可以進(jìn)行更容易/更難的打擊,這也將是你做出是否開源的決策過程中的另一個重要因素。

這算是機(jī)器學(xué)習(xí)中的新問題嗎?

其實不算是,你可以從過去的經(jīng)驗中學(xué)到很多東西。

如果你面臨類似的困境,請尋找具有深度知識的人來討論受影響最大的社區(qū)(最好是來自該社區(qū)內(nèi)部的人士),以及過去遇到類似的機(jī)器學(xué)習(xí)問題相關(guān)問題的人。

我是否應(yīng)該平衡機(jī)器學(xué)習(xí)的負(fù)面應(yīng)用和正面應(yīng)用?

是的。發(fā)布具有積極應(yīng)用意義的模型,很容易對世界產(chǎn)生積極影響。而限制具有許多負(fù)面應(yīng)用領(lǐng)域的模型的發(fā)布,很難對世界產(chǎn)生積極影響。

這其實是OpenAI的另一個失敗之處:缺乏多樣性。OpenAI比任何其他研究團(tuán)隊都更多地發(fā)布了僅適用于英語模型和研究成果。從全球來看,英語每天僅占全世界對話的5%。在句子中的單詞順序、標(biāo)準(zhǔn)化拼寫和“單詞”作為機(jī)器學(xué)習(xí)功能單元上,英語是一個異類。

OpenAI的研究依賴于以下三個方面:單詞順序,單詞特征,拼寫一致性。這些研究能夠適用于世界上大多數(shù)語言嗎?我們不知道,因為沒有測試。OpenAI的研究確實表明,我們需要擔(dān)心這種類型的英語生成內(nèi)容,但并沒有表明,今天的假新聞的流傳,更有可能通過除英語之外的其他100多種語言進(jìn)行。

如果你不想進(jìn)入假新聞等應(yīng)用程序的灰色區(qū)域,那么可以選擇一個本質(zhì)上更具影響力的研究領(lǐng)域,例如低資源語言中與健康相關(guān)的文本的語言模型。

我需要在多大程度上考慮項目應(yīng)用實例的敏感性?

當(dāng)我為AWS的命名實體解析服務(wù)開發(fā)產(chǎn)品時,必須考慮是否要將街道級地址識別為顯式字段,并可能將坐標(biāo)映射到相應(yīng)地址。我們認(rèn)為這本身就是敏感信息,不應(yīng)該在一般解決方案中進(jìn)行產(chǎn)品化。

在任何研究項目中都要考慮這一點:是否能夠隱含或明確地識別出模型中的敏感信息?

只是因為其他人都開源了自己的模型,因此我也應(yīng)該開源嗎?

當(dāng)然不是,你應(yīng)該對自己項目的影響力保持一份懷疑。無論你是否贊同OpenAI的決定,都應(yīng)該做出明智的決定,而不是盲目跟隨他人。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50366

    瀏覽量

    267056
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    4368

    瀏覽量

    46467
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    67

    文章

    8567

    瀏覽量

    137256

原文標(biāo)題:斯坦福博士:個人開發(fā)者要不要開源項目模型和代碼?

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    零基礎(chǔ)手寫大模型資料2026

    零基礎(chǔ)純代碼手寫大模型:從數(shù)學(xué)原理到工程實踐的技術(shù)解析 在深度學(xué)習(xí)框架高度封裝的今天,理解大模型底層原理的開發(fā)者愈發(fā)稀缺。本文將剝離復(fù)雜框架的依賴,從數(shù)學(xué)基礎(chǔ)出發(fā),解析如何用基礎(chǔ)
    發(fā)表于 05-01 17:44

    機(jī)器學(xué)習(xí)中的數(shù)據(jù)質(zhì)量雙保障:從“驗證”到“標(biāo)記”

    機(jī)器學(xué)習(xí)的世界里,有句老話尤為貼切:“garbagein,garbageout”(輸入垃圾,輸出垃圾)。無論模型架構(gòu)多先進(jìn)、算法多精妙,數(shù)據(jù)的質(zhì)量始終是決定模型性能的核心。本文聚焦數(shù)
    的頭像 發(fā)表于 04-24 15:48 ?118次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>中的數(shù)據(jù)質(zhì)量雙保障:從“驗證”到“標(biāo)記”

    模型 ai coding 比較

    glm5 可能是真的因為 資源不夠,感覺降智,速度也慢,前兩天 他們 發(fā)通知,尋求資源,目前可能不推薦 調(diào)研 我從 ? 評審維度明細(xì): 1. 代碼生成能力(權(quán)重40%) 測試目標(biāo) :模型
    發(fā)表于 02-19 13:43

    強(qiáng)化學(xué)習(xí)會讓自動駕駛模型學(xué)習(xí)更快嗎?

    是一種讓機(jī)器通過“試錯”學(xué)會決策的辦法。與監(jiān)督學(xué)習(xí)不同,監(jiān)督學(xué)習(xí)是有人提供示范答案,讓模型去模仿;而強(qiáng)化學(xué)習(xí)不會把每一步的“正確答案”都告訴
    的頭像 發(fā)表于 01-31 09:34 ?853次閱讀
    強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>會讓自動駕駛<b class='flag-5'>模型</b><b class='flag-5'>學(xué)習(xí)</b>更快嗎?

    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個常見錯誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時間,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時刻關(guān)注并銘記的常見錯誤。如果對這些錯誤置之不理,日后
    的頭像 發(fā)表于 01-07 15:37 ?367次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個常見錯誤與局限性

    基于ETAS嵌入式AI工具鏈將機(jī)器學(xué)習(xí)模型部署到量產(chǎn)ECU

    AI在汽車行業(yè)的應(yīng)用日益深化,如何將機(jī)器學(xué)習(xí)領(lǐng)域的先進(jìn)模型(如虛擬傳感器)集成到ECU軟件中,已成為業(yè)界面臨的核心挑戰(zhàn)。
    的頭像 發(fā)表于 12-24 10:55 ?6414次閱讀
    基于ETAS嵌入式AI工具鏈將<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>模型</b>部署到量產(chǎn)ECU

    配置文件損壞可能會帶來哪些安全風(fēng)險?

    配置文件損壞不僅會導(dǎo)致電能質(zhì)量在線監(jiān)測裝置功能異常,還可能引發(fā) 數(shù)據(jù)安全、運(yùn)維安全、設(shè)備安全、合規(guī)安全 四大類安全風(fēng)險,尤其在電力系統(tǒng)、工業(yè)配電等關(guān)鍵場景中,風(fēng)險可能傳導(dǎo)至電網(wǎng)或生產(chǎn)系
    的頭像 發(fā)表于 12-10 16:37 ?599次閱讀
    配置文件損壞<b class='flag-5'>可能會</b>帶來哪些安全<b class='flag-5'>風(fēng)險</b>?

    超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機(jī)器 學(xué)習(xí)模型更易于使用。它創(chuàng)建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文
    發(fā)表于 07-31 11:38

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發(fā)表于 07-16 15:34 ?3115次閱讀

    通過NVIDIA Cosmos模型增強(qiáng)機(jī)器人學(xué)習(xí)

    通用機(jī)器人的時代已經(jīng)到來,這得益于機(jī)械電子技術(shù)和機(jī)器人 AI 基礎(chǔ)模型的進(jìn)步。但目前機(jī)器人技術(shù)的發(fā)展仍面臨一個關(guān)鍵挑戰(zhàn):機(jī)器人需要大量的訓(xùn)練
    的頭像 發(fā)表于 07-14 11:49 ?1331次閱讀
    通過NVIDIA Cosmos<b class='flag-5'>模型</b>增強(qiáng)<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>

    變頻器開機(jī)后顯示故障代碼原因及解決方法

    變頻器作為現(xiàn)代工業(yè)控制中的重要設(shè)備,其穩(wěn)定運(yùn)行直接關(guān)系到生產(chǎn)效率和設(shè)備安全。然而在實際操作中,開機(jī)后出現(xiàn)故障代碼是常見問題。本文將系統(tǒng)分析變頻器故障代碼的成因,并提供針對性的解決方案,幫助技術(shù)人員
    的頭像 發(fā)表于 06-14 17:33 ?1.9w次閱讀
    變頻器<b class='flag-5'>開機(jī)</b>后顯示故障<b class='flag-5'>代碼</b>原因及解決方法

    邊緣計算中的機(jī)器學(xué)習(xí):基于 Linux 系統(tǒng)的實時推理模型部署與工業(yè)集成!

    你好,旅行者!歡迎來到Medium的這一角落。在本文中,我們將把一個機(jī)器學(xué)習(xí)模型(神經(jīng)網(wǎng)絡(luò))部署到邊緣設(shè)備上,利用從ModbusTCP寄存器獲取的實時數(shù)據(jù)來預(yù)測一臺復(fù)古音頻放大器的當(dāng)前健康狀況。你將
    的頭像 發(fā)表于 06-11 17:22 ?1170次閱讀
    邊緣計算中的<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>:基于 Linux 系統(tǒng)的實時推理<b class='flag-5'>模型</b>部署與工業(yè)集成!

    CYPD5235的CC Pin功能異常,還可能會跟什么有關(guān)?

    /VSYS/VDDD/V5V_P1的電都是正常的。 請教問題: 1。CYPD5235的CC Pin功能異常,還可能會跟什么有關(guān)? 2。去掉的MP8859,會影響CYPD5235的軟件代碼執(zhí)行嗎?如果會
    發(fā)表于 05-30 07:04

    泰克WFM2300不開機(jī)故障維修過程分享

    近期上海某企業(yè)送修一臺泰克WFM2300波形記錄儀,報修故障是不開機(jī),隨后工程師拿到機(jī)器后驗證,按開機(jī)鍵無反應(yīng)。
    的頭像 發(fā)表于 05-28 15:48 ?670次閱讀
    泰克WFM2300不<b class='flag-5'>開機(jī)</b>故障維修過程分享

    代碼革命的先鋒:aiXcoder-7B模型介紹

    程序代碼處理的團(tuán)隊,也是最早推出基于深度學(xué)習(xí)的編程產(chǎn)品的團(tuán)隊,從一開始他們就抓住并專注于代碼模型這個前沿賽
    的頭像 發(fā)表于 05-20 14:41 ?964次閱讀
    <b class='flag-5'>代碼</b>革命的先鋒:aiXcoder-7B<b class='flag-5'>模型</b>介紹
    绵竹市| 太和县| 夏河县| 荣昌县| 横山县| 开鲁县| 天镇县| 南陵县| 韶山市| 正阳县| 汉寿县| 洛阳市| 郎溪县| 宽城| 长乐市| 扎囊县| 民丰县| 枞阳县| 大丰市| 中西区| 伽师县| 辽宁省| 南汇区| 八宿县| 东平县| 西畴县| 齐齐哈尔市| 铁岭县| 两当县| 桦川县| 同江市| 通河县| 虎林市| 包头市| 太原市| 嘉兴市| 赤城县| 深水埗区| 蒙山县| 余干县| 彩票|