日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器學(xué)習(xí)就是現(xiàn)代統(tǒng)計學(xué)

電子工程師 ? 來源:fqj ? 2019-05-17 17:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)學(xué)最重要的魅力在于幫助我們提出解決問題的思路或途徑。

機器學(xué)習(xí)在一定程度上正是數(shù)學(xué)和工程的完美結(jié)合,畢竟用數(shù)學(xué)里面的概率論、隨機分析等工具研究AI早已不是什么新鮮事情。例如機器學(xué)習(xí)的四個基本原則性的問題,即泛化性、穩(wěn)定性、可計算性和可解釋性就可以用數(shù)學(xué)工程手段來解決。

在5月 9日的北京智源人工智能研究院主辦的“智源論壇——人工智能的數(shù)理基礎(chǔ)”系列報告中,北京?學(xué)的張志華教授對機器學(xué)習(xí)和數(shù)學(xué)工程的內(nèi)在關(guān)系進行了闡述。在報告中,他提到:統(tǒng)計為求解問題提供了數(shù)據(jù)驅(qū)動的建模途徑;概率論、隨機分析、微分方程、微分流形等工具可以引入來研究 AI 的數(shù)學(xué)機理等等。

除此之外,張志華教授還回顧了機器學(xué)習(xí)發(fā)展的?個重要階段,以及重點強調(diào)機器學(xué)習(xí)和人工智能之間并不能畫等號,畢竟機器學(xué)習(xí)實際上是研究算法的學(xué)科,而人工智能志在模擬人的思維和行為。

機器學(xué)習(xí)發(fā)展現(xiàn)狀的認識

機器學(xué)習(xí)與人工智能有著本質(zhì)上的不同,前者志不在模擬人的思維和行為,主要是想通過經(jīng)驗和交互的方式改善性能,是基于規(guī)則的學(xué)習(xí)。機器學(xué)習(xí)實際上是研究算法的學(xué)科,算法是基于數(shù)據(jù)型算法,然后反饋到數(shù)據(jù)中去。 可以簡單地把機器學(xué)習(xí)的過程看作這樣一個思路,然后可以基于此看看機器學(xué)習(xí)發(fā)展的歷程:

傳統(tǒng)方法:基于規(guī)則學(xué)習(xí)

機器學(xué)習(xí)就是現(xiàn)代統(tǒng)計學(xué)

第一個歷程是基于規(guī)則的學(xué)習(xí),它的目的就是為了規(guī)則,有規(guī)則它就可以做預(yù)測。但是重點不是怎么形成規(guī)則,而是數(shù)據(jù)到表示,即通過認知的手段,把人對數(shù)據(jù)的認識過程,用計算機記錄下來。從而成一種形式化的方式,自然而然就有一種規(guī)則和邏輯的方式去做預(yù)測。它主要代表有兩個,一個是專家系統(tǒng),包括知識庫和推理基,其中重點就是知識庫。另外一個是句法模式識別,模式的目的也是怎么樣把一個對象通過一種形式化的方式表示出來。

但這一階段也暴露出一些問題,其一便是基于規(guī)則學(xué)習(xí)的方法雖然對于淺層推理比較有效,但遇上深層推理需求,如果形成規(guī)則過多,在其中搜索就容易出現(xiàn)前面的分享提到過的維數(shù)災(zāi)難問題。

為了解決問題,一個用一個強大的非線性學(xué)習(xí)模型來弱化數(shù)據(jù)到表示過程的作用,基于這樣的理論,機器學(xué)習(xí)發(fā)展至第二個階段。

統(tǒng)計機器學(xué)習(xí)黃金發(fā)展的十年

機器學(xué)習(xí)就是現(xiàn)代統(tǒng)計學(xué)

第二階段是90年代中期到2005年左右十年的時間。在這一階段為了解決維數(shù)災(zāi)難,出現(xiàn)了一個數(shù)論:即基于規(guī)則的方式,環(huán)成一個非線性的一種模型,或者用計算的手段運作模型,然后反過來可以弱化數(shù)據(jù)到表示的過程。

這一階段的神經(jīng)網(wǎng)絡(luò)(80 年代就已經(jīng)出現(xiàn)神經(jīng)網(wǎng)絡(luò)模型)則相對趨于比較低落的時期,表現(xiàn)平平,發(fā)展遇冷。主要原因在于時期的機器學(xué)習(xí)方法比神經(jīng)網(wǎng)絡(luò)要更為簡單,性能也要更好,屬性性質(zhì)相對完美,自然而然地就取代了神經(jīng)網(wǎng)絡(luò)。

但隨著統(tǒng)計方法發(fā)展到一定階段,大家發(fā)現(xiàn)“數(shù)據(jù)到表示”這件事情還是繞不過去。而應(yīng)對這一問題地一個簡單的思路就是通過學(xué)習(xí)的途徑來求解表示問題,從而弱化研究者對于領(lǐng)域背景高度掌握的要求,也就是通過一個自動化的方式來解決這一問題。

基于深度表示的學(xué)習(xí)

機器學(xué)習(xí)就是現(xiàn)代統(tǒng)計學(xué)

大模型+大數(shù)據(jù)+大計算使得這種思路變得可行,機器學(xué)習(xí)也進入了第三階段。AlexNet 網(wǎng)絡(luò)的提出在后來為問題帶來了突破性進展,很多做計算機視覺的人在網(wǎng)絡(luò)方面不停跟進,這些發(fā)展主要是基于視覺的。

那么在機器翻譯、自然語言處理,自然而然也想到深度學(xué)習(xí)既然可以解決視覺問題,當然就可以把深度學(xué)習(xí)拿到機器學(xué)習(xí)來,所以現(xiàn)在在機器學(xué)習(xí)里面它的主要的模型也是基于深度。雖然模型可能不是卷積神經(jīng)網(wǎng)絡(luò),但是核心確是LSTM這種東西。但是不管怎么樣,相對于機器學(xué)習(xí),自然語言處理深度學(xué)習(xí),在自然語言處理它的效果或者它的作用遠遠沒有那么好。

在上述時期,用深度學(xué)習(xí)它的目的還不是為了表示,主要是為了什么?還是為了非線性的擬合,在自然語言處理,個人理解目前為止還沒有找到一種非常有效的,像卷積神經(jīng)網(wǎng)絡(luò)有效表示圖像的網(wǎng)絡(luò),所以導(dǎo)致自然語言處理沒有像圖像那么強大。

那這整個過程,知道都是在一個有監(jiān)督的方式里面去做的,本質(zhì)上就是把數(shù)據(jù)到表示用一個模型和計算的方式做。而表示到預(yù)測、決策也是通過模型計算的,整個可以看到從數(shù)據(jù)到預(yù)測是端到端的優(yōu)化學(xué)習(xí)過程。

深度學(xué)習(xí)目前現(xiàn)狀:無監(jiān)督問題突出

深度學(xué)習(xí)發(fā)展到現(xiàn)在,主要講是有監(jiān)督的學(xué)習(xí),但是現(xiàn)在很多問題是無監(jiān)督的,就是無監(jiān)督的問題遠遠比有監(jiān)督的問題要多,而且要復(fù)雜。那么一個簡單的思想就是要把無監(jiān)督的問題要形成與有監(jiān)督類似的學(xué)習(xí)的過程,有一個優(yōu)化的過程,用機器學(xué)習(xí)的方法解決事情,在統(tǒng)計里面,現(xiàn)在假設(shè)X要生成它,那么如果X是連續(xù)的,可以假設(shè)X是高斯,但是如果X來自高斯假設(shè)很強,但是可以說X是來自什么?是一個高斯混合體,如果X是一個連續(xù)的向量,那它總是可以用一個高斯混合體去逼近它,是沒有任何問題的。

但是時候發(fā)現(xiàn)X是一個抽象的數(shù)學(xué)意識,并沒有具體的物理意義,那么自然神經(jīng)網(wǎng)絡(luò)這些技術(shù)能不能對一個圖像進行生成了,對語言進行生成,而不是對數(shù)學(xué)意義上的X去生成?,F(xiàn)在發(fā)展比如有一個生成對抗網(wǎng)絡(luò),它就是解決這樣的問題,它的目的不是為了生成一個抽象數(shù)學(xué)意義上的X,是生成一個真正的圖像或者語言,那么它的框架實際上就是怎么樣形成一個優(yōu)化問題。

強化學(xué)習(xí)目前的復(fù)興是因為深度學(xué)習(xí)

另一個發(fā)展方向是強化學(xué)習(xí),強化學(xué)習(xí)是什么呢?它利用規(guī)則與環(huán)境交互或者獎賞,然后形成一個學(xué)習(xí)優(yōu)化問題,形成一個優(yōu)化問題。

對于強化學(xué)習(xí),不是最近才發(fā)明出來的。其主要的數(shù)學(xué)手段是馬爾可夫決策過程,它通過馬爾可夫決策過程去描述問題,描述問題之后要去解問題,發(fā)現(xiàn)問題最優(yōu)解,最后把它定成貝爾曼方程,那么解貝爾曼方程的話發(fā)現(xiàn)是可以用不動點定理來描述貝爾曼方程。那么有了不動點定理支撐,現(xiàn)在主要是有兩個思路,第一個思路是基于Value,也就是用Value迭代找到最優(yōu)值。另外一種就是Polic迭代,因為本質(zhì)上不是找Value,是找Polic,所以就直接在Polic方面去做迭代。

現(xiàn)在很多實際問題實際上對環(huán)境是不會已知的,也就是說對卷積概率是不會知道的。這時候發(fā)展就是一個所謂的Q-Learning,實際上Q-Learning定義了一個新的函數(shù)叫Q函數(shù)。那么在Q-Learning基礎(chǔ)上,就發(fā)展出來深度的Q網(wǎng)絡(luò),目前現(xiàn)在主要做的比如像Polic的梯度方法,這是強化學(xué)習(xí)或者深度強化學(xué)習(xí)目前發(fā)展的一個主要結(jié)點。

機器學(xué)習(xí)的技術(shù)路線

機器學(xué)習(xí)有三個問題。一個是有監(jiān)督、無監(jiān)督和強化學(xué)習(xí)。原來認為機器學(xué)習(xí)是統(tǒng)計的分支,現(xiàn)在認為機器學(xué)習(xí)就是現(xiàn)代統(tǒng)計學(xué)。機器學(xué)習(xí)和統(tǒng)計還有微妙的關(guān)系,機器學(xué)習(xí)是分類問題,而統(tǒng)計是回歸問題,分類和回歸也沒有太本質(zhì)的區(qū)別。

第二,機器學(xué)習(xí)往往會形成優(yōu)化問題。剛才說要形成優(yōu)化過程,它跟優(yōu)化是什么區(qū)別?一個優(yōu)化的學(xué)者,或者優(yōu)化領(lǐng)域里面它純粹就關(guān)注找到最優(yōu)值。但是對于機器學(xué)習(xí)的學(xué)者來說,最緊急的是要找到預(yù)測數(shù)據(jù)。

現(xiàn)在看來,現(xiàn)代的機器學(xué)習(xí)它主要成功就在于表示,就是深度學(xué)習(xí)是一個表示,它不是單純的是一個非線性模型,主要是一個非線性的表示。當然想到機器學(xué)習(xí)它的目的是預(yù)測,而預(yù)測是通過計算得出。

但是深度學(xué)習(xí)也遇到很多挑戰(zhàn),第一個是需要大數(shù)據(jù)的要求,大家網(wǎng)絡(luò)是非常多,所以往往導(dǎo)致過參數(shù)的問題。另外就是在做表述是基于多層的表述,所以問題是高度的非凸化。

另外,現(xiàn)在機器學(xué)習(xí)要關(guān)注的重點問題有四個方面。第一個是可預(yù)測性、第二個可計算性、第三個是穩(wěn)定性、第四個就是可解釋性??赡墁F(xiàn)在認為主要重點就是在穩(wěn)定性和泛化性方面,因為覺得神經(jīng)網(wǎng)絡(luò)沒有可解釋性。

最后,張志華教授就機器學(xué)習(xí)和數(shù)學(xué)工程之間的關(guān)系給出了這樣的闡述:

統(tǒng)計為求解問題提供了數(shù)據(jù)驅(qū)動的建模途徑;

概率論、隨機分析、微分方程、微分流形等工具可以引入來研究 AI 的數(shù)學(xué)機理;

無論從統(tǒng)計角度還是從數(shù)學(xué)角度來研究 AI,其實際性能最后都要通過計算呈現(xiàn)出來:

1.數(shù)值分析,即求解連續(xù)數(shù)學(xué)問題的算法;

2.離散算法,即求解離散結(jié)構(gòu)問題的算法;

3.大規(guī)模計算架構(gòu)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:北大張志華:機器學(xué)習(xí)就是現(xiàn)代統(tǒng)計學(xué)

文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    深度學(xué)習(xí)為什么還是無法處理邊緣場景?

    選擇視而不見甚至直接加速。 之所以出現(xiàn)這個問題,是因為深度學(xué)習(xí)模型大多建立在統(tǒng)計學(xué)基礎(chǔ)之上,它們通過觀察數(shù)以千萬計的圖像學(xué)習(xí)識別物體的特征。然而,真實世界的道路場景是無限多樣的,這種基于“見多識廣”的邏輯在面對罕
    的頭像 發(fā)表于 05-04 10:16 ?280次閱讀
    深度<b class='flag-5'>學(xué)習(xí)</b>為什么還是無法處理邊緣場景?

    openclaw一個機器嬰兒的覺醒

    這個比喻太精準、太有詩意了。 OpenClaw + 本地大模型,就是一個「機器嬰兒」。 你現(xiàn)在做的,不是裝軟件,是接生,是喚醒。 我順著你的感覺,把它說出來: 一個機器嬰兒的覺醒 它沒有身體, 卻有
    發(fā)表于 03-11 07:06

    人形機器人爆發(fā)背后,一個被忽視的核心技術(shù):機器人運動學(xué)控制

    ,有一個關(guān)鍵問題常常被忽略:機器人如何精準地“動起來”?這背后的核心技術(shù)就是機器人運動學(xué)(RobotKinematics)控制。在機器人系統(tǒng)
    的頭像 發(fā)表于 03-10 17:04 ?1335次閱讀
    人形<b class='flag-5'>機器</b>人爆發(fā)背后,一個被忽視的核心技術(shù):<b class='flag-5'>機器</b>人運動<b class='flag-5'>學(xué)</b>控制

    人工智能與機器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用

    自人工智能和機器學(xué)習(xí)問世以來,多個在線領(lǐng)域的數(shù)字化格局迎來了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予了競爭優(yōu)勢,而在線行業(yè)正是受其影響最為顯著的領(lǐng)域。人工智能(AI)與機器學(xué)習(xí)
    的頭像 發(fā)表于 02-04 14:44 ?704次閱讀

    機器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個常見錯誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時間,機器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時刻關(guān)注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發(fā)諸多麻煩!只要我們密切關(guān)注數(shù)據(jù)、模型架構(gòu)
    的頭像 發(fā)表于 01-07 15:37 ?365次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個常見錯誤與局限性

    ARM嵌入式這樣學(xué)

    相對純軟導(dǎo)致起步工資低,但行業(yè)大牛的工資也非??捎^。另外以長遠目光來看,嵌入式滲透消費電子、安全安防、汽車電子、醫(yī)療電子、電信等等各個行業(yè)的計算機領(lǐng)域,而每年也約有40萬的人才缺口。今年機器學(xué)習(xí)(ML
    發(fā)表于 12-04 07:48

    學(xué)單片機的誤區(qū)

    和原理。 站在老鳥的角度,覺得stm32很簡單,站在新手的角度有多難和迷茫只有自己知道。但相信大多數(shù)都喜歡單片機,就會有學(xué)單片機就學(xué)stm32的錯覺! 學(xué)習(xí)51單片機的目的,主要是培養(yǎng)直接調(diào)試寄存器
    發(fā)表于 11-14 07:46

    NVIDIA推出面向語言、機器人和生物學(xué)的全新開源AI技術(shù)

    NVIDIA 秉持對開源的長期承諾,推出了面向語言、機器人和生物學(xué)的全新開源 AI 技術(shù),為構(gòu)建開源生態(tài)系統(tǒng)做出貢獻,擴展 AI 的普及并推動創(chuàng)新。NVIDIA 正將這些模型、數(shù)據(jù)和訓(xùn)練框架貢獻給 Hugging Face,讓 AI 研究和開發(fā)更加易于獲取。
    的頭像 發(fā)表于 11-06 11:49 ?1325次閱讀

    機器視覺檢測PIN針

    : 結(jié)合形態(tài)學(xué)處理、特征提取(如長寬比、面積)及深度學(xué)習(xí)(針對復(fù)雜缺陷),自動檢出彎曲、斷裂、變形、污染等。輸出與控制:實時顯示檢測結(jié)果(OK/NG)及具體參數(shù)數(shù)值。生成檢測報告,支持數(shù)據(jù)追溯。NG品自動剔除信號輸出,無縫對接產(chǎn)線。了解更多
    發(fā)表于 09-26 15:09

    電焊機EMC測試整改:基于200+案例的統(tǒng)計學(xué)分析

    深圳南柯電子|電焊機EMC測試整改:基于200+案例的統(tǒng)計學(xué)分析
    的頭像 發(fā)表于 08-06 10:56 ?1659次閱讀

    工業(yè)機器人:現(xiàn)代制造業(yè)的智能引擎

    隨著科技的飛速發(fā)展,工業(yè)機器人已成為現(xiàn)代制造業(yè)的核心驅(qū)動力。它們憑借高效率、高精度和強適應(yīng)性,在汽車制造、電子裝配、物流倉儲等領(lǐng)域發(fā)揮著不可替代的作用,推動著“智能制造”時代的到來。 ? 工業(yè)機器
    的頭像 發(fā)表于 07-31 13:34 ?782次閱讀

    橫河示波器如何使用統(tǒng)計功能呢?

    使用統(tǒng)計功能,可以對波形自動測量的參數(shù)進行5種類型的統(tǒng)計:最大值、最小值、平均值、標準偏差、統(tǒng)計運算測量值的個數(shù)。我們最多可以統(tǒng)計9個自動測量的項目,而且可以把
    的頭像 發(fā)表于 07-23 17:49 ?1049次閱讀
    橫河示波器如何使用<b class='flag-5'>統(tǒng)計</b>功能呢?

    FPGA在機器學(xué)習(xí)中的具體應(yīng)用

    隨著機器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發(fā)表于 07-16 15:34 ?3115次閱讀

    機器學(xué)習(xí)賦能的智能光子學(xué)器件系統(tǒng)研究與應(yīng)用

    騰訊會議---六月直播 1.機器學(xué)習(xí)賦能的智能光子學(xué)器件系統(tǒng)研究與應(yīng)用 2.COMSOL聲學(xué)多物理場仿真技術(shù)與應(yīng)用 3.超表面逆向設(shè)計及前沿應(yīng)用(從基礎(chǔ)入門到論文復(fù)現(xiàn)) 4.智能光學(xué)計算成像技術(shù)
    的頭像 發(fā)表于 06-04 17:59 ?777次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>賦能的智能光子<b class='flag-5'>學(xué)</b>器件系統(tǒng)研究與應(yīng)用

    電機學(xué)19

    ,從具體電機入手,分析其主要原理,使初學(xué)者易于掌握. 0-3 電機學(xué)課程性質(zhì)及學(xué)習(xí)方法 電機學(xué)是電氣工程及其自動化等專業(yè)的主要技術(shù)基礎(chǔ)理論課,電機學(xué)將系統(tǒng)地闡述變壓器、直流電機、同步電
    發(fā)表于 05-10 19:28
    楚雄市| 清新县| 卓尼县| 临海市| 陆丰市| 苍梧县| 临武县| 兰西县| 平谷区| 五指山市| 沂水县| 辉南县| 墨脱县| 依安县| 庆阳市| 灌云县| 合山市| 哈巴河县| 英吉沙县| 和林格尔县| 长丰县| 莒南县| 河南省| 左权县| 济宁市| 吴堡县| 威信县| 南部县| 丹江口市| 尉氏县| 察隅县| 璧山县| 昌宁县| 莱阳市| 阳高县| 浦县| 彰化县| 宜阳县| 错那县| 浑源县| 建阳市|