伊人久久艹,亚洲热成人

摘要：”當研究問題或數(shù)據(jù)集包括多個這樣的模態(tài)時，其特征在于多模態(tài)。

【導讀】人工智能領域最頂級國際期刊IEEE Transactions on Pattern Analysis and Machine Intelligence(IEEETPAMI,影響因子為 9.455)，2019年1月最新一期發(fā)表了關于多模態(tài)機器學習綜述論文。我們周圍的世界涉及多種形式 - 我們看到物體，聽到聲音，感覺質地，聞到異味等等。一般而言，模態(tài)指的是事物發(fā)生或經(jīng)歷的方式。大多數(shù)人將形態(tài)與感覺方式聯(lián)系起來，這些感覺方式代表了我們主要的交流和感覺渠道，例如視覺或觸覺。

因此，當研究問題或數(shù)據(jù)集包括多個這樣的模態(tài)時，其特征在于多模態(tài)。本文主要關注但不僅僅關注三種形式：自然語言既可以是書面的，也可以是口頭的; 視覺信號，通常用圖像或視頻表示; 和聲音信號，編碼聲音和口頭信息，如韻律和聲音表達。

我們對世界的體驗是多模式的 - 我們看到物體，聽到聲音，感覺質地，聞到異味和味道。情態(tài)是指某種事物發(fā)生或經(jīng)歷的方式，并且當研究問題包括多種這樣的形式時，研究問題被描述為多模式。為了使人工智能在理解我們周圍的世界方面取得進展，它需要能夠將這種多模態(tài)信號一起解釋。多模式機器學習旨在構建可以處理和關聯(lián)來自多種模態(tài)的信息的模型。這是一個充滿活力的多學科領域，具有越來越重要的意義和非凡的潛力。本文不是關注特定的多模態(tài)應用，而是研究多模態(tài)機器學習本身的最新進展。我們超越了典型的早期和晚期融合分類，并確定了多模式機器學習所面臨的更廣泛的挑戰(zhàn)，即：表示，翻譯，對齊，融合和共同學習。這種新的分類法將使研究人員能夠更好地了解該領域的狀況，并確定未來研究的方向。

論文地址：

http://www.zhuanzhi.ai/paper/2236c08ef0cd1bc87cae0f14cfbb9915

https://ieeexplore.ieee.org/document/8269806