欧美成人18禁久久久,79精品视频

無論是在傳統(tǒng)機器學(xué)習(xí)領(lǐng)域還是現(xiàn)今炙手可熱的深度學(xué)習(xí)領(lǐng)域，基于訓(xùn)練樣本有明確標簽或結(jié)果的監(jiān)督學(xué)習(xí)仍然是一種主要的模型訓(xùn)練方式。尤其是深度學(xué)習(xí)領(lǐng)域，需要更多數(shù)據(jù)以提升模型效果。目前，已經(jīng)有一些規(guī)模較大的公開數(shù)據(jù)集，如ImageNet，COCO等。對于深度學(xué)習(xí)入門者，這些公開數(shù)據(jù)集可以提供非常大的幫助；但是對于大部分企業(yè)開發(fā)者，特別在醫(yī)學(xué)成像、自動駕駛、工業(yè)質(zhì)檢等領(lǐng)域中，他們更需要利用專業(yè)領(lǐng)域的實際業(yè)務(wù)數(shù)據(jù)定制AI模型應(yīng)用，以保證其能夠更好地應(yīng)用在業(yè)務(wù)中。因此，業(yè)務(wù)場景數(shù)據(jù)的采集和標注也是在實際AI模型開發(fā)過程中必不可少的重要環(huán)節(jié)。

數(shù)據(jù)標注的質(zhì)量和規(guī)模通常是提升AI模型應(yīng)用效果的重要因素，然而完全通過人力手動標注數(shù)據(jù)建立一個高質(zhì)量、大規(guī)模專業(yè)領(lǐng)域數(shù)據(jù)集卻并不容易：標注人員的培訓(xùn)與手工標注成本高、耗時長。為解決此問題，我們可以利用主動學(xué)習(xí)的方法，采用“Human-in-the-loop”的交互式框架（圖1）進行數(shù)據(jù)標注，以有效減少人工數(shù)據(jù)標注量。

圖1 基于主動學(xué)習(xí)的“Human-in-the-loop”交互式數(shù)據(jù)標注框架

主動學(xué)習(xí)(Ac tiveLearning, AL)是一種挑選具有高信息度數(shù)據(jù)的有效方式，它將數(shù)據(jù)標注過程呈現(xiàn)為學(xué)習(xí)算法和用戶之間的交互。其中，算法負責(zé)挑選對訓(xùn)練AI模型價值更高的樣本，而用戶則標注那些挑選出來的樣本。如“Human-in-the-loop”交互式數(shù)據(jù)標注框架，通過用戶已標注的一部分數(shù)據(jù)來訓(xùn)練AI模型，通過此模型來標注剩余數(shù)據(jù)，再從中篩選出AI模型標注較為困難的數(shù)據(jù)進行人工標注，再將這些數(shù)據(jù)用于模型的優(yōu)化。幾輪過后，用于數(shù)據(jù)標注的AI模型將會具備較高的精度，更好地進行數(shù)據(jù)標注。以圖像分類問題舉例，首先，人工挑選并標注一部分圖像數(shù)據(jù)，訓(xùn)練初始模型，然后利用訓(xùn)練的模型預(yù)測其余未標注的數(shù)據(jù)，再通過“主動學(xué)習(xí)”中的“查詢方法”挑選出模型比較難分辨類別的數(shù)據(jù)，再人為修正這些“難”數(shù)據(jù)的標簽并加入訓(xùn)練集中再次微調(diào)(Fine-tuning)訓(xùn)練模型。“查詢方法”是主動學(xué)習(xí)的核心之一，最常見的“查詢方法”有基于不確定性的樣本查詢策略和基于多樣性的樣本查詢策略。

基于不確定性的樣本查詢策略可查詢出深度學(xué)習(xí)模型預(yù)測時，靠近決策邊界的樣本。以二分類問題舉例，當一個未標注樣本被預(yù)測為任一標簽的概率都是50%時，則該樣本對于預(yù)測模型而言是“不確定”的，極有可能被錯誤分類。要注意的是，主動學(xué)習(xí)是一個迭代過程，每次迭代，模型都會接收認為修正后的標注數(shù)據(jù)微調(diào)模型，通過這個過程直接改變模型決策的邊界，提高分類的正確率。

基于多樣性的查詢策略，可實現(xiàn)對當前深度學(xué)習(xí)模型下狀態(tài)未知樣本的查詢。將通過多樣性查詢挑選出的數(shù)據(jù)加入訓(xùn)練集，可豐富訓(xùn)練集的特征組合，提升模型的泛化能力。模型學(xué)習(xí)過的數(shù)據(jù)特征越豐富，泛化能力越強，預(yù)測模型適用的場景也越廣。

為解決大數(shù)據(jù)量標注的痛點，基于主動學(xué)習(xí)且融合多樣查詢策略的智能標注AI解決方案應(yīng)運而生。通過EasyDL平臺使用智能標注后，開發(fā)者們只需標注數(shù)據(jù)集中30%左右的數(shù)據(jù)，即可啟動智能標注在EasyDL后臺自動標注剩余數(shù)據(jù)，再返回少量后臺難以確定的數(shù)據(jù)再次進行人工標注，同時提升自動標注的準確性，經(jīng)過幾輪之后，在實際項目測試中，智能標注功能可以幫助用戶節(jié)省70%的數(shù)據(jù)標注量，極大地減少數(shù)據(jù)標注中的人力成本和時間成本。

EasyDL零門檻AI開發(fā)平臺，面向企業(yè)開發(fā)者提供智能標注、模型訓(xùn)練、服務(wù)部署等全流程功能，針對AI模型開發(fā)過程中繁雜的工作，提供便捷高效的平臺化解決方案。目前，EasyDL的智能標注功能已支持計算機視覺CV方向的物體檢測模型、圖像分割、自然語言處理NLP方向的文本分類模型的數(shù)據(jù)標注。

智能標注解決了模型開發(fā)過程中龐大的數(shù)據(jù)準備難題，那么在模型訓(xùn)練與部署階段，EasyDL是否還有其他“武功秘籍”幫助開發(fā)者高效開發(fā)？

本周六，AI快車道EasyDL零門檻模型訓(xùn)練營來到六朝古都南京，依托槳聲燈影里的秦淮河，為這座歷史悠久的城市帶來AI科技的新氣息！

各行業(yè)如何做到技術(shù)與場景結(jié)合，高效用AI？

視覺模型背后的核心技術(shù)點如何理解？

從云到端，端側(cè)模型的技術(shù)原理與部署如何操作？

模型精度難以提升，有沒有關(guān)鍵效果提升技巧尚未掌握？

責(zé)任編輯：xj

原文標題：百度工程師帶來干貨分享，助你轉(zhuǎn)型AI應(yīng)用工程師！

文章出處：【微信公眾號：深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴