日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

業(yè)務(wù)場景數(shù)據(jù)的采集和標注

深度學(xué)習(xí)自然語言處理 ? 來源:深度學(xué)習(xí)自然語言處理 ? 作者:深度學(xué)習(xí)自然語言 ? 2020-11-02 14:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

無論是在傳統(tǒng)機器學(xué)習(xí)領(lǐng)域還是現(xiàn)今炙手可熱的深度學(xué)習(xí)領(lǐng)域,基于訓(xùn)練樣本有明確標簽或結(jié)果的監(jiān)督學(xué)習(xí)仍然是一種主要的模型訓(xùn)練方式。尤其是深度學(xué)習(xí)領(lǐng)域,需要更多數(shù)據(jù)以提升模型效果。目前,已經(jīng)有一些規(guī)模較大的公開數(shù)據(jù)集,如ImageNet,COCO等。對于深度學(xué)習(xí)入門者,這些公開數(shù)據(jù)集可以提供非常大的幫助;但是對于大部分企業(yè)開發(fā)者,特別在醫(yī)學(xué)成像自動駕駛、工業(yè)質(zhì)檢等領(lǐng)域中,他們更需要利用專業(yè)領(lǐng)域的實際業(yè)務(wù)數(shù)據(jù)定制AI模型應(yīng)用,以保證其能夠更好地應(yīng)用在業(yè)務(wù)中。因此,業(yè)務(wù)場景數(shù)據(jù)的采集和標注也是在實際AI模型開發(fā)過程中必不可少的重要環(huán)節(jié)。

數(shù)據(jù)標注的質(zhì)量和規(guī)模通常是提升AI模型應(yīng)用效果的重要因素,然而完全通過人力手動標注數(shù)據(jù)建立一個高質(zhì)量、大規(guī)模專業(yè)領(lǐng)域數(shù)據(jù)集卻并不容易:標注人員的培訓(xùn)與手工標注成本高、耗時長。為解決此問題,我們可以利用主動學(xué)習(xí)的方法,采用“Human-in-the-loop”的交互式框架(圖1)進行數(shù)據(jù)標注,以有效減少人工數(shù)據(jù)標注量。

圖1 基于主動學(xué)習(xí)的“Human-in-the-loop”交互式數(shù)據(jù)標注框架

主動學(xué)習(xí)(ActiveLearning, AL)是一種挑選具有高信息度數(shù)據(jù)的有效方式,它將數(shù)據(jù)標注過程呈現(xiàn)為學(xué)習(xí)算法和用戶之間的交互。其中,算法負責(zé)挑選對訓(xùn)練AI模型價值更高的樣本,而用戶則標注那些挑選出來的樣本。如“Human-in-the-loop”交互式數(shù)據(jù)標注框架,通過用戶已標注的一部分數(shù)據(jù)來訓(xùn)練AI模型,通過此模型來標注剩余數(shù)據(jù),再從中篩選出AI模型標注較為困難的數(shù)據(jù)進行人工標注,再將這些數(shù)據(jù)用于模型的優(yōu)化。幾輪過后,用于數(shù)據(jù)標注的AI模型將會具備較高的精度,更好地進行數(shù)據(jù)標注。以圖像分類問題舉例,首先,人工挑選并標注一部分圖像數(shù)據(jù),訓(xùn)練初始模型,然后利用訓(xùn)練的模型預(yù)測其余未標注的數(shù)據(jù),再通過“主動學(xué)習(xí)”中的“查詢方法”挑選出模型比較難分辨類別的數(shù)據(jù),再人為修正這些“難”數(shù)據(jù)的標簽并加入訓(xùn)練集中再次微調(diào)(Fine-tuning)訓(xùn)練模型。“查詢方法”是主動學(xué)習(xí)的核心之一,最常見的“查詢方法”有基于不確定性的樣本查詢策略和基于多樣性的樣本查詢策略。

基于不確定性的樣本查詢策略可查詢出深度學(xué)習(xí)模型預(yù)測時,靠近決策邊界的樣本。以二分類問題舉例,當一個未標注樣本被預(yù)測為任一標簽的概率都是50%時,則該樣本對于預(yù)測模型而言是“不確定”的,極有可能被錯誤分類。要注意的是,主動學(xué)習(xí)是一個迭代過程,每次迭代,模型都會接收認為修正后的標注數(shù)據(jù)微調(diào)模型,通過這個過程直接改變模型決策的邊界,提高分類的正確率。

基于多樣性的查詢策略,可實現(xiàn)對當前深度學(xué)習(xí)模型下狀態(tài)未知樣本的查詢。將通過多樣性查詢挑選出的數(shù)據(jù)加入訓(xùn)練集,可豐富訓(xùn)練集的特征組合,提升模型的泛化能力。模型學(xué)習(xí)過的數(shù)據(jù)特征越豐富,泛化能力越強,預(yù)測模型適用的場景也越廣。

為解決大數(shù)據(jù)量標注的痛點,基于主動學(xué)習(xí)且融合多樣查詢策略的智能標注AI解決方案應(yīng)運而生。通過EasyDL平臺使用智能標注后,開發(fā)者們只需標注數(shù)據(jù)集中30%左右的數(shù)據(jù),即可啟動智能標注在EasyDL后臺自動標注剩余數(shù)據(jù),再返回少量后臺難以確定的數(shù)據(jù)再次進行人工標注,同時提升自動標注的準確性,經(jīng)過幾輪之后,在實際項目測試中,智能標注功能可以幫助用戶節(jié)省70%的數(shù)據(jù)標注量,極大地減少數(shù)據(jù)標注中的人力成本和時間成本。

EasyDL零門檻AI開發(fā)平臺,面向企業(yè)開發(fā)者提供智能標注、模型訓(xùn)練、服務(wù)部署等全流程功能,針對AI模型開發(fā)過程中繁雜的工作,提供便捷高效的平臺化解決方案。目前,EasyDL的智能標注功能已支持計算機視覺CV方向的物體檢測模型、圖像分割、自然語言處理NLP方向的文本分類模型的數(shù)據(jù)標注。

智能標注解決了模型開發(fā)過程中龐大的數(shù)據(jù)準備難題,那么在模型訓(xùn)練與部署階段,EasyDL是否還有其他“武功秘籍”幫助開發(fā)者高效開發(fā)?

本周六,AI快車道EasyDL零門檻模型訓(xùn)練營來到六朝古都南京,依托槳聲燈影里的秦淮河,為這座歷史悠久的城市帶來AI科技的新氣息!

各行業(yè)如何做到技術(shù)與場景結(jié)合,高效用AI?

視覺模型背后的核心技術(shù)點如何理解?

從云到端,端側(cè)模型的技術(shù)原理與部署如何操作?

模型精度難以提升,有沒有關(guān)鍵效果提升技巧尚未掌握?

責(zé)任編輯:xj

原文標題:百度工程師帶來干貨分享,助你轉(zhuǎn)型AI應(yīng)用工程師!

文章出處:【微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)采集
    +關(guān)注

    關(guān)注

    42

    文章

    8346

    瀏覽量

    121280
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41370

    瀏覽量

    302752
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    67

    文章

    8567

    瀏覽量

    137269
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5610

    瀏覽量

    124662

原文標題:百度工程師帶來干貨分享,助你轉(zhuǎn)型AI應(yīng)用工程師!

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    商用車與隧道場景數(shù)據(jù)采集方案及系統(tǒng)應(yīng)用解析

    智慧工地與無人化施工技術(shù)的持續(xù)推進,推動了工程商用車的數(shù)字化轉(zhuǎn)型,尤其是隧道施工場景下的工程車輛,對數(shù)據(jù)采集系統(tǒng)的場景適配性、精度和穩(wěn)定性提出了更高要求。隧道內(nèi)無GPS信號、高帶寬數(shù)據(jù)
    的頭像 發(fā)表于 03-23 15:01 ?179次閱讀
    商用車與隧道<b class='flag-5'>場景</b><b class='flag-5'>數(shù)據(jù)采集</b>方案及系統(tǒng)應(yīng)用解析

    自動駕駛數(shù)據(jù)標注是所有信息都要標注嗎?

    [首發(fā)于智駕最前沿微信公眾號]數(shù)據(jù)標注對于自動駕駛來說,就像是老師教小朋友知識,數(shù)據(jù)標注可以讓車輛學(xué)習(xí)辨別道路交通信息的能力。攝像頭、雷達、激光雷達(LiDAR)拍下來的只是一堆原始信
    的頭像 發(fā)表于 12-04 09:05 ?1235次閱讀
    自動駕駛<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標注</b>是所有信息都要<b class='flag-5'>標注</b>嗎?

    算法工程師不愿做標注工作,怎么辦?

    對于算法而言,圖像標注是一項關(guān)鍵性工作,越是大量的新數(shù)據(jù)標注,對于算法的性能提升越有幫助。但是圖像標注是一項極其費時費力的工作,特別是遇到稍微復(fù)雜的
    的頭像 發(fā)表于 12-02 17:56 ?722次閱讀
    算法工程師不愿做<b class='flag-5'>標注</b>工作,怎么辦?

    淺析多模態(tài)標注對大模型應(yīng)用落地的重要性與標注實例

    ”的關(guān)鍵工序——多模態(tài)標注重要性日益凸顯。 一、什么是多模態(tài)標注? 多模態(tài)標注是指對文本、圖像、語音、視頻、點云等異構(gòu)數(shù)據(jù)進行跨模態(tài)語義關(guān)聯(lián)的標注
    的頭像 發(fā)表于 09-05 13:49 ?2841次閱讀

    小語種OCR標注效率提升10+倍:PaddleOCR+ERNIE 4.5自動標注實戰(zhàn)解析

    摘要 :小語種OCR研發(fā)的核心瓶頸在于高質(zhì)量標注數(shù)據(jù)的稀缺與高昂成本。本文介紹一種創(chuàng)新的自動化標注方案,利用 PaddleOCR 進行文本檢測與裁剪,并調(diào)用 ERNIE 4.5 大模型進行雙重預(yù)測
    的頭像 發(fā)表于 08-29 11:26 ?3894次閱讀
    小語種OCR<b class='flag-5'>標注</b>效率提升10+倍:PaddleOCR+ERNIE 4.5自動<b class='flag-5'>標注</b>實戰(zhàn)解析

    請問AICube所需的目標檢測數(shù)據(jù)標注可以使用什么工具?

    請問AICube所需的目標檢測數(shù)據(jù)標注可以使用什么工具? 我使用labelimg進行標注標注后的數(shù)據(jù)集改好文件名后導(dǎo)入不進去。一直卡在
    發(fā)表于 08-11 08:07

    PLC數(shù)據(jù)采集中臺是什么?有什么功能?

    PLC數(shù)據(jù)采集中臺是工業(yè)場景中連接底層PLC設(shè)備與上層業(yè)務(wù)系統(tǒng)(如MES、ERP、工業(yè)云平臺等)的中間層數(shù)據(jù)處理樞紐。它并非單一硬件設(shè)備,而是集數(shù)據(jù)
    的頭像 發(fā)表于 07-30 14:31 ?634次閱讀
    PLC<b class='flag-5'>數(shù)據(jù)采集</b>中臺是什么?有什么功能?

    自動駕駛數(shù)據(jù)標注主要是標注什么?

    [首發(fā)于智駕最前沿微信公眾號]在自動駕駛系統(tǒng)的研發(fā)過程中,數(shù)據(jù)標注是實現(xiàn)高性能感知模型的基礎(chǔ)環(huán)節(jié),其核心目標是將車輛從環(huán)境中采集到的原始感知數(shù)據(jù)(主要包括圖像、點云、視頻序列等)轉(zhuǎn)化為
    的頭像 發(fā)表于 07-30 11:54 ?1693次閱讀
    自動駕駛<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標注</b>主要是<b class='flag-5'>標注</b>什么?

    工業(yè)智能網(wǎng)關(guān):PLC觸摸屏數(shù)據(jù)采集場景覆蓋指南

    針對"能否采集PLC觸摸屏數(shù)據(jù)"問題,本文通過功能模塊化拆解,結(jié)合真實應(yīng)用場景,解析工業(yè)智能網(wǎng)關(guān)在PLC觸摸屏數(shù)據(jù)采集中的技術(shù)實現(xiàn)與商業(yè)價值。
    的頭像 發(fā)表于 07-16 10:36 ?1627次閱讀
    工業(yè)智能網(wǎng)關(guān):PLC觸摸屏<b class='flag-5'>數(shù)據(jù)采集</b><b class='flag-5'>場景</b>覆蓋指南

    傳感器數(shù)據(jù)采集的應(yīng)用場景有哪些

    傳感器數(shù)據(jù)采集的應(yīng)用場景廣泛覆蓋工業(yè)、農(nóng)業(yè)、醫(yī)療、交通、環(huán)保、消費電子等多個領(lǐng)域,其核心是通過實時感知物理世界的數(shù)據(jù),為決策、控制或優(yōu)化提供依據(jù)。以下是具體的應(yīng)用場景分類及案例: 一、
    的頭像 發(fā)表于 07-14 15:54 ?2325次閱讀

    什么是自動駕駛數(shù)據(jù)標注?如何好做數(shù)據(jù)標注?

    、精準且高效的數(shù)據(jù)標注流程顯得尤為關(guān)鍵。那什么是數(shù)據(jù)標注?如何做數(shù)據(jù)標注? 自動駕駛
    的頭像 發(fā)表于 07-09 09:19 ?1725次閱讀
    什么是自動駕駛<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標注</b>?如何好做<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標注</b>?

    端到端數(shù)據(jù)標注方案在自動駕駛領(lǐng)域的應(yīng)用優(yōu)勢

    10-20TB,其中需要標注數(shù)據(jù)占比超過60%。在這樣的背景下,端到端數(shù)據(jù)標注方案應(yīng)運而生,正在重塑自動駕駛的數(shù)據(jù)生產(chǎn)范式。 端到端
    的頭像 發(fā)表于 06-23 17:27 ?1217次閱讀

    數(shù)據(jù)標注與大模型的雙向賦能:效率與性能的躍升

    ??在人工智能蓬勃發(fā)展的時代,大模型憑借其強大的學(xué)習(xí)與泛化能力,已成為眾多領(lǐng)域創(chuàng)新變革的核心驅(qū)動力。而數(shù)據(jù)標注作為大模型訓(xùn)練的基石,為大模型性能提升注入關(guān)鍵動力,是模型不可或缺的“養(yǎng)料。大模型則憑借
    的頭像 發(fā)表于 06-04 17:15 ?2275次閱讀
    <b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標注</b>與大模型的雙向賦能:效率與性能的躍升

    淺析AI數(shù)據(jù)采集標注在運動健康領(lǐng)域的落地應(yīng)用

    的核心引擎。AI數(shù)據(jù)采集標注作為人工智能技術(shù)應(yīng)用的根基,通過為算法模型提供高質(zhì)量的數(shù)據(jù)支撐,在運動健康領(lǐng)域的多個場景實現(xiàn)了深度落地,從根本上改變了傳統(tǒng)運動健康管理
    的頭像 發(fā)表于 05-28 17:39 ?1195次閱讀
    淺析AI<b class='flag-5'>數(shù)據(jù)采集</b>和<b class='flag-5'>標注</b>在運動健康領(lǐng)域的落地應(yīng)用

    東軟集團入選國家數(shù)據(jù)數(shù)據(jù)標注優(yōu)秀案例

    近日,東軟飛標醫(yī)學(xué)影像標注平臺在國家數(shù)據(jù)局發(fā)布數(shù)據(jù)標注優(yōu)秀案例集名單中排名第一(案例名稱“多模態(tài)醫(yī)學(xué)影像智能數(shù)據(jù)
    的頭像 發(fā)表于 05-09 14:37 ?1471次閱讀
    义乌市| 洛扎县| 大新县| 新昌县| 江津市| 宁国市| 荃湾区| 乐安县| 镇江市| 杨浦区| 沧州市| 松滋市| 昌吉市| 宣武区| 盐津县| 靖远县| 鄂州市| 寻甸| 石城县| 都兰县| 惠来县| 枞阳县| 房山区| 常山县| 馆陶县| 阆中市| 苍溪县| 庆城县| 和田县| 西盟| 融水| 南溪县| 盐亭县| 宜黄县| 安乡县| 普宁市| 开封县| 错那县| 滦平县| 泸定县| 宿迁市|