日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟開源的計算機(jī)視覺庫

新機(jī)器視覺 ? 來源:機(jī)器之心 ? 2020-08-28 11:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文介紹了微軟開源的計算機(jī)視覺庫,它囊括了計算機(jī)視覺領(lǐng)域的最佳實踐、代碼示例和豐富文檔。

近年來,計算機(jī)視覺領(lǐng)域突飛猛進(jìn),在人臉識別、圖像理解、搜索、無人機(jī)、地圖、半自動和自動駕駛方面得到廣泛應(yīng)用。而這些應(yīng)用的核心部分是視覺識別任務(wù),如圖像分類、目標(biāo)檢測和圖像相似度。 在各種計算機(jī)視覺模型和應(yīng)用層出不窮的當(dāng)下,如何把握發(fā)展脈絡(luò),跟進(jìn)領(lǐng)域前沿發(fā)展呢?微軟創(chuàng)建了一個庫,提供構(gòu)建計算機(jī)視覺系統(tǒng)的大量示例和最佳實踐指導(dǎo)原則。 項目地址:https://github.com/microsoft/computervision-recipes 這個庫旨在構(gòu)建一個全面的集合,涵蓋利用了計算機(jī)視覺算法、神經(jīng)架構(gòu)和系統(tǒng)運行方面近期進(jìn)展的工具和示例。 該庫沒有從頭開始創(chuàng)建實現(xiàn),而是基于已有的 SOTA 庫發(fā)展而來,并圍繞加載圖像數(shù)據(jù)、優(yōu)化和評估模型、擴(kuò)展至云端構(gòu)建了額外的工具函數(shù)。此外,微軟團(tuán)隊表示,希望通過該項目回答計算機(jī)視覺領(lǐng)域的常見問題、指出頻繁出現(xiàn)的缺陷問題,并展示如何利用云進(jìn)行模型訓(xùn)練和部署。 該庫中所有示例以 Jupyter notebooks 和常見工具函數(shù)的形式呈現(xiàn)。所有示例均使用 PyTorch 作為底層深度學(xué)習(xí)庫。

Jupyter notebooks 地址:https://github.com/microsoft/computervision-recipes/blob/master/scenarios

工具函數(shù)地址:https://github.com/microsoft/computervision-recipes/blob/master/utils_cv

目標(biāo)群體 該庫的目標(biāo)群體是具備一定計算機(jī)視覺知識背景的數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師,因為庫的內(nèi)容以 source-only(僅源代碼)的形式呈現(xiàn),支持自定義機(jī)器學(xué)習(xí)建模。這個庫提供的工具函數(shù)和示例旨在為現(xiàn)實世界的視覺問題提供解決方案加速器。 示例 該庫支持不同的計算機(jī)視覺場景,如基于單張圖像運行,示例如下:

或基于視頻序列的動作識別等場景,示例如下:

場景 該庫涵蓋常用的計算機(jī)視覺場景,包含如下類別:

對于每個主要場景(base),該項目均提供使用戶高效構(gòu)建自己模型的工具。這需要使用者完成一些任務(wù),如基于自己的數(shù)據(jù)微調(diào)模型的簡單任務(wù),或者難例挖掘甚至模型部署等更復(fù)雜的任務(wù)。 1. 圖像分類任務(wù) 該目錄提供了構(gòu)建圖像分類系統(tǒng)的示例和最佳實踐,旨在讓用戶能夠在自己的數(shù)據(jù)集上輕松快速地訓(xùn)練高準(zhǔn)確率分類器。 這里提供的示例 notebook 具備預(yù)置的默認(rèn)參數(shù),可以很好地處理多個數(shù)據(jù)集。該目錄還提供了有關(guān)常見缺陷和最佳實踐的大量文檔。 此外,該庫還展示了如何使用微軟的云計算平臺 Azure,加快在大型數(shù)據(jù)集上的訓(xùn)練速度或?qū)⒛P筒渴馂?web 服務(wù)。

2. 圖像相似度 該目錄提供了構(gòu)建圖像相似度系統(tǒng)的示例和最佳實踐,旨在使用戶能夠基于自己的數(shù)據(jù)集方便快捷地訓(xùn)練高精度模型。 下圖為圖像檢索示例,其中左圖為查詢圖像,右面為與之最相似的 6 幅圖像:

3. 目標(biāo)檢測 該目錄提供了構(gòu)建目標(biāo)檢測系統(tǒng)的示例和最佳實踐,旨在使用戶能夠基于自己的數(shù)據(jù)集方便快捷地訓(xùn)練高準(zhǔn)確率模型。

該庫使用了 torchvision 的 Faster R-CNN 實現(xiàn),它被證明能夠很好地處理多種計算機(jī)視覺問題。 項目作者建議使用者在具備 GPU 的機(jī)器上運行示例,雖然 GPU 在技術(shù)層面上并非必需,但是如果不使用 GPU,即使只用幾十個圖像,訓(xùn)練過程也會變得非常緩慢。 4. 關(guān)鍵點檢測 該目錄包含構(gòu)建關(guān)鍵點檢測系統(tǒng)的示例和最佳實踐指導(dǎo)原則,并展示了如何使用預(yù)訓(xùn)練模型進(jìn)行人體姿勢估計。 該目錄使用了 Mask R-CNN 的擴(kuò)展,可以同時檢測物體及其關(guān)鍵點。其底層技術(shù)與上述目標(biāo)檢測方法類似,即基于 Torchvision 的 Mask R-CNN。

5. 圖像分割 該目錄提供了構(gòu)建圖像分割系統(tǒng)的示例和最佳實踐,旨在使用戶能夠基于自己的數(shù)據(jù)集方便快捷地訓(xùn)練高準(zhǔn)確率模型。

這里的實現(xiàn)使用了 fastai 的 UNet 模型,其中 CNN 主干(如 ResNet)在 ImageNet 數(shù)據(jù)集上經(jīng)過預(yù)訓(xùn)練,因此使用者只需少量標(biāo)注訓(xùn)練樣本就可以對其進(jìn)行微調(diào)。 6. 動作識別 該目錄包含構(gòu)建基于視頻的動作識別系統(tǒng)所需要的資源,旨在使用戶能夠在自定義數(shù)據(jù)集上輕松快速地訓(xùn)練出高準(zhǔn)確率的快速模型。 動作識別(也叫「活動識別」)包括從一系列幀中對多種動作進(jìn)行分類,例如「閱讀」或「飲酒」:

動作識別是一個熱門的研究領(lǐng)域,每年都有大量的方法發(fā)表。其中一個突出的方法是 R(2+1)D 模型,它能夠獲得高準(zhǔn)確率,且比其他方法快得多。(參見論文《Large-scale weakly-supervised pre-training for video action recognition》) 該目錄中的實現(xiàn)和預(yù)訓(xùn)練權(quán)重均基于這個 GitHub 庫(https://github.com/moabitcoin/ig65m-pytorch),并添加了一些功能,以使自定義模型的訓(xùn)練和評估更加用戶友好。這里在預(yù)訓(xùn)練時使用的是 IG-Kinetics 數(shù)據(jù)集。 7. 多目標(biāo)跟蹤 該目錄提供了構(gòu)建和推斷多目標(biāo)跟蹤系統(tǒng)的示例和最佳實踐,旨在使用戶能夠基于自定義數(shù)據(jù)集輕松訓(xùn)練高準(zhǔn)確率跟蹤模型。 該庫集成了 FairMOT 跟蹤算法,該算法在近期的 MOT 基準(zhǔn)測試中表現(xiàn)出了很強(qiáng)的跟蹤性能,同時也推理速度也很快。 8. 人群計數(shù) 該目錄提供了多個人群計數(shù)算法的 production-ready 版本,不同算法被統(tǒng)一在一組一致性 API 下。

對多個基于專用數(shù)據(jù)集的人群計數(shù)模型實現(xiàn)進(jìn)行評估后,該項目將模型范圍縮小到兩個選項:Multi Column CNN model (MCNN) 和 OpenPose 模型。二者均符合速度要求。

對于高密度人群圖像,MCNN 模型取得了良好的效果;

對于低密度場景,OpenPose 表現(xiàn)良好。

而當(dāng)人群密度未知時,該項目采用啟發(fā)式方法。在滿足以下條件時使用 MCNN 進(jìn)行預(yù)測:OpenPose 預(yù)測大于 20,MCNN 大于 50。反之,則使用 OpenPose 預(yù)測。模型的閾值可以根據(jù)使用者的場景進(jìn)行更改。

此外,該目錄還展示了依賴項、安裝過程、測試及性能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6754

    瀏覽量

    108102
  • 計算機(jī)視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1716

    瀏覽量

    47736
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    67

    文章

    8567

    瀏覽量

    137268

原文標(biāo)題:PyTorch實現(xiàn),GitHub 4000星:這是微軟開源的計算機(jī)視覺庫

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    傳音相關(guān)研究成果入選計算機(jī)視覺頂會CVPR 2026

    (Mohamed bin Zayed University of Artificial Intelligence,簡稱MBZUAI)聯(lián)合開展的“拍照解題”項目研究取得重要進(jìn)展,相關(guān)成果論文已被計算機(jī)視覺領(lǐng)域的國際頂級學(xué)術(shù)會議CVPR 2026正式錄用。
    的頭像 發(fā)表于 04-03 17:45 ?2989次閱讀
    傳音相關(guān)研究成果入選<b class='flag-5'>計算機(jī)</b><b class='flag-5'>視覺</b>頂會CVPR 2026

    基于摩托羅拉68000系列處理器的單板計算機(jī)開源項目介紹

    今天給大家?guī)硪豢畛岬?b class='flag-5'>開源復(fù)古計算項目—— 基于摩托羅拉 68000 系列處理器的單板計算機(jī)(SBC)!從 MC68008 到 MC68040,多代機(jī)型持續(xù)迭代,每款都能運行 Linux
    的頭像 發(fā)表于 03-06 11:43 ?770次閱讀
    基于摩托羅拉68000系列處理器的單板<b class='flag-5'>計算機(jī)</b><b class='flag-5'>開源</b>項目介紹

    上海計算機(jī)視覺企業(yè)行學(xué)術(shù)沙龍走進(jìn)西井科技

    12月5日,由中國圖象圖形學(xué)學(xué)會青年工作委員會(下簡稱“青工委”)、上海市計算機(jī)學(xué)會計算機(jī)視覺專委會(下簡稱“專委會”)聯(lián)合主辦,上海西井科技股份有限公司、江蘇路街道商會承辦的“上海計算機(jī)
    的頭像 發(fā)表于 12-16 15:39 ?757次閱讀

    使用代理式AI激活傳統(tǒng)計算機(jī)視覺系統(tǒng)的三種方法

    當(dāng)前的計算機(jī)視覺系統(tǒng)擅長于識別物理空間與流程中的事件,卻難以詮釋場景細(xì)節(jié)及其意義,也無法推理后續(xù)可能發(fā)生的情況。
    的頭像 發(fā)表于 12-01 09:44 ?800次閱讀

    工控機(jī)與普通計算機(jī)的核心差異解析

    在工業(yè)自動化和智能制造領(lǐng)域,計算機(jī)設(shè)備作為核心控制單元,其選擇直接影響整個系統(tǒng)的穩(wěn)定性與可靠性。工控機(jī)與普通計算機(jī)雖同屬計算設(shè)備,但其設(shè)計目標(biāo)、性能側(cè)重和應(yīng)用場景存在根本性差異。準(zhǔn)確理解這些差異,是進(jìn)行正確設(shè)備選型的基礎(chǔ)。
    的頭像 發(fā)表于 11-25 14:45 ?2024次閱讀
    工控機(jī)與普通<b class='flag-5'>計算機(jī)</b>的核心差異解析

    STM32計算機(jī)視覺開發(fā)套件:B-CAMS-IMX攝像頭模塊技術(shù)解析

    STMicroelectronics用于 STM32開發(fā)板的B-CAMS-IMX攝像頭模塊提供強(qiáng)大的硬件集,可處理多種計算機(jī)視覺場景和用例。該模塊具有高分辨率500萬像素IMX335LQN
    的頭像 發(fā)表于 10-20 09:46 ?1676次閱讀
    STM32<b class='flag-5'>計算機(jī)</b><b class='flag-5'>視覺</b>開發(fā)套件:B-CAMS-IMX攝像頭模塊技術(shù)解析

    【作品合集】賽昉科技VisionFive 2單板計算機(jī)開發(fā)板測評

    +FBNeo虛擬機(jī), 多款游戲ROM分享)【VisionFive 2單板計算機(jī)試用體驗】3、開源大語言模型部署 作者:gtbestom【VisionFive 2單板計算機(jī)試用體驗】開箱+開發(fā)環(huán)境搭建
    發(fā)表于 09-04 09:08

    微軟正式發(fā)布Microsoft行星計算機(jī)專業(yè)版

    地理空間數(shù)據(jù)雖賦能能源、農(nóng)業(yè)、零售等多領(lǐng)域,卻因復(fù)雜性與數(shù)據(jù)孤島問題長期局限于專家群體。微軟正式發(fā)布Microsoft行星計算機(jī)專業(yè)版,通過Microsoft Azure(國際版)整合AI技術(shù)分析能力,實現(xiàn)海量數(shù)據(jù)從采集、處理到洞察的全流程管理,推動可持續(xù)決策成為企業(yè)新基
    的頭像 發(fā)表于 08-19 14:31 ?1355次閱讀

    易控智駕榮獲計算機(jī)視覺頂會CVPR 2025認(rèn)可

    近日,2025年國際計算機(jī)視覺與模式識別頂級會議(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美國田納西州納什維爾召開。
    的頭像 發(fā)表于 07-29 16:54 ?1404次閱讀

    工業(yè)計算機(jī)的重要性

    工業(yè)計算機(jī)對某些行業(yè)至關(guān)重要。我們將在下面詳細(xì)解釋這些行業(yè)中的工業(yè)計算機(jī)應(yīng)用。1.制造與工業(yè)自動化工業(yè)級計算機(jī)非常適合制造工廠,特別是那些想要自動化裝配過程的工廠。在這樣的環(huán)境中,工業(yè)計算機(jī)
    的頭像 發(fā)表于 07-28 16:07 ?748次閱讀
    工業(yè)<b class='flag-5'>計算機(jī)</b>的重要性

    自動化計算機(jī)經(jīng)過加固后有什么好處?

    讓我們討論一下部署堅固的自動化計算機(jī)的一些好處。1.溫度范圍寬自動化計算機(jī)經(jīng)過工程設(shè)計,配備了支持寬溫度范圍的組件,使自動化計算解決方案能夠在各種不同的極端環(huán)境中運行。自動化計算機(jī)能夠
    的頭像 發(fā)表于 07-21 16:44 ?781次閱讀
    自動化<b class='flag-5'>計算機(jī)</b>經(jīng)過加固后有什么好處?

    自動化計算機(jī)的功能與用途

    工業(yè)自動化是指利用自動化計算機(jī)來控制工業(yè)環(huán)境中的流程、機(jī)器人和機(jī)械,以制造產(chǎn)品或其部件。工業(yè)自動化的目的是提高生產(chǎn)率、增加靈活性,并提升制造過程的質(zhì)量。工業(yè)自動化在汽車制造中體現(xiàn)得最為明顯,其中許多
    的頭像 發(fā)表于 07-15 16:32 ?930次閱讀
    自動化<b class='flag-5'>計算機(jī)</b>的功能與用途

    工業(yè)計算機(jī)與商用計算機(jī)的區(qū)別有哪些

    工業(yè)計算機(jī)是一種專為工廠和工業(yè)環(huán)境設(shè)計的計算系統(tǒng),具有高可靠性和穩(wěn)定性,能夠應(yīng)對惡劣環(huán)境下的自動化、制造和機(jī)器人操作。其特點包括無風(fēng)扇散熱技術(shù)、無電纜連接和防塵防水設(shè)計,使其在各種工業(yè)自動化場景中
    的頭像 發(fā)表于 07-10 16:36 ?942次閱讀
    工業(yè)<b class='flag-5'>計算機(jī)</b>與商用<b class='flag-5'>計算機(jī)</b>的區(qū)別有哪些

    利用邊緣計算和工業(yè)計算機(jī)實現(xiàn)智能視頻分析

    IVA的好處、實際部署應(yīng)用程序以及工業(yè)計算機(jī)如何實現(xiàn)這些解決方案。一、什么是智能視頻分析(IVA)?智能視頻分析(IVA)集成了復(fù)雜的計算機(jī)視覺,通常與卷積神經(jīng)網(wǎng)
    的頭像 發(fā)表于 05-16 14:37 ?1011次閱讀
    利用邊緣<b class='flag-5'>計算</b>和工業(yè)<b class='flag-5'>計算機(jī)</b>實現(xiàn)智能視頻分析
    聂拉木县| 宣恩县| 秭归县| 三明市| 铜山县| 天台县| 高阳县| 甘孜| 布尔津县| 泰安市| 宕昌县| 即墨市| 甘肃省| 安福县| 盐边县| 祁连县| 龙井市| 炎陵县| 万山特区| 高阳县| 孙吴县| 龙山县| 林芝县| 依安县| 芦溪县| 泸水县| 大丰市| 安义县| 海林市| 大石桥市| 乡宁县| 凌海市| 阿克陶县| 蓬溪县| 峡江县| 吴忠市| 南通市| 英山县| 葵青区| 康平县| 大渡口区|