日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

八大機(jī)器學(xué)習(xí)數(shù)據(jù)集

DPVg_AI_era ? 來源:lq ? 2019-01-18 09:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,Medium上的一位用戶整理了一份機(jī)器學(xué)習(xí)大型數(shù)據(jù)集清單,包括八大數(shù)據(jù)集資源庫??傆幸豢钸m合你,快來收藏吧!

下面的ML大型數(shù)據(jù)集,總有一款適合你。

就目前來看,找到一個(gè)特定的數(shù)據(jù)集來解決各種機(jī)器學(xué)習(xí)問題,甚至進(jìn)行實(shí)驗(yàn)還是比較困難的。

本文作者Will Badr便列舉了八大機(jī)器學(xué)習(xí)數(shù)據(jù)集。

不僅包含用于實(shí)驗(yàn)的大型數(shù)據(jù)集,還附帶對(duì)數(shù)據(jù)集的描述以及使用示例。有的還包含用于解決與該數(shù)據(jù)集相關(guān)機(jī)器學(xué)習(xí)問題的算法代碼。

話不多說,上數(shù)據(jù)集!

1、Kaggle數(shù)據(jù)集

數(shù)據(jù)集地址:

https://www.kaggle.com/datasets

這是作者最喜歡的數(shù)據(jù)集之一。

每個(gè)數(shù)據(jù)集都是一個(gè)小型社區(qū),用戶可以在其中討論數(shù)據(jù)、查找公共代碼或在內(nèi)核中創(chuàng)建自己的項(xiàng)目。包含各式各樣的真實(shí)數(shù)據(jù)集。

用戶還可以看到與每個(gè)數(shù)據(jù)集相關(guān)的“內(nèi)核”,許多數(shù)據(jù)科學(xué)家還提供了相關(guān)手冊(cè)來分析數(shù)據(jù)集。

2、Amazon數(shù)據(jù)集

數(shù)據(jù)集地址:

https://registry.opendata.aws/

該數(shù)據(jù)源包含多個(gè)不同領(lǐng)域的數(shù)據(jù)集,如:公共交通、生態(tài)資源、衛(wèi)星圖像等。

網(wǎng)頁中也有一個(gè)搜索框來幫助用戶尋找想要的數(shù)據(jù)集,還有所有數(shù)據(jù)集的描述和使用示例,這些數(shù)據(jù)集信息豐富且易于使用!

數(shù)據(jù)集存儲(chǔ)在Amazon Web Services (AWS)資源中,比如Amazon S3——云中的一個(gè)高度可伸縮的對(duì)象存儲(chǔ)服務(wù)。

如果用戶正在使用AWS進(jìn)行機(jī)器學(xué)習(xí)實(shí)驗(yàn)和開發(fā),這將非常方便,由于它是AWS網(wǎng)絡(luò)的本地?cái)?shù)據(jù),因此數(shù)據(jù)集的傳輸將非???。

3、UCI機(jī)器學(xué)習(xí)資源庫

數(shù)據(jù)集地址:

https://archive.ics.uci.edu/ml/datasets.html

另一個(gè)來自加州大學(xué)信息與計(jì)算機(jī)科學(xué)學(xué)院的大型資源庫,包含100多個(gè)數(shù)據(jù)集。

用戶可以找到單變量和多變量時(shí)間序列數(shù)據(jù)集,分類、回歸或推薦系統(tǒng)的數(shù)據(jù)集。

有些UCI的數(shù)據(jù)集已經(jīng)是被清洗過的。

4、谷歌數(shù)據(jù)集搜索引

數(shù)據(jù)集地址:

https://toolbox.google.com/datasetsearch

在2018年末,谷歌做了他們最擅長的事情,推出了另一項(xiàng)偉大的服務(wù)——它是一個(gè)可以按名稱搜索數(shù)據(jù)集的工具箱。

他們的目標(biāo)是統(tǒng)一成千上萬個(gè)不同的數(shù)據(jù)集存儲(chǔ)庫,使這些數(shù)據(jù)能夠且易被發(fā)現(xiàn)。

5、微軟數(shù)據(jù)集

數(shù)據(jù)集地址:

https://msropendata.com/

2018年7月,微軟與外部研究社區(qū)共同宣布推出“Microsoft Research Open Data”。

它在云中包含一個(gè)數(shù)據(jù)存儲(chǔ)庫,用于促進(jìn)全球研究社區(qū)之間的協(xié)作。它提供了一系列用于已發(fā)表研究的、經(jīng)過處理的數(shù)據(jù)集。

6、Awesome Public Datasets Collection

數(shù)據(jù)集地址:

https://github.com/awesomedata/awesome-public-datasets

這是一個(gè)按“主題”組織的數(shù)據(jù)集,比如生物學(xué)、經(jīng)濟(jì)學(xué)、教育學(xué)等。

這里列出的大多數(shù)數(shù)據(jù)集都是免費(fèi)的,但是在使用任何數(shù)據(jù)集之前,用戶需要檢查一下許可要求。

7、政府?dāng)?shù)據(jù)集

政府相關(guān)數(shù)據(jù)集也很容易找到的。

許多國家為了提高透明度,向公眾分享了各種數(shù)據(jù)集。以下是一些例子:

歐盟開放數(shù)據(jù)門戶:歐洲政府?dāng)?shù)據(jù)集。

數(shù)據(jù)集地址:

https://data.europa.eu/euodp/data/dataset

美國政府?dāng)?shù)據(jù):目前由于一些非政治性原因,暫時(shí)無法訪問。

數(shù)據(jù)集地址:

https://www.data.gov/

新西蘭政府?dāng)?shù)據(jù)集:

數(shù)據(jù)集地址:

https://catalogue.data.govt.nz/dataset

印度政府?dāng)?shù)據(jù)集:

數(shù)據(jù)集地址:

https://data.gov.in/

8、計(jì)算機(jī)視覺數(shù)據(jù)集

數(shù)據(jù)集地址:

https://www.visualdata.io/

Visual Data包含一些可以用來構(gòu)建計(jì)算機(jī)視覺(CV)模型的大型數(shù)據(jù)集。

用戶可以通過特定的CV主題查找特定的數(shù)據(jù)集,如語義分割、圖像標(biāo)題、圖像生成,甚至可以通過解決方案(自動(dòng)駕駛汽車數(shù)據(jù)集)查找特定的數(shù)據(jù)集。

總結(jié)

從上述作者所觀察到數(shù)據(jù)集情況來看,似乎是涵蓋各個(gè)方向和領(lǐng)域。

這些新數(shù)據(jù)集的社區(qū)將繼續(xù)發(fā)展,使數(shù)據(jù)更容易被獲取,使眾包和計(jì)算機(jī)科學(xué)社區(qū)能夠繼續(xù)快速創(chuàng)新,為生活帶來更多創(chuàng)造性的解決方案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4810

    瀏覽量

    98615
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    67

    文章

    8567

    瀏覽量

    137265
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1240

    瀏覽量

    26264

原文標(biāo)題:【收藏】8款大型機(jī)器學(xué)習(xí)數(shù)據(jù)集頂級(jí)資源

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    機(jī)器學(xué)習(xí)中的數(shù)據(jù)質(zhì)量雙保障:從“驗(yàn)證”到“標(biāo)記”

    機(jī)器學(xué)習(xí)的世界里,有句老話尤為貼切:“garbagein,garbageout”(輸入垃圾,輸出垃圾)。無論模型架構(gòu)多先進(jìn)、算法多精妙,數(shù)據(jù)的質(zhì)量始終是決定模型性能的核心。本文聚焦數(shù)據(jù)
    的頭像 發(fā)表于 04-24 15:48 ?122次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>中的<b class='flag-5'>數(shù)據(jù)</b>質(zhì)量雙保障:從“驗(yàn)證”到“標(biāo)記”

    具身智能領(lǐng)銜,八大展區(qū)重構(gòu)亞洲科技版圖

    具身智能領(lǐng)銜,八大展區(qū)重構(gòu)亞洲科技版圖
    的頭像 發(fā)表于 03-23 16:20 ?188次閱讀

    登臨科技攜手多家科技在八大領(lǐng)域落地典型AI應(yīng)用案例

    八大領(lǐng)域落地典型 AI 應(yīng)用案例,以技術(shù)創(chuàng)新推動(dòng)制造業(yè)效率與質(zhì)量雙提升,為工業(yè) AI 規(guī)?;瘧?yīng)用打造可復(fù)制的實(shí)踐范本。
    的頭像 發(fā)表于 03-11 14:13 ?487次閱讀

    機(jī)器學(xué)習(xí)特征工程:分類變量的數(shù)值化處理方法

    編碼是機(jī)器學(xué)習(xí)流程里最容易被低估的環(huán)節(jié)之一,模型沒辦法直接處理文本形式的分類數(shù)據(jù),尺寸(Small/Medium/Large)、顏色(Red/Blue/Green)、城市、支付方式等都是典型的分類
    的頭像 發(fā)表于 02-10 15:58 ?475次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>特征工程:分類變量的數(shù)值化處理方法

    CITE2026公布八大關(guān)鍵詞,解構(gòu)2026電子信息行業(yè)發(fā)展新態(tài)勢(shì)

    聚焦產(chǎn)業(yè)前沿與核心趨勢(shì),特別圍繞 “八大關(guān)鍵詞” 構(gòu)建展示框架,為業(yè)界呈現(xiàn)一場前瞻洞察、技術(shù)展示、交流合作于一體的科技盛宴。 1、 消費(fèi)電子 近年來,隨著5G、人工智能、物聯(lián)網(wǎng)等技術(shù)的快速發(fā)展,智能手機(jī)、智能家居、可穿戴設(shè)備等新興產(chǎn)品需求
    的頭像 發(fā)表于 02-03 10:35 ?606次閱讀
    CITE2026公布<b class='flag-5'>八大</b>關(guān)鍵詞,解構(gòu)2026電子信息行業(yè)發(fā)展新態(tài)勢(shì)

    八大常見芯片封裝類型及應(yīng)用!

    的話,給大家盤點(diǎn)八大主流芯片封裝形式,看完就能分清它們的用途~01DIP雙列直插式封裝個(gè)常見芯片封裝類型作為很經(jīng)典的封裝形式,DIP的引腳從兩側(cè)對(duì)稱引出,材料有塑
    的頭像 發(fā)表于 02-02 15:01 ?1551次閱讀
    <b class='flag-5'>八大</b>常見芯片封裝類型及應(yīng)用!

    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個(gè)常見錯(cuò)誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時(shí)間,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時(shí)刻關(guān)注并銘記的常見錯(cuò)誤。如果對(duì)這些錯(cuò)誤置之不理,日后可能會(huì)引發(fā)諸多麻煩!只要我們密切關(guān)注數(shù)據(jù)
    的頭像 發(fā)表于 01-07 15:37 ?368次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個(gè)常見錯(cuò)誤與局限性

    從原理到場景:工業(yè)光電傳感器八大檢測原理

    在工業(yè)自動(dòng)化的世界里,光電傳感器如同機(jī)器的“眼睛”,時(shí)刻感知環(huán)境、檢測物體,讓自動(dòng)化成為可能。作為深耕光電傳感多年的傳感器專家,本期小明將帶大家深入了解工業(yè)光電傳感器的經(jīng)典八大檢測原理,揭秘它們
    的頭像 發(fā)表于 11-18 07:33 ?1548次閱讀
    從原理到場景:工業(yè)光電傳感器<b class='flag-5'>八大</b>檢測原理

    RK3576機(jī)器人核心:三屏異顯+路攝像頭,重塑機(jī)器人交互與感知

    瑞芯微RK3576 AIoT處理器處理器憑借其卓越的多屏異顯與8路攝像頭接入能力,為機(jī)器人領(lǐng)域帶來革新。米爾電子MYD-LR3576開發(fā)板實(shí)測數(shù)據(jù)顯示,在高負(fù)載下CPU占用僅34%,完美實(shí)現(xiàn)多路視覺
    發(fā)表于 10-29 16:41

    【Sipeed MaixCAM Pro開發(fā)板試用體驗(yàn)】 + 04 + 機(jī)器學(xué)習(xí)YOLO體驗(yàn)

    、 機(jī)器學(xué)習(xí)YOLO體驗(yàn) 1.在線訓(xùn)練 Sipeed矽速科技擁有自研搭建的MaixHub平臺(tái),可以快速簡單的完成yolo訓(xùn)練。 下面我將展示訓(xùn)練拍攝標(biāo)注和訓(xùn)練的相關(guān)圖片 數(shù)據(jù)
    發(fā)表于 07-24 21:35

    云訓(xùn)練平臺(tái)數(shù)據(jù)過大無法下載數(shù)據(jù)至本地怎么解決?

    起因是現(xiàn)在平臺(tái)限制了圖片數(shù)量,想要本地訓(xùn)練下載數(shù)據(jù)時(shí)發(fā)現(xiàn)只會(huì)跳出網(wǎng)絡(luò)異常的錯(cuò)誤,請(qǐng)問這有什么解決辦法?
    發(fā)表于 07-22 06:03

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場可編程門陣列)作為一種靈活且高效的硬件加速平臺(tái)
    的頭像 發(fā)表于 07-16 15:34 ?3120次閱讀

    江智原創(chuàng)性老人八大關(guān)鍵時(shí)光點(diǎn)全覆蓋 康養(yǎng)生態(tài)軟件系統(tǒng)

    深圳市江智工業(yè)技術(shù)有限公司從2016年開始專注康養(yǎng)機(jī)器人10年來的努力,專注老人穿戴,飲食,居住,出行,作息,文旅,健康,內(nèi)心八大關(guān)鍵時(shí)光節(jié)點(diǎn)全覆蓋的全球原創(chuàng)性的康養(yǎng)軟件系統(tǒng)于2025年6月正式發(fā)布
    的頭像 發(fā)表于 06-29 20:54 ?1182次閱讀
    江智原創(chuàng)性老人<b class='flag-5'>八大</b>關(guān)鍵時(shí)光點(diǎn)全覆蓋 康養(yǎng)生態(tài)軟件系統(tǒng)

    使用AICube導(dǎo)入數(shù)據(jù)點(diǎn)創(chuàng)建后提示數(shù)據(jù)不合法怎么處理?

    重現(xiàn)步驟 data目錄下 labels.txt只有英文 **錯(cuò)誤日志** 但是使用示例的數(shù)據(jù)可以完成訓(xùn)練并部署
    發(fā)表于 06-24 06:07

    數(shù)據(jù)下載失敗的原因?

    數(shù)據(jù)下載失敗什么原因太大了嗎,小的可以下載,想把大的下載去本地訓(xùn)練報(bào)錯(cuò)網(wǎng)絡(luò)錯(cuò)誤 大的數(shù)據(jù)多大?數(shù)據(jù)量有多少?
    發(fā)表于 06-18 07:04
    大冶市| 西吉县| 青龙| 澄城县| 治多县| 西贡区| 和田市| 沂南县| 东源县| 建德市| 蓝田县| 陆良县| 永康市| 朝阳市| 阿鲁科尔沁旗| 兴国县| 湟源县| 诸城市| 盐山县| 洞头县| 焦作市| 团风县| 交城县| 湖口县| 潍坊市| 宁津县| 界首市| 涟水县| 玛纳斯县| 宜兰市| 绥德县| 纳雍县| 苍溪县| 婺源县| 美姑县| 讷河市| 林西县| 永善县| 西丰县| 清丰县| 麻栗坡县|