日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

極鏈科技HPAIC人類蛋白質(zhì)圖譜分類挑戰(zhàn)賽金牌經(jīng)驗分享

張康康 ? 2019-07-29 18:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近期,由Kaggle主辦,Leica Microsystems和NVIDIA贊助的HPAIC(Human Protein Atlas Image Classification)競賽正式結束。比賽為期三個月,共有來自全球的2236個隊伍參加,極鏈AI研究院與工程院最終獲得挑戰(zhàn)賽金牌。

比賽介紹

蛋白質(zhì)是人體細胞中的“行動者”,執(zhí)行許多共同促進生命的功能。蛋白質(zhì)的分類僅限于一種或幾種細胞類型中的單一模式,但是為了完全理解人類細胞的復雜性,模型必須在一系列不同的人類細胞中對混合模式進行分類。

可視化細胞中蛋白質(zhì)的圖像通常用于生物醫(yī)學研究,這些細胞可以成為下一個醫(yī)學突破的關鍵。然而,由于高通量顯微鏡的進步,這些圖像的生成速度遠遠超過人工評估的速度。因此,對于自動化生物醫(yī)學圖像分析以加速對人類細胞和疾病的理解,需要比以往更大的需求。

雖然這是生物學方面的競賽,但是其本質(zhì)是機器視覺方向的圖像多標簽分類問題,參賽隊伍也包括許多機器視覺和機器學習領域的競賽專家。

數(shù)據(jù)分析

官方給我們提供了兩種類型的數(shù)據(jù)集,一部分是512x512的png圖像,一部分是2048x2048或3072x3072的TIFF圖像,數(shù)據(jù)集大概 268G, 其中訓練集:31072 x 4張,測試集:11702 x 4張。

一個蛋白質(zhì)圖譜由4種染色方式組成(red,green,blue,yellow),圖像示例如下:


我們將4個通道合并成3通道(RYB)可視化的圖像如下所示:


在本次競賽中一共有28個類別,比如 Nucleoplasm、Nuclear membrane等,每個圖譜圖像都可以有一個或者多個標簽。標簽數(shù)量統(tǒng)計如下:

e0892ea8aa624602a2bf616a52be54bb


可以發(fā)現(xiàn)標簽數(shù)量集中在1-3個,但是仍然會有圖像有5個標簽,給比賽增加了一定的難度。

a700719ec2bf4704a9649d0bd424bed7


另一方面的難點是數(shù)據(jù)集中樣本數(shù)量很不均勻,圖像最多的類別有12885張,而圖像最少的類別只有11張圖像,這給競賽造成很大的困難,樣本數(shù)量分布情況可以在圖中看出。

在比賽過程中逐步有參賽者發(fā)現(xiàn)官方的額外數(shù)據(jù)集HPAv18,并得到官方授權,這些數(shù)據(jù)集有105678張,很大程度的擴大了樣本數(shù)量,同時給我們提供了很大的幫助。

環(huán)境資源

硬件方面我們使用了4塊NVIDIA TESLA P100顯卡,使用pytorch作為我們的模型訓練框架。

圖像預處理

HPAv18 圖像與官方給出的圖像有一定的差別,雖然也是由4中染色方式組成,但是每個染色圖像是一個RGB圖像,而不是官方的單通道圖像,而且RGB三個通道的值差別較大,我們對這些圖像做了預處理,對每個RGB圖像只取一個通道(r_out=r,g_out=g,b_out=b,y_out=b),并將這些圖像縮放到512x512和1024x1024兩種尺度。

36a79fb3e91c487aacddb96586f6eb85


對于TIFF文件,我們用了一周的時間把這個數(shù)據(jù)集下載下來,然后將所有圖像縮放到1024x1024。

數(shù)據(jù)增廣

我們比賽中使用的增廣方式有Rotation, Flip 和 Shear三種;因為我們不知道一張圖像中的多個細胞之間是否有關聯(lián)關系,所以比賽中沒有使用隨機裁剪的增廣方式。

模型

我們最終使用的基礎模型有Inceptionv3,Inceptionv4以及Xception三種,比賽前期我們測試了VGG,ResNet,ResNext,SeNet,但是效果不是很好,因此比賽末期沒有再進行進一步測試。

我們使用了512,650和800三種尺度來增加網(wǎng)絡對圖像的理解,另外每個尺度進行10折交叉驗證,保證驗證集的劃分對網(wǎng)絡整體的影響,以及用驗證集來評估模型預測的好壞和選擇模型及其對應的參數(shù)。不同模型交叉驗證時使用不同的隨機種子劃分驗證集和訓練集,以盡可能多的學到不同的樣本組合。

Inceptionv3和Inceptionv4的512的結果不好(0.55+ public leaderboard 閾值0.15),因此沒有做交叉驗證,只是用512尺度訓練了基礎模型,并用在650和800的微調(diào)中。

模型修改:

1.第一層卷積的輸入通道數(shù)由3修改為4,保持其他卷積參數(shù)不變,從而使網(wǎng)絡應對4通道輸入;

2.修改最后一的池化層為全局池化層,保證在多尺度時可以使用同一個網(wǎng)絡;

3.全局池化后增加一層128的全連接,然后接一層28的全連接。

訓練

訓練過程的參數(shù)如下:

loss: MultiLabelSoftMarginLoss

lr: 0.05(512,imagenet 預訓練),0.01(650和800,512預訓練);

lrscheduler: steplr(gamma=0.1,step=6)

optimizer: SGD (adam,rms not well)

epochs: 25, 600和800一般在12-20直接提前結束,取loss最低的模型

10 folds CV

sampling weights:[1.0, 5.97, 2.89, 5.75, 4.64, 4.27, 5.46, 3.2, 14.48, 14.84, 15.14, 6.92, 6.86, 8.12, 6.32, 19.24, 8.48, 11.93, 7.32, 5.48, 11.99, 2.39, 6.3, 3.0, 12.06, 1.0, 10.39, 16.5]

scale:512,600,800

獨立閾值

為每一個類別找到一個合適的閾值是一件很困難的事,但是多閾值是提升分數(shù)的關鍵,對我來說,大概可以提升0.005~0.008。 我們使用驗證集來找閾值,我們訓練單模型xception 512 ,驗證集占13%。調(diào)整每一類的閾值使得f1 score達到最優(yōu),不過我們發(fā)現(xiàn)稀有類別的閾值普遍很高,public lb會變差,因此我們只調(diào)整了驗證集1000張以上的類別,稀有類別控制閾值為0.15 通過這種方法找到的閾值在其他模型或者集成的時候同樣有效。

測試

比賽結束以后我們將比賽中訓練的模型重新提交查看private leaderboard成績,得到如下結果:

1e6631091f804c019babf0d6794da072


比賽過程中我們發(fā)現(xiàn)做了10 fold ensemble不一定比single fold好,因此我們在最終集成的時候部分模型只選擇了部分fold (根據(jù)loss選擇)。

檢索

我們使用檢索的方法(特征使用inceptionv4 800 的128維特征)查找test與hpa相似的圖片,使用余弦相似度進行度量,我們發(fā)現(xiàn)了許多相似的甚至相同的圖片,直接使用相似度最高的300張圖片的結果進行替換,分數(shù)在public lb上提升0.01~0.015,不過在private LB中并沒有效果,官方在比賽過程中也說明部分test圖像由于與HPA中部分圖像重合,不再進行分數(shù)計算。

集成

我們將inceptionv3 inceptionv4以及xception 800的10fold 模型的特征進行concat(先進行l(wèi)2),得到3840維的新特征,并在此基礎上設計了2層的全連接網(wǎng)絡進行訓練, 并做10 fold CV,訓練過程中使用不容參數(shù)訓練過程如圖所示,我們?nèi)×薼oss最低的參數(shù)。結果融合后private lb:0.55150 public lb:0.62791。

8a9bab29851c4bebb78a2413694541f5


雖然上面方法在public lb上分數(shù)較高,但是當與其他模型結果融合時,public LB的分數(shù)反而降了,因此我們降低了這個模型的權重。

最后的結果是通過加權融合的方式得到的,權重根據(jù)模型的public lb分數(shù)設置, inceptionv4 800和inceptionv3 800的權重最高,xception 650 最低,同時也用到了inceptionv4、xception其他尺度的部分fold。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    41421

    瀏覽量

    302757
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    北京人形具身天工3.0斬獲全球首個全自主機器人勇士挑戰(zhàn)賽冠軍

      4月18日,首屆北京亦莊機器人勇士挑戰(zhàn)賽圓滿舉行,由優(yōu)必選作為大股東和總經(jīng)理單位牽頭成立的北京人形機器人創(chuàng)新中心(以下簡稱:北京人形)攜具身天工3.0全尺寸通用人形機器人參賽,以全自主方式完
    的頭像 發(fā)表于 04-21 17:28 ?1100次閱讀

    是德科技與Sateliot聯(lián)合項目榮獲6G創(chuàng)新挑戰(zhàn)賽獎項

    是德科技(NYSE: KEYS )與Sateliot憑借聯(lián)合項目“面向5G非地面網(wǎng)絡的區(qū)塊賦能端到端異常檢測解決方案”,共同榮獲第五屆歐洲航天局(ESA)與GSMA Foundry創(chuàng)新挑戰(zhàn)賽獎項
    的頭像 發(fā)表于 04-11 09:20 ?419次閱讀

    NVIDIA攜手Google DeepMind與EMBL發(fā)布全球最大蛋白質(zhì)復合物數(shù)據(jù)集

    NVIDIA、Google DeepMind、歐洲分子生物學實驗室下屬歐洲生物信息學研究所(EMBL-EBI)以及首爾大學 Steinegger 實驗室,對 AlphaFold 蛋白質(zhì)結構數(shù)據(jù)庫
    的頭像 發(fā)表于 03-25 09:39 ?372次閱讀

    思必馳斬獲Interspeech 2026音頻推理挑戰(zhàn)賽智能體賽道亞軍

    近日,國際語音與語言處理領域頂級賽事Interspeech 2026音頻推理挑戰(zhàn)賽結果正式揭曉。在這場首次將評估焦點從“答案正確性”轉(zhuǎn)向“推理過程質(zhì)量”的變革性賽事中,思必馳-上海交通大學聯(lián)合實驗室團隊憑借創(chuàng)新的多智能體協(xié)同方案,在全球眾多頂尖科研團隊的角逐中脫穎而出,斬獲智能體賽道亞軍。
    的頭像 發(fā)表于 02-28 14:13 ?848次閱讀

    中科曙光聯(lián)合發(fā)布全球首個蛋白質(zhì)結構智能壓縮與生成AI服務器Protein-OCR

    近日,中科曙光與天目湖健康研究院、ENTROPITech、蘇州大學、北京大學等多家中國頂尖科研機構聯(lián)合發(fā)布了全球首個蛋白質(zhì)結構智能壓縮與生成AI服務器Protein-OCR。在底層邏輯上
    的頭像 發(fā)表于 02-25 16:27 ?530次閱讀

    AICAS 2026 Grand Challenge全球挑戰(zhàn)賽啟動

    第四屆AICAS Grand Challenge——AICAS 2026全球技術挑戰(zhàn)賽現(xiàn)已正式啟動,誠邀各界英才和技術先鋒共同參與,以“芯”智能驅(qū)動未來!
    的頭像 發(fā)表于 02-04 14:59 ?1062次閱讀

    “芯”年來襲 | 瑞薩邊緣AI線上技術月暨挑戰(zhàn)賽

    自1月7日起,瑞薩邊緣AI技術月活動將每周開啟一場在線技術交流,涵蓋MCU/MPU產(chǎn)品、應用案例及開發(fā)實踐,并同步開啟瑞薩AI評測挑戰(zhàn)賽,借助教程資源及每周在線講解和答疑,幫助嵌入式開發(fā)者從入門學習到上手第一個AI項目。
    的頭像 發(fā)表于 12-25 10:21 ?2504次閱讀
    “芯”年來襲 | 瑞薩邊緣AI線上技術月暨<b class='flag-5'>挑戰(zhàn)賽</b>

    摩爾線程在SIGGRAPH Asia 2025斬獲3DGS重建挑戰(zhàn)賽銀獎

    Challenge(3DGS 重建挑戰(zhàn)賽)中憑借自研技術LiteGS出色的算法實力和軟硬件協(xié)同優(yōu)化能力,斬獲銀獎,再次證明摩爾線程在新一代圖形渲染技術上的深度積累與全球?qū)W術界的高度認可。
    的頭像 發(fā)表于 12-22 18:01 ?1994次閱讀
    摩爾線程在SIGGRAPH Asia 2025斬獲3DGS重建<b class='flag-5'>挑戰(zhàn)賽</b>銀獎

    2025 EDA精英挑戰(zhàn)賽華大九天題發(fā)布

    中國研究生創(chuàng)“ 芯 ” 大賽·EDA精英挑戰(zhàn)賽(以下簡稱EDA精英挑戰(zhàn)賽)是由教育部學位管理與研究生教育司指導,中國學位與研究生教育學會、中國科協(xié)青少年科技中心主辦的“ 中國研究生創(chuàng)‘芯 ’大賽
    的頭像 發(fā)表于 08-26 15:00 ?1884次閱讀
    2025 EDA精英<b class='flag-5'>挑戰(zhàn)賽</b>華大九天<b class='flag-5'>賽</b>題發(fā)布

    2025 EDA精英挑戰(zhàn)賽紫光同創(chuàng)題發(fā)布

    中國研究生創(chuàng)“ 芯 ” 大賽·EDA精英挑戰(zhàn)賽(以下簡稱EDA精英挑戰(zhàn)賽)是由教育部學位管理與研究生教育司指導,中國學位與研究生教育學會、中國科協(xié)青少年科技中心主辦的“ 中國研究生創(chuàng)‘芯 ’大賽
    的頭像 發(fā)表于 08-25 09:40 ?1990次閱讀
    2025 EDA精英<b class='flag-5'>挑戰(zhàn)賽</b>紫光同創(chuàng)<b class='flag-5'>賽</b>題發(fā)布

    一時的AI蛋白質(zhì)解析,怎么樣了?

    AI蛋白質(zhì)解析領域正在經(jīng)歷一場靜水流深的變革
    的頭像 發(fā)表于 07-27 17:18 ?2511次閱讀
    火<b class='flag-5'>極</b>一時的AI<b class='flag-5'>蛋白質(zhì)</b>解析,怎么樣了?

    e絡盟社區(qū)攜手 Würth Elektronik 發(fā)起全球 LED 設計挑戰(zhàn)賽

    安富利旗下e絡盟社區(qū)與 Würth Elektronik 合作推出全球設計挑戰(zhàn)賽。這項全新競賽誠邀工程師、創(chuàng)客和愛好者們使用 Würth Elektronik 先進的 SMD LED(集成了 WL-ICLED 控制器)開發(fā)原型或測試裝置。
    的頭像 發(fā)表于 07-23 10:15 ?1098次閱讀
    e絡盟社區(qū)攜手 Würth Elektronik 發(fā)起全球 LED 設計<b class='flag-5'>挑戰(zhàn)賽</b>

    傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰(zhàn)賽冠亞軍,推動視頻畫質(zhì)升級

    近日,在計算機視覺領域最具影響力的國際競賽CVPRNTIRE2025中,傳音多媒體團隊與上海交通大學圖像所MediaLab聯(lián)合團隊分別斬獲高效超分辨率挑戰(zhàn)賽
    的頭像 發(fā)表于 06-24 17:03 ?1051次閱讀
    傳音多媒體團隊攬獲CVPR NTIRE 2025兩項<b class='flag-5'>挑戰(zhàn)賽</b>冠亞軍,推動視頻畫質(zhì)升級

    傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰(zhàn)賽冠亞軍

    近日,在計算機視覺領域最具影響力的國際競賽 CVPR NTIRE 2025中,傳音多媒體團隊與上海交通大學圖像所MediaLab聯(lián)合團隊分別斬獲 高效超分辨率挑戰(zhàn)賽(NTIRE 2025
    的頭像 發(fā)表于 06-24 16:08 ?1801次閱讀
    傳音多媒體團隊攬獲CVPR NTIRE 2025兩項<b class='flag-5'>挑戰(zhàn)賽</b>冠亞軍

    ASML杯光刻「芯 」勢力知識挑戰(zhàn)賽正式啟動

    ASML光刻「芯」勢力知識挑戰(zhàn)賽由全球半導體行業(yè)領先供應商ASML發(fā)起,是一項面向中國半導體人才與科技愛好者的科普賽事。依托ASML在光刻領域的技術積累與行業(yè)洞察,賽事致力于為參賽者打造一個深度探索光刻技術的知識競技窗口,同時培養(yǎng)優(yōu)秀科技「芯」勢力,共同推動摩爾定律演進。
    的頭像 發(fā)表于 06-23 17:04 ?1461次閱讀
    ASML杯光刻「芯 」勢力知識<b class='flag-5'>挑戰(zhàn)賽</b>正式啟動
    尤溪县| 叶城县| 民丰县| 泗洪县| 富平县| 和林格尔县| 庆元县| 永春县| 扶沟县| 五河县| 彩票| 齐齐哈尔市| 龙川县| 托克逊县| 大荔县| 师宗县| 佛学| 利津县| 瑞丽市| 望江县| 万山特区| 葫芦岛市| 湘乡市| 杭锦后旗| 松江区| 郁南县| 利川市| 长海县| 永康市| 潞西市| 松溪县| 察哈| 湘西| 五寨县| 高要市| 邢台县| 张掖市| 抚顺市| 桐梓县| 清水河县| 文化|