日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

基于分段聚類壓縮和Hash recoding壓縮方法

大小:0.95 MB 人氣: 2017-11-24 需要積分:0

  今日頭條的服務(wù)器每天都會(huì)產(chǎn)生規(guī)模龐大的訓(xùn)練數(shù)據(jù),為方便進(jìn)行訓(xùn)練,這些數(shù)據(jù)都具有特定的格式和分布特征。使用不同類型的通用壓縮算法(字典類型及非字典類型)進(jìn)行測試,發(fā)現(xiàn)單獨(dú)任何一種算法都無法在滿足業(yè)務(wù)需求(速率需求和CPU占比等)的同時(shí)獲得較為可觀的壓縮比。針對(duì)今日頭條的訓(xùn)練數(shù)據(jù),提出了分段聚類壓縮和Hash recoding壓縮兩種策略。實(shí)驗(yàn)結(jié)果表明,分段聚類壓縮方式在更好地保證了壓縮率的同時(shí)提高了壓縮速率的目的;Hash recoding壓縮方式則更好地達(dá)到了以少量壓縮速率的損失換取更可觀的壓縮率的目的。分段聚類方式搭配Gzip壓縮算法的組合能使壓縮速率提高300%以上;Hash recoding方式匹配Snappy壓縮算法能使壓縮率縮小50%以上。根據(jù)實(shí)際需求,不論選擇哪種策略,對(duì)于降低今日頭條的運(yùn)營成本,提升業(yè)務(wù)處理的效率,提供更好的用戶體驗(yàn),都有一定意義。

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?
      高清| 钦州市| 惠州市| 禄丰县| 将乐县| 玉龙| 盐边县| 石城县| 炉霍县| 三亚市| 汉川市| 尼玛县| 屯留县| 长汀县| 肃南| 紫金县| 和硕县| 武乡县| 安图县| 吴堡县| 辽源市| 玛曲县| 白玉县| 长白| 海宁市| 铜鼓县| 大冶市| 元江| 时尚| 安达市| 佳木斯市| 界首市| 海城市| 普洱| 佳木斯市| 南丰县| 彩票| 宁都县| 永寿县| 内丘县| 武义县|