日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百億級數(shù)據(jù)分表后 怎樣才能分頁查詢

數(shù)據(jù)分析與開發(fā) ? 來源:數(shù)據(jù)分析與開發(fā) ? 作者:科技繆繆 ? 2020-11-19 15:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

當業(yè)務(wù)規(guī)模達到一定規(guī)模之后,像淘寶日訂單量在5000萬單以上,美團3000萬單以上。數(shù)據(jù)庫面對海量的數(shù)據(jù)壓力,分庫分表就是必須進行的操作了。而分庫分表之后一些常規(guī)的查詢可能都會產(chǎn)生問題,最常見的就是比如分頁查詢的問題。一般我們把分表的字段稱作shardingkey,比如訂單表按照用戶ID作為shardingkey,那么如果查詢條件中不帶用戶ID查詢怎么做分頁?又比如更多的多維度的查詢都沒有shardingkey又怎么查詢?

唯一主鍵

一般我們數(shù)據(jù)庫的主鍵都是自增的,那么分表之后主鍵沖突的問題就是一個無法避免的問題,最簡單的辦法就是以一個唯一的業(yè)務(wù)字段作為唯一的主鍵,比如訂單表的訂單號肯定是全局唯一的。 常見的分布式生成唯一ID的方式很多,最常見的雪花算法Snowflake、滴滴Tinyid、美團Leaf。以雪花算法舉例來說,一毫秒可以生成4194304多個ID。第一位不使用,默認都是0,41位時間戳精確到毫秒,可以容納69年的時間,10位工作機器ID高5位是數(shù)據(jù)中心ID,低5位是節(jié)點ID,12位序列號每個節(jié)點每毫秒累加,累計可以達到2^12 4096個ID。

分表

第一步,分表后要怎么保證訂單號的唯一搞定了,現(xiàn)在考慮下分表的問題。首先根據(jù)自身的業(yè)務(wù)量和增量來考慮分表的大小。 舉個例子,現(xiàn)在我們?nèi)諉瘟渴?0萬單,預估一年后可以達到日100萬單,根據(jù)業(yè)務(wù)屬性,一般我們就支持查詢半年內(nèi)的訂單,超過半年的訂單需要做歸檔處理。 那么以日訂單100萬半年的數(shù)量級來看,不分表的話我們訂單量將達到100萬X180=1.8億,以這個數(shù)據(jù)量級部分表的話肯定單表是扛不住的,就算你能扛RT的時間你也根本無法接受吧。根據(jù)經(jīng)驗單表幾百萬的數(shù)量對于數(shù)據(jù)庫是沒什么壓力的,那么只要分256張表就足夠了,1.8億/256≈70萬,如果為了保險起見,也可以分到512張表。那么考慮一下,如果業(yè)務(wù)量再增長10倍達到1000萬單每天,分表1024就是比較合適的選擇。 通過分表加上超過半年的數(shù)據(jù)歸檔之后,單表70萬的數(shù)據(jù)就足以應(yīng)對大部分場景了。接下來對訂單號hash,然后對256取模的就可以落到具體的哪張表了。

那么,因為唯一主鍵都是以訂單號作為依據(jù),以前你寫的那些根據(jù)主鍵ID做查詢的就不能用了,這就涉及到了歷史一些查詢功能的修改。不過這都不是事兒對吧,都改成以訂單號來查就行了。這都不是問題,問題在我們的標題說的點上。

C端查詢

說了半天,總算到了正題了,那么分表之后查詢和分頁查詢的問題怎么解決? 首先說帶shardingkey的查詢,比如就通過訂單號查詢,不管你分頁還是怎么樣都是能直接定位到具體的表來查詢的,顯然查詢是不會有什么問題的。 如果不是shardingkey的話,上面舉例說的以訂單號作為shardingkey的話,像APP、小程序這種一般都是通過用戶ID查詢,那這時候我們通過訂單號做的sharding怎么辦?很多公司訂單表直接用用戶ID做shardingkey,那么很簡單,直接查就完了。那么訂單號怎么辦,一個很簡單的辦法就是在訂單號上帶上用戶ID的屬性。舉個很簡單的例子,原本41位的時間戳你覺得用不完,用戶ID是10位的,訂單號的生成規(guī)則帶上用戶ID,落具體表的時候根據(jù)訂單號中10位用戶ID hash取模,這樣無論根據(jù)訂單號還是用戶ID查詢效果都是一樣的。 當然,這種方式只是舉例,具體的訂單號生成的規(guī)則,多少位,包含哪些因素根據(jù)自己的業(yè)務(wù)和實現(xiàn)機制來決定。

好,那么無論你是訂單號還是用戶ID作為shardingkey,按照以上的兩種方式都可以解決問題了。那么還有一個問題就是如果既不是訂單號又不是用戶ID查詢怎么辦?最直觀的例子就是來自商戶端或者后臺的查詢,商戶端都是以商戶或者說賣家的ID作為查詢條件來查的,后臺的查詢條件可能就更復雜了,像我碰到的有些后臺查詢條件能有幾十個,這怎么查???別急,接下來分開說B端和后臺的復雜查詢。 現(xiàn)實中真正的流量大頭都是來自于用戶端C端,所以本質(zhì)上解決了用戶端的問題,這個問題就解了大半,剩下來自商戶賣家端B端、后臺支持運營業(yè)務(wù)的查詢流量并不會很大,這個問題就好解。

其他端查詢

針對B端的非shardingkey的查詢有兩個辦法解決。雙寫,雙寫就是下單的數(shù)據(jù)落兩份,C端和B端的各自保存一份,C端用你可以用單號、用戶ID做shardingkey都行,B端就用商家賣家的ID作為shardingkey就好了。有些同學會說了,你雙寫不影響性能嗎?因為對于B端來說輕微的延遲是可以接受的,所以可以采取異步的方式去落B端訂單。你想想你去淘寶買個東西下單了,賣家稍微延遲個一兩秒收到這個訂單的消息有什么關(guān)系嗎?你點個外賣商戶晚一兩秒收到這個訂單有什么太大影響嗎?

這是一個解決方案,另外一個方案就是走離線數(shù)倉或者ES查詢,訂單數(shù)據(jù)落庫之后,不管你通過binlog還是MQ消息的都形式,把數(shù)據(jù)同步到數(shù)倉或者ES,他們支持的數(shù)量級對于這種查詢條件來說就很簡單了。同樣這種方式肯定是稍微有延遲的,但是這種可控范圍的延遲是可以接受的。

而針對管理后臺的查詢,比如運營、業(yè)務(wù)、產(chǎn)品需要看數(shù)據(jù),他們天然需要復雜的查詢條件,同樣走ES或者數(shù)倉都可以做得到。如果不用這個方案,又要不帶shardingkey的分頁查詢,兄弟,這就只能掃全表查詢聚合數(shù)據(jù),然后手動做分頁了,但是這樣查出來的結(jié)果是有限制的。 比如你256個片,查詢的時候循環(huán)掃描所有的分片,每個片取20條數(shù)據(jù),最后聚合數(shù)據(jù)手工分頁,那必然是不可能查到全量的數(shù)據(jù)的。

總結(jié)

分庫分表后的查詢問題,對于有經(jīng)驗的同學來說其實這個問題都知道,但是我相信其實大部分同學做的業(yè)務(wù)可能都沒來到這個數(shù)量級,分庫分表可能都停留在概念階段,面試被問到后就手足無措了,因為沒有經(jīng)驗不知道怎么辦。 分庫分表首先是基于現(xiàn)有的業(yè)務(wù)量和未來的增量做出判斷,比如拼多多這種日單量5000萬的,半年數(shù)據(jù)得有百億級別了,那都得分到4096張表了對吧,但是實際的操作是一樣的,對于你們的業(yè)務(wù)分4096那就沒有必要了,根據(jù)業(yè)務(wù)做出合理的選擇。 對于基于shardingkey的查詢我們可以很簡單的解決,對于非shardingkey的查詢可以通過落雙份數(shù)據(jù)和數(shù)倉、ES的方案來解決,當然,如果分表后數(shù)據(jù)量很小的話,建好索引,掃全表查詢其實也不是什么問題。

責任編輯:xj

原文標題:百億級數(shù)據(jù)分表后,該怎么分頁查詢?

文章出處:【微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7349

    瀏覽量

    95055
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1523

    瀏覽量

    36369

原文標題:百億級數(shù)據(jù)分表后,該怎么分頁查詢?

文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    更改應(yīng)用程序密鑰NTAG424 DNA 問題解答

    我無法在 NTAG作上進行身份驗證。錯誤為 91Ae。 我無法更改任何文件設(shè)置。我嘗試格式化 NDEF,但沒有任何變化。 我怎樣才能恢復這種情況?這個錯誤是什么意思? 在其他一些卡上,當我嘗試更改某些內(nèi)容時報告的錯誤是 6982。我
    發(fā)表于 04-29 06:21

    MySQL數(shù)據(jù)庫慢查詢的排查思路和最佳實踐

    數(shù)據(jù)庫慢查詢是導致應(yīng)用響應(yīng)緩慢最常見的原因之一。當業(yè)務(wù)人員反饋“頁面加載慢”、“查詢超時”、“系統(tǒng)卡頓”時,很多運維人員的第一反應(yīng)是讓開發(fā)人員“加個索引”。但加索引只是優(yōu)化查詢的眾多手
    的頭像 發(fā)表于 04-24 14:40 ?166次閱讀

    MySQL數(shù)據(jù)庫慢查詢分析與優(yōu)化實戰(zhàn)

    在討論MySQL慢查詢之前,需要先明確一個關(guān)鍵前提:什么是慢查詢? 不同業(yè)務(wù)場景下,慢查詢的定義差異巨大。一個數(shù)據(jù)報表后臺的SQL執(zhí)行30秒可能屬于正常范圍,但一個訂單創(chuàng)建的
    的頭像 發(fā)表于 04-02 09:38 ?207次閱讀

    Debian 69未檢測到Intenso NVME,怎樣才能讓它工作?

    嘿。我剛剛設(shè)法更新到 2.5.0 并啟動了 Debian 版本 69。 但未檢測到我的新 NVME SSD它在閃爍,但也許我必須做其他事情然后將其內(nèi)置? 我怎樣才能讓它工作? 謝謝
    發(fā)表于 03-25 06:38

    TB級數(shù)據(jù)手工校驗要多久?用NineData僅需小時級別

    TB級數(shù)據(jù)手工校驗要多久?用NineData僅需小時級別
    的頭像 發(fā)表于 03-16 10:48 ?506次閱讀
    TB<b class='flag-5'>級數(shù)據(jù)</b>手工校驗要多久?用NineData僅需小時級別

    電機如何區(qū)分級數(shù)

    電機級數(shù)是電機設(shè)計中的重要參數(shù),直接關(guān)系到電機的轉(zhuǎn)速、扭矩和功率特性。理解電機級數(shù)的區(qū)分方法,不僅有助于正確選型,還能為設(shè)備匹配和故障診斷提供依據(jù)。本文將從原理、識別方法和應(yīng)用場景三個維度系統(tǒng)解析電機級數(shù)的核心知識。
    的頭像 發(fā)表于 03-12 16:47 ?580次閱讀
    電機如何區(qū)分<b class='flag-5'>級數(shù)</b>

    儲能EMS控制器(7) — 如何快捷驗證儲能柜內(nèi)設(shè)備接入的正確性?

    儲能柜項目,初期要接入集成設(shè)備(PCS、BMS、電表等)進行調(diào)試,設(shè)備調(diào)試過程比較繁瑣又容易出錯,怎樣才能便捷地驗證儲能柜內(nèi)設(shè)備接入的正確性?簡介儲能柜項目,初期要接入集成設(shè)備(PCS、BMS、電表
    的頭像 發(fā)表于 01-23 11:40 ?331次閱讀
    儲能EMS控制器(7) — 如何快捷驗證儲能柜內(nèi)設(shè)備接入的正確性?

    快問快答:產(chǎn)品氣密性檢測NG了?1鐘精準定位泄漏點的實戰(zhàn)方法

    成本,還會嚴重干擾質(zhì)量判斷。精誠工科真水測試儀,漏點定位一步到位那么,當氣密測試出現(xiàn)泄漏不良時,到底怎樣才能高效、準確地找到漏點呢?時間就是金錢。產(chǎn)線每停滯一鐘,
    的頭像 發(fā)表于 12-10 17:34 ?1267次閱讀
    快問快答:產(chǎn)品氣密性檢測NG了?1<b class='flag-5'>分</b>鐘精準定位泄漏點的實戰(zhàn)方法

    不用編程不用聯(lián)網(wǎng),實現(xiàn)倍福(BECKHOFF)PLC對接SQL數(shù)據(jù)庫,上報和查詢數(shù)據(jù)的案例

    ?IGT-DSER智能網(wǎng)關(guān)模塊,支持各種PLC、智能儀表、遠程IO與數(shù)據(jù)庫之間雙向通訊,既可以讀取設(shè)備的數(shù)據(jù)上報到SQL數(shù)據(jù)庫,也可以從數(shù)據(jù)查詢
    發(fā)表于 10-10 11:14

    別踩分頁坑!京東商品詳情接口實戰(zhàn)指南:從并發(fā)優(yōu)化到數(shù)據(jù)完整性閉環(huán)

    京東商品詳情接口(jingdong.ware.get)是電商數(shù)據(jù)開發(fā)的核心難點,本文詳解其權(quán)限申請、分頁優(yōu)化、多規(guī)格遞歸解析與完整性校驗等實戰(zhàn)方案,結(jié)合代碼示例與性能調(diào)優(yōu)參數(shù),助你高效穩(wěn)定對接,提升數(shù)據(jù)獲取效率2.5倍以上,適用
    的頭像 發(fā)表于 09-30 15:50 ?1211次閱讀

    #紅外傳感器有哪幾種?怎么用?怎樣才能選對?

    傳感器
    iczoom
    發(fā)布于 :2025年09月02日 10:52:41

    CYT2B93CAE怎樣才能接收特定 ID 的中斷?

    你好,我正在使用 CYT2B93CAE 使用設(shè)備配置器 5.3,我選擇 RX 緩沖區(qū)來接受特定的 ID(例如,0x020)。然而,問題是我在總線上的所有幀上都收到了中斷,而不僅僅是專用 ID。 當其他所有 ID 均未發(fā)生中斷時,我怎樣才能接收特定 ID 的中斷?
    發(fā)表于 07-15 07:09

    WICED IDE 6.6.1.1怎樣才能連接到自定義硬件?

    設(shè)備? 我們怎樣才能指示 WICED-IDE 使用我們的 4 通道 UART2USB 轉(zhuǎn)換器提供的 “普通” VCOM COM 端口之一? 有人能給我一些關(guān)于如何連接我們的定制硬件并驗證基本功能的說明和見解嗎。 任何幫助將不勝感激
    發(fā)表于 07-09 07:01

    將CYW20706基于硅的藍牙模塊(CYBT-343151-02)連接到定制板上的MCU,怎樣才能將鏈接配置為未確認數(shù)據(jù)模式?

    我將 CYW20706 基于硅的藍牙模塊(CYBT-343151-02)連接到定制板上的 MCU。 它在確認數(shù)據(jù)模式下工作,沒有問題 但是我怎樣才能將鏈接配置為未確認數(shù)據(jù)模式
    發(fā)表于 06-27 08:23

    怎樣才能安全地按住ctrc +c日志閱讀器然后才能停止并重新啟動日志?

    的讀取過程,我將無法在 FX3 中操作任何東西,所有命令都不起作用,所有控件寫入/讀取都將不起作用 以下是兩個函數(shù) 我怎樣才能安全地按住 ctrc +c 我的日志閱讀器然后才能停止并重新啟動日志
    發(fā)表于 05-27 07:11
    利辛县| 麻城市| 合肥市| 锡林郭勒盟| 新丰县| 德州市| 精河县| 都江堰市| 宜川县| 平昌县| 七台河市| 白银市| 三明市| 兰州市| 阿克| 天津市| 龙游县| 西乌珠穆沁旗| 论坛| 福海县| 绿春县| 利辛县| 郯城县| 关岭| 怀宁县| 贡觉县| 酒泉市| 新野县| 沽源县| 临高县| 永嘉县| 岫岩| 怀柔区| 嘉定区| 固始县| 庆城县| 徐州市| 喀喇| 临夏县| 时尚| 小金县|