日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從阿里云盤崩潰談起,云平臺穩(wěn)定性如何保證?

白犀牛通信 ? 來源:白犀牛通信 ? 2023-02-09 10:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,阿里云盤爆發(fā)故障,停服了近5小時,隨后官方發(fā)了道歉信,也明確了賠償方案,但故障原因至今未公布。坊間傳言是因為用戶集中下載某電視劇資源所致,具體情況不明。

阿里云盤和阿里云有沒有關(guān)系呢?雖然這是兩個獨立的品牌,但阿里云盤應(yīng)該算是阿里云主要的SaaS產(chǎn)品之一,其資源肯定也是承載在阿里云的平臺上的,所以這個故障算到阿里云頭上應(yīng)該不冤。

這是繼阿里云香港區(qū)故障后,又一次引發(fā)社會輿論關(guān)注的故障事件。當(dāng)然,發(fā)生故障并不可怕,IT系統(tǒng)發(fā)生故障太正常不過了,但一個機房出問題就全局宕機了?一個系統(tǒng)故障就導(dǎo)致服務(wù)中斷5個小時?說好的可用區(qū)隔離,跨區(qū)高可用,自動恢復(fù)自動切換,這些寫進SLA里的保障措施全部失效!這就有點不同尋常了。

從這個角度看,這兩次故障事件正在折射出阿里云一些內(nèi)部的問題,甚至直接暴露出包括阿里云在內(nèi)的云廠商巨頭在前些年野蠻生長、快速擴張過程中遺留下來的很多bug還有待修補。這些bug的構(gòu)成非常復(fù)雜,有技術(shù)的因素,也有機制流程的因素,還有人的責(zé)任意識的因素,如果這些bug不能在短時間內(nèi)得到有效解決,可以預(yù)料,這樣級別的故障可能還將發(fā)生,這對阿里云等巨頭們的品牌形象、客戶信任度都是嚴重的傷害。

更關(guān)鍵的是,當(dāng)前國內(nèi)云計算應(yīng)用已從互聯(lián)網(wǎng)拓展至政務(wù)、金融、工業(yè)、醫(yī)療、交通等傳統(tǒng)行業(yè),在這個過程中,云上系統(tǒng)的復(fù)雜度極大提升,給云廠商帶來的挑戰(zhàn)將會更大!

其一,云上系統(tǒng)深度應(yīng)用微服務(wù)等云原生技術(shù)架構(gòu),應(yīng)用之間存在錯綜復(fù)雜的依賴關(guān)系,服務(wù)性能瓶頸難以分析,故障影響范圍難以評估,故障根因難以定位,給平臺的運維保障工作帶來了諸多困難;

其二,云上系統(tǒng)的故障率會隨設(shè)備的增加而呈指數(shù)級增長,單一節(jié)點問題可能會被無限放大,日常運行過程中不可避免的伴隨異常發(fā)生,如何解決這些偶發(fā)、突發(fā)的問題,仍是一個技術(shù)難題;

其三,云上系統(tǒng)節(jié)點分布范圍更廣、數(shù)量更多,高度依賴網(wǎng)絡(luò)質(zhì)量,給日常運維過程中的日志采集、變更升級等都帶來了新的挑戰(zhàn)。

與此同時,由于產(chǎn)業(yè)互聯(lián)網(wǎng)核心業(yè)務(wù)上云進程加速,而核心業(yè)務(wù)系統(tǒng)作為支撐用戶服務(wù)的關(guān)鍵,往往具備業(yè)務(wù)連續(xù)性要求高、并發(fā)請求量大、業(yè)務(wù)激增隨機性強的特點,一旦發(fā)生故障,其影響范圍更大,后果更嚴重。為什么阿里云香港區(qū)事件直接導(dǎo)致阿里云換帥,正是因為事件影響的范圍極廣,對阿里云的品牌形象造成了極大的損害。

那該怎么辦呢?

從阿里云近期接連的兩次故障來看,云服務(wù)商亟需加深對云上系統(tǒng)穩(wěn)定性的認知,構(gòu)建安全生產(chǎn)和穩(wěn)定性保障雙體系,推動云上系統(tǒng)的穩(wěn)定性持續(xù)提升。

第一、建設(shè)云上業(yè)務(wù)安全生產(chǎn)體系,完善流程管理機制

一是事前的主動防御,通過完備的故障分析、風(fēng)險檢測、全局管控等事前風(fēng)險防護治理手段,變被動為主動,盡量減少故障風(fēng)險發(fā)生的概率;

二是事中的全局監(jiān)控,通過深度應(yīng)用大數(shù)據(jù)、人工智能等技術(shù),對信息系統(tǒng)進行全局監(jiān)測和預(yù)警,實現(xiàn)實時風(fēng)險態(tài)勢感知;

三是事后的應(yīng)急保障,將信息化手段與傳統(tǒng)方式相融合,多種應(yīng)急方式,最大程度降低業(yè)務(wù)系統(tǒng)故障導(dǎo)致的損失和影響,有效保障業(yè)務(wù)系統(tǒng)的穩(wěn)定性和連續(xù)性。

在這個過程中還有一個關(guān)鍵點在于人的責(zé)任意識的培養(yǎng),所有管理機制流程到最后還是需要人來執(zhí)行落地。在這方面,運營商云或許更有優(yōu)勢,畢竟電信運營商刻在DNA里的就是對“保障通信生命線”的追求,電信級服務(wù)對他們來說是一種信仰,也是一種職業(yè)習(xí)慣。

第二、構(gòu)筑全流程穩(wěn)定性保障體系,提升技術(shù)保障能力

事前做好規(guī)劃工作,設(shè)計高度韌性系統(tǒng)。在軟件設(shè)計階段,重點關(guān)注系統(tǒng)架構(gòu)和容量規(guī)劃的設(shè)計,同時配合混沌工程實驗持續(xù)保持、提升系統(tǒng)韌性。

事中全方位檢測,提高系統(tǒng)故障逃逸能力。通過對鏈路中各環(huán)節(jié)運行數(shù)據(jù)的整合及聯(lián)動,在故障發(fā)生時幫助運維人員迅速定位故障原因,最大化利用系統(tǒng)的觀測數(shù)據(jù)輔助進行根因分析,實現(xiàn)高效的故障修繕與恢復(fù)。此外,要確?!皯?yīng)用多活”成為保障業(yè)務(wù)連續(xù)性的關(guān)鍵抓手,而并非是一句宣傳口號。當(dāng)災(zāi)難(含基礎(chǔ)設(shè)施故障)發(fā)生時,多活系統(tǒng)在分鐘級內(nèi)實現(xiàn)業(yè)務(wù)流量切換,有效保障業(yè)務(wù)系統(tǒng)持續(xù)穩(wěn)定運行,提升系統(tǒng)故障逃逸能力。

事后構(gòu)建故障閉環(huán),降低故障復(fù)現(xiàn)率。完善故障管理機制,故障管理機制包括規(guī)范管理故障響應(yīng)流程、故障升級機制、故障復(fù)盤機制,規(guī)范技術(shù)人員在應(yīng)對突發(fā)故障時的操作流程,明確職責(zé)邊界,提升溝通效率,推動故障解決,提升故障處理效率。

在以上這些方面,一些正在崛起的新興云廠商可能比老牌巨頭走得更快更前,比如,移動云一直聚焦云服務(wù)穩(wěn)定性領(lǐng)域涉及的關(guān)鍵技術(shù),從混沌工程、全鏈路壓測建設(shè)、可觀測性平臺建設(shè)、應(yīng)用多活架構(gòu)等多方面提升移動云穩(wěn)定性。同時加速運維系統(tǒng)的“平臺化”、“數(shù)據(jù)化”、“智能化”建設(shè),持續(xù)加強移動云穩(wěn)定性。在去年8月工信部召開的“云服務(wù)穩(wěn)定安全運行應(yīng)急演練專項活動”中,移動云榮獲“十佳優(yōu)秀報告”榮譽稱號。

最后,張勇在就任阿里云總裁后又發(fā)了一封內(nèi)部信,里面有一段話——

“唯有日積月累的客戶信任,才可以讓我們真正在市場中保持領(lǐng)先優(yōu)勢,才能讓我們擁有持久的核心競爭力。任何故障的發(fā)生,對阿里是萬分之一、百萬分之一的概率,一旦發(fā)生在每個客戶身上就是百分之百。我們必須急客戶所急,想客戶所想,既主動解決客戶看得到的問題,更要把客戶尚未感知到的風(fēng)險防患于未然?!?/p>

望行業(yè)共勉吧。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 云計算
    +關(guān)注

    關(guān)注

    39

    文章

    8045

    瀏覽量

    144812
  • 智能化
    +關(guān)注

    關(guān)注

    15

    文章

    5261

    瀏覽量

    60330
  • 阿里云
    +關(guān)注

    關(guān)注

    3

    文章

    1046

    瀏覽量

    45893

原文標題:從阿里云盤崩潰談起,云平臺穩(wěn)定性如何保證?

文章出處:【微信號:baixiniu2018,微信公眾號:白犀牛通信】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    微電網(wǎng)穩(wěn)定性分析:電壓、頻率穩(wěn)定的核心判定標準

    本文將系統(tǒng)梳理微電網(wǎng)電壓穩(wěn)定與頻率穩(wěn)定的核心內(nèi)涵,拆解二者的核心判定標準、判定方法,分析影響穩(wěn)定性的關(guān)鍵因素,重點探討不同類型微電源對微電網(wǎng)穩(wěn)定性的影響,為微電網(wǎng)
    的頭像 發(fā)表于 03-17 15:08 ?526次閱讀
    微電網(wǎng)<b class='flag-5'>穩(wěn)定性</b>分析:電壓、頻率<b class='flag-5'>穩(wěn)定</b>的核心判定標準

    深化阿里生態(tài)合作 優(yōu)化治理能力再獲權(quán)威認可

    前言2026年2月5日,阿里上海大區(qū)合作伙伴年度頒獎儀式圓滿舉辦,科技憑借在優(yōu)化治理領(lǐng)域的深厚技術(shù)積淀、豐富的行業(yè)落地成果與卓越的
    的頭像 發(fā)表于 02-09 17:29 ?1195次閱讀
    深化<b class='flag-5'>阿里</b><b class='flag-5'>云</b>生態(tài)合作 <b class='flag-5'>云</b>優(yōu)化治理能力再獲權(quán)威認可

    某知名快消企業(yè)阿里優(yōu)化治理實踐:助力業(yè)務(wù)應(yīng)用安全、穩(wěn)定、成本全面可控

    不可控、系統(tǒng)穩(wěn)定性要求高等一系列挑戰(zhàn)。如何構(gòu)建一個安全、穩(wěn)定、高效且成本優(yōu)化的上環(huán)境,成為快消企業(yè)數(shù)字化轉(zhuǎn)型能否成功的關(guān)鍵。科技,作
    的頭像 發(fā)表于 01-12 14:33 ?1016次閱讀
    某知名快消企業(yè)<b class='flag-5'>阿里</b><b class='flag-5'>云</b>優(yōu)化治理實踐:助力業(yè)務(wù)應(yīng)用安全、<b class='flag-5'>穩(wěn)定</b>、成本全面可控

    Neway微波的穩(wěn)定性優(yōu)勢

    Neway微波的穩(wěn)定性優(yōu)勢Neway微波的穩(wěn)定性優(yōu)勢體現(xiàn)在相位穩(wěn)定性、幅度穩(wěn)定性、環(huán)境適應(yīng)性及長期可靠性四個方面,這些特性使其在5G/6G通信、衛(wèi)星通信、國防軍事等高頻場景中成為關(guān)鍵組
    發(fā)表于 01-05 08:48

    武漢芯源MCU的時鐘系統(tǒng)如何設(shè)計?如何保證高精度和高穩(wěn)定性

    武漢芯源MCU的時鐘系統(tǒng)如何設(shè)計,如何保證高精度和高穩(wěn)定性
    發(fā)表于 12-10 06:26

    如何評估內(nèi)嵌式模組的穩(wěn)定性?

    與異常噪音。剛性與負載能力分析:剛性直接決定了模組在承受負載及加減速時的穩(wěn)定性,高剛性模組變形小,能保證更高的動態(tài)精度。需驗證其額定負載與力矩載荷下的性能,確保其能滿足實際應(yīng)用中的外力與扭矩要求,避免
    發(fā)表于 12-04 15:27

    如何保證合金電阻的穩(wěn)定性與精度?

    保證合金電阻的穩(wěn)定性與精度需材料選擇、制造工藝、結(jié)構(gòu)設(shè)計、環(huán)境控制及測試驗證等多維度綜合施策。以下技術(shù)原理、關(guān)鍵措施及實際應(yīng)用三個層面展開分析: 一、材料選擇:奠定
    的頭像 發(fā)表于 10-27 15:29 ?763次閱讀
    如何<b class='flag-5'>保證</b>合金電阻的<b class='flag-5'>穩(wěn)定性</b>與精度?

    怎樣確保數(shù)據(jù)管理平臺的軟件系統(tǒng)穩(wěn)定性?

    確保電能質(zhì)量在線監(jiān)測裝置 數(shù)據(jù)管理平臺軟件系統(tǒng)的穩(wěn)定性 ,需圍繞 “架構(gòu)設(shè)計、數(shù)據(jù)處理、容錯災(zāi)備、性能優(yōu)化、安全防護、測試驗證、運維保障”7 大核心維度構(gòu)建體系化方案,結(jié)合電能質(zhì)量監(jiān)測的 實時性高
    的頭像 發(fā)表于 09-19 13:50 ?833次閱讀
    怎樣確保數(shù)據(jù)管理<b class='flag-5'>平臺</b>的軟件系統(tǒng)<b class='flag-5'>穩(wěn)定性</b>?

    Vision Board開發(fā)板使用paho_mqtt連接阿里失敗是什么原因呢?

    mqtt_sample中添加阿里平臺連接參數(shù), 在下方的代碼也進行了對應(yīng)的修改 4.編譯燒錄,可以看到wifi模塊初始化正常,并且進行聯(lián)網(wǎng) 5.啟動mqtt,然后就報錯了,主要錯誤
    發(fā)表于 09-18 06:37

    厚聲電阻的長期穩(wěn)定性如何?

    厚聲電阻的長期穩(wěn)定性表現(xiàn)卓越,這主要得益于其高精度、穩(wěn)定的溫度系數(shù)(TCR)、耐高溫特性以及高質(zhì)量的材料和制造工藝 ,具體分析如下: 1、高精度與低偏差 :厚聲電阻的阻值精度通常在±1%以內(nèi),高端
    的頭像 發(fā)表于 08-20 16:19 ?969次閱讀

    低延遲高帶寬電機驅(qū)動方案優(yōu)化手持臺動態(tài)響應(yīng)與姿態(tài)穩(wěn)定性

    在當(dāng)今影像拍攝領(lǐng)域,手持臺已成為專業(yè)攝影師和內(nèi)容創(chuàng)作者不可或缺的設(shè)備。隨著4K/8K超高清視頻、VR全景拍攝等技術(shù)的普及,用戶對臺動態(tài)響應(yīng)速度和姿態(tài)穩(wěn)定性的要求越來越高。這直接推動了電機驅(qū)動技術(shù)的革新,低延遲高帶寬的無刷電機
    的頭像 發(fā)表于 08-12 17:40 ?1131次閱讀

    阿里設(shè)備的物模型數(shù)據(jù)里面始終沒有值是哪里的問題?

    如上圖,不知道講清楚沒有。 IG502自定義TOPIC 上發(fā)到阿里沒問題。采用阿里物模型的格式來上發(fā)就不行。請大佬指教!
    發(fā)表于 08-05 06:43

    手持臺馬達驅(qū)動:提升攝影穩(wěn)定性與觀感的秘密武器

    在攝影的世界里,穩(wěn)定性一直是影響作品質(zhì)量的關(guān)鍵因素。無論是專業(yè)攝影師捕捉精彩瞬間,還是普通愛好者記錄生活點滴,畫面的穩(wěn)定與流暢都至關(guān)重要。而手持臺馬達驅(qū)動的出現(xiàn),如同給攝影設(shè)備裝上了“穩(wěn)定
    的頭像 發(fā)表于 07-22 16:51 ?910次閱讀

    替代自建物聯(lián)平臺的最優(yōu)解?揭秘Tuya物聯(lián)網(wǎng)平臺阿里版的全托管力量

    諸多現(xiàn)實挑戰(zhàn)。如何以更低成本、更短周期、更高效率構(gòu)建面向未來的AIoT基礎(chǔ)能力?涂鴉智能基于與阿里的深度合作,于去年9月重磅推出Tuya物聯(lián)網(wǎng)平臺阿里
    的頭像 發(fā)表于 06-20 18:12 ?1738次閱讀
    替代自建物聯(lián)<b class='flag-5'>平臺</b>的最優(yōu)解?揭秘Tuya物聯(lián)網(wǎng)<b class='flag-5'>平臺</b><b class='flag-5'>阿里</b><b class='flag-5'>云</b>版的全托管力量

    MUN12AD03-SEC的熱性能如何影響其穩(wěn)定性?

    意味著模塊在不同環(huán)境條件下都能保持穩(wěn)定工作。在低溫環(huán)境下,模塊的電氣性能和機械性能可能會受到一定影響,但 MUN12AD03-SEC 能在 -40°C 的低溫下正常工作,這保證了其在寒冷環(huán)境中的穩(wěn)定性
    發(fā)表于 05-15 09:41
    延吉市| 广西| 大城县| 昌平区| 微山县| 抚顺市| 日土县| 项城市| 邓州市| 民权县| 丰原市| 抚州市| 乌拉特后旗| 锡林郭勒盟| 荆州市| 永平县| 白河县| 碌曲县| 莫力| 教育| 白河县| 林周县| 成武县| 依兰县| 永泰县| 恩平市| 曲靖市| 惠安县| 西和县| 耿马| 九江县| 西盟| 长岭县| 南乐县| 镇安县| 红原县| 泰和县| 读书| 宜阳县| 当涂县| 颍上县|