日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Spark SQL性能實(shí)現(xiàn)17.7倍的提升,是如何做到的

獨(dú)愛72H ? 來源:砍柴網(wǎng) ? 作者:砍柴網(wǎng) ? 2019-11-14 16:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文章來源:砍柴網(wǎng))

Apache Spark是專為大規(guī)模數(shù)據(jù)處理而設(shè)計(jì)的快速通用的計(jì)算引擎,常用來構(gòu)建大型、低延遲的數(shù)據(jù)分析應(yīng)用程序。Spark一個主要特點(diǎn)在于,其能夠在內(nèi)存中進(jìn)行計(jì)算,這使得其數(shù)據(jù)分析效率往往高于其它計(jì)算引擎,但是,服務(wù)器內(nèi)存資源的限制也使得其性能的擴(kuò)展存在著一定的瓶頸,在超大規(guī)模負(fù)載中無法充分發(fā)揮其利用內(nèi)存進(jìn)行計(jì)算的性能優(yōu)勢。

某全球領(lǐng)先的語音識別服務(wù)提供商是最早將Spark應(yīng)用到生產(chǎn)環(huán)境的團(tuán)隊(duì)之一,該公司的語音云通過幾千臺服務(wù)器構(gòu)成的云計(jì)算平臺向用戶提供多樣的、實(shí)時語音處理能力,日均服務(wù)終端用戶超過15億,日增數(shù)據(jù)超過100TB。2014年該公司基于Spark和AI技術(shù)構(gòu)建了DMP大數(shù)據(jù)平臺(用戶數(shù)據(jù)管理平臺)。DMP平臺的主要功能就是收集、存儲、分析和挖掘龐大的用戶數(shù)據(jù),以實(shí)現(xiàn)廣告精準(zhǔn)投放。

Spark在該公司的大數(shù)據(jù)平臺中主要用于海量用戶數(shù)據(jù)分析,每天支撐穩(wěn)定運(yùn)行的Spark SQL統(tǒng)計(jì)分析指標(biāo)和SQL腳本有幾千個。但是在將Spark SQL用于海量用戶數(shù)據(jù)分析的過程中,仍然面臨著一些痛點(diǎn),這些都限制了該公司語音云的數(shù)據(jù)分析能力。

Spark的性能不僅受到CPU、內(nèi)存、網(wǎng)絡(luò)、磁盤等硬件設(shè)備的制約,而且Spark SQL目前還不支持索引,也嚴(yán)重影響了Spark SQL在進(jìn)行大規(guī)模數(shù)據(jù)分析時的性能,索引能夠提升數(shù)據(jù)檢索的效率,降低硬盤的IO瓶頸。

隨著數(shù)據(jù)量越來越大,即席分析的需求越來越強(qiáng)烈,即席查詢是用戶根據(jù)用戶自己的需求,靈活選擇查詢條件,系統(tǒng)能夠根據(jù)用戶的選擇生成響應(yīng)的統(tǒng)計(jì)報(bào)表和結(jié)果集;在數(shù)據(jù)倉庫和大數(shù)據(jù)分析系統(tǒng)中,即席查詢使用的越多,對系統(tǒng)的性能要求也就越高,如果內(nèi)存能夠緩存更多的熱點(diǎn)數(shù)據(jù),能夠極大的提升即席查詢處理速度并降低響應(yīng)延遲。

數(shù)據(jù)既有隨機(jī)讀的需求(即席查詢-Ad-hoc),又有全表掃描的需求(機(jī)器學(xué)習(xí));機(jī)器學(xué)習(xí)就是通過特定算法從海量的歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律,從而對新的樣本進(jìn)行分析并對未來做出預(yù)測,在模型訓(xùn)練的過程中會產(chǎn)生大量的中間結(jié)果數(shù)據(jù),通常情況下需要將中間結(jié)果數(shù)據(jù)持久化到文件系統(tǒng)上,如果內(nèi)存能夠緩存更多的中間結(jié)果數(shù)據(jù),可以提升模型訓(xùn)練的速度。
(責(zé)任編輯:fqj)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 互聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    55

    文章

    11356

    瀏覽量

    110609
  • ai技術(shù)
    +關(guān)注

    關(guān)注

    1

    文章

    1316

    瀏覽量

    25823
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    探索ADMV1355:17.7GHz - 55GHz寬帶微波上變頻器的卓越性能

    探索ADMV1355:17.7GHz - 55GHz寬帶微波上變頻器的卓越性能 在當(dāng)今的電子領(lǐng)域,對于高性能、小尺寸的微波上變頻器的需求日益增長。ADMV1355作為一款高度集成的微波上變頻器,為
    的頭像 發(fā)表于 04-28 16:35 ?135次閱讀

    【PCIe 6.0 連載 · 中篇】從設(shè)計(jì)到實(shí)現(xiàn):高速信號如何做到又快又穩(wěn)?

    讀懂了PCIe6.0的行業(yè)價值,接下來更關(guān)鍵的是:64GT/s的高速信號,如何做到穩(wěn)定傳輸?上篇我們講了“為什么需要PCIe6.0”,本篇作為系列中篇,聚焦工程實(shí)現(xiàn)核心,拆解PAM4信號的“脆弱性
    的頭像 發(fā)表于 04-15 17:34 ?202次閱讀
    【PCIe 6.0 連載 · 中篇】從設(shè)計(jì)到<b class='flag-5'>實(shí)現(xiàn)</b>:高速信號<b class='flag-5'>如何做到</b>又快又穩(wěn)?

    NineData SQL AI 智能補(bǔ)全上線:寫 SQL,不必每次都從頭敲

    NineData推出SQLAI智能補(bǔ)全功能,通過AI技術(shù)實(shí)現(xiàn)上下文感知的SQL語句智能提示。該功能不僅能補(bǔ)全關(guān)鍵字,還能根據(jù)當(dāng)前輸入內(nèi)容預(yù)測后續(xù)查詢意圖,顯著提升多表關(guān)聯(lián)、復(fù)雜條件等場景下的編寫效率
    的頭像 發(fā)表于 04-01 20:19 ?350次閱讀
    NineData <b class='flag-5'>SQL</b> AI 智能補(bǔ)全上線:寫 <b class='flag-5'>SQL</b>,不必每次都從頭敲

    北大團(tuán)隊(duì)最新研究:AI芯片算力提升數(shù)倍,能效提升超90

    首次實(shí)現(xiàn)后摩爾新器件異質(zhì)集成的多物理域融合傅里葉變換系統(tǒng)。 ? 這一全新計(jì)算架構(gòu)將傅里葉變換計(jì)算速度從當(dāng)前每秒約1300億次提升至每秒約5000億次,算力提升近4,能效
    的頭像 發(fā)表于 01-15 09:31 ?2330次閱讀

    全新軟件與模型優(yōu)化為NVIDIA DGX Spark注入強(qiáng)大動力

    自發(fā)布以來,NVIDIA 通過持續(xù)的軟件優(yōu)化以及與軟件合作伙伴和開源社區(qū)的緊密協(xié)作,不斷提升基于 Grace Blackwell 架構(gòu)的 DGX Spark性能。這些舉措在推理、訓(xùn)練和創(chuàng)意工作流方面都取得了顯著的成效。
    的頭像 發(fā)表于 01-09 10:17 ?938次閱讀

    17.7 GHz - 19.7 GHz低噪聲放大器ADL5725:特性、應(yīng)用與設(shè)計(jì)要點(diǎn)

    Devices推出的ADL5725,一款針對17.7 GHz - 19.7 GHz微波頻段優(yōu)化的窄帶、高性能低噪聲放大器。 文件下載: ADL5725.pdf 一、ADL5725的特性亮點(diǎn) 1.
    的頭像 發(fā)表于 01-05 16:10 ?363次閱讀

    如何在DGX Spark上運(yùn)行NVIDIA Omniverse

    首先感謝 Vigor 同學(xué)第一時間的分享,以下是具體如何在 DGX Spark 上運(yùn)行 Omniverse 的方法。
    的頭像 發(fā)表于 12-17 10:13 ?1010次閱讀
    如何在DGX <b class='flag-5'>Spark</b>上運(yùn)行NVIDIA Omniverse

    性能提升30:當(dāng)AI存儲沖刺“秒速”,誰為它的“出廠體檢”按下快門?

    SK 海力士與英偉達(dá)合作研發(fā)性能提升 30 的 AI NAND,凸顯現(xiàn)有測試驗(yàn)證體系的 “代差” 危機(jī)。傳統(tǒng)測試難以滿足極端負(fù)載下的精準(zhǔn)性能檢測,面臨接口帶寬延遲、信號完整性、負(fù)載真
    的頭像 發(fā)表于 12-15 14:17 ?451次閱讀

    亞馬遜發(fā)布新一代AI芯片Trainium3,性能提升4

    Trainium 4的開發(fā)計(jì)劃。亞馬遜表示,這款芯片能夠比英偉達(dá)市場領(lǐng)先的圖形處理單元(GPU)更便宜、更高效地驅(qū)動AI模型背后的密集計(jì)算。 ? ? 作為亞馬遜首款3納米工藝AI芯片,Trainium3的核心突破在于性能、能效與擴(kuò)展性的全面躍升。其計(jì)算性能較前代Train
    的頭像 發(fā)表于 12-09 08:37 ?8979次閱讀
    亞馬遜發(fā)布新一代AI芯片Trainium3,<b class='flag-5'>性能</b><b class='flag-5'>提升</b>4<b class='flag-5'>倍</b>

    使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025構(gòu)建高性能AI應(yīng)用

    搜索和調(diào)用外部 AI 模型的 SQL 原生 API。NVIDIA 與微軟共同將 SQL Server 2025 與 NVIDIA Nemotron RAG 開放模型集合無縫連接,這使您能夠在云端或本地環(huán)境中基于自己的數(shù)據(jù)構(gòu)建高性能
    的頭像 發(fā)表于 12-01 09:31 ?1142次閱讀
    使用NVIDIA Nemotron RAG和Microsoft <b class='flag-5'>SQL</b> Server 2025構(gòu)建高<b class='flag-5'>性能</b>AI應(yīng)用

    NVIDIA DGX Spark快速入門指南

    NVIDIA DGX Spark 已正式向 AI 開發(fā)者交付,對于剛?cè)胧值娜?DGX Spark,該如何進(jìn)行初始化設(shè)置?本篇文章將引導(dǎo)您完成 DGX Spark 首次設(shè)置。在初始設(shè)置的過程中,您
    的頭像 發(fā)表于 11-17 14:11 ?7317次閱讀
    NVIDIA DGX <b class='flag-5'>Spark</b>快速入門指南

    不用編程不用聯(lián)網(wǎng),實(shí)現(xiàn)福(BECKHOFF)PLC對接SQL數(shù)據(jù)庫,上報(bào)和查詢數(shù)據(jù)的案例

    的數(shù)值;查看過程數(shù)據(jù)(工具->網(wǎng)關(guān)數(shù)據(jù)監(jiān)控):顯示當(dāng)前任務(wù)組對應(yīng)的過程數(shù)據(jù), 即SQL語句。 福PLC內(nèi)需要添加智能網(wǎng)關(guān)的IP地址,同時要確認(rèn)PLC的AMS ID,AMS網(wǎng)絡(luò)端口等參數(shù)
    發(fā)表于 10-10 11:14

    SQL 通用數(shù)據(jù)類型

    SQL 通用數(shù)據(jù)類型 數(shù)據(jù)庫表中的每個列都要求有名稱和數(shù)據(jù)類型。Each column in a database table is required to have a name and a
    的頭像 發(fā)表于 08-18 09:46 ?918次閱讀

    Text2SQL準(zhǔn)確率暴漲22.6%!3大維度全拆

    基于 BIRD 數(shù)據(jù)集展開。 方法:提出 J-Schema 呈現(xiàn)數(shù)據(jù)庫結(jié)構(gòu)并合理提供示例值,結(jié)合思維鏈引導(dǎo)模型推理。采用 Iterative DPO 迭代訓(xùn)練,多輪迭代提升性能。用自洽性方法,通過硬 / 軟投票從多個候選答案中選最優(yōu),軟投票更優(yōu)。 結(jié)果:解決 Text2
    的頭像 發(fā)表于 08-14 11:17 ?862次閱讀
    Text2<b class='flag-5'>SQL</b>準(zhǔn)確率暴漲22.6%!3大維度全拆

    快手上線鴻蒙應(yīng)用高性能解決方案:數(shù)據(jù)反序列化性能提升90%

    普通對象(如 JSON 數(shù)據(jù))與類實(shí)例進(jìn)行互轉(zhuǎn),是實(shí)現(xiàn)面向?qū)ο缶幊膛c數(shù)據(jù)序列化解耦的核心工具。隨著業(yè)務(wù)復(fù)雜度的提升,該庫在反序列化過程中逐漸暴露出性能瓶頸,影響用戶核心體驗(yàn)。因此
    發(fā)表于 05-15 10:01
    桐梓县| 乐清市| 乐东| 达日县| 营口市| 梓潼县| 林口县| 自贡市| 察哈| 环江| 彭水| 嘉兴市| 深水埗区| 墨玉县| 克拉玛依市| 永吉县| 天峻县| 泰州市| 栾城县| 武宁县| 汤原县| 泰顺县| 阜康市| 肥东县| 安陆市| 沙雅县| 巫山县| 永和县| 攀枝花市| 湄潭县| 甘南县| 黄大仙区| 宜丰县| 恩施市| 中方县| 巩留县| 屏山县| 舞阳县| 衡水市| 根河市| 河池市|