日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

詳細(xì)介紹算法效果調(diào)優(yōu)的流程

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:CS的陋室 ? 作者:機(jī)智的叉燒 ? 2022-08-24 09:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

效果調(diào)優(yōu)應(yīng)該是算法工程師最基礎(chǔ)的工作了我們需要對(duì)當(dāng)前的現(xiàn)狀有一定了解后,提出有效的效果優(yōu)化方案,為指標(biāo)服務(wù),最終達(dá)到指標(biāo)提升的目標(biāo)。但是,效果調(diào)優(yōu)并不是一個(gè)容易的事,為了讓大家能更快找到有效的解決方案,完成優(yōu)化任務(wù),這里給大家介紹一下我的流程和思路。

算法效果調(diào)優(yōu)的流程

在開(kāi)始之前,先和大家說(shuō)清為什么要有這個(gè)流程。所謂流程,在明確的情況下,能讓大家更簡(jiǎn)單直接地執(zhí)行,執(zhí)行過(guò)程中,更不容易遺漏關(guān)鍵點(diǎn),流暢地流程能讓我們更快更有目的性地做事,所以有這個(gè)流程還是很重要的。效果調(diào)優(yōu)主要是下面幾個(gè)流程,我詳細(xì)介紹下。

明確目標(biāo)和現(xiàn)狀

一個(gè)模型也好,一個(gè)算法模塊也好,他都有自己的功能,他執(zhí)行的怎么樣,有哪些問(wèn)題,距離預(yù)期差多遠(yuǎn),這都是我們要在最開(kāi)始明確的,一般情況很簡(jiǎn)單,就是看指標(biāo),例如準(zhǔn)確率和召回率,復(fù)雜的,還有一些業(yè)務(wù)角度的指標(biāo),我們必須明確,在開(kāi)始執(zhí)行,為了方便大家觀測(cè),這里列舉出需要在這步里回答的問(wèn)題,供大家參考,能回答這些問(wèn)題,那可以開(kāi)始進(jìn)行下一步。

這個(gè)模塊的主要功能是什么,預(yù)期的指標(biāo)是多少,計(jì)算和抽樣邏輯是否具有合理性(一定要注意,有些時(shí)候出現(xiàn)的問(wèn)題就在抽樣和指標(biāo)上,這個(gè)錯(cuò)了,后面的優(yōu)化無(wú)從談起)。

當(dāng)前模塊的指標(biāo)是多少,距離目標(biāo)還差多少。

具體使用的技術(shù)方案是什么,這里有沒(méi)有做什么權(quán)衡和妥協(xié),這些妥協(xié)有沒(méi)有解開(kāi)的可能。

上面的問(wèn)題,如果能夠很清楚地回答,說(shuō)明你對(duì)這個(gè)問(wèn)題、模塊等都非常明確,在這個(gè)前提下去做效果調(diào)優(yōu),才是有效的。

分析和定位問(wèn)題

很多新人很容易跳過(guò)這個(gè)步驟,但這往往是最重要,而且是最考驗(yàn)算法工程師功力的部分。

分析和定位的過(guò)程,核心目標(biāo)是關(guān)注這幾個(gè)問(wèn)題:

確定當(dāng)前方案的問(wèn)題點(diǎn)在哪里,哪些位置或者哪些case沒(méi)有解決好。

看集中性和case分布,哪些是重點(diǎn)問(wèn)題,需要優(yōu)先考慮哪些問(wèn)題。

評(píng)估問(wèn)題的難度和解決率,從而了解預(yù)期的收益。

這里的分析,我喜歡把它分為兩個(gè)視角,一個(gè)是宏觀,另一個(gè)是微觀。前者更關(guān)注整體數(shù)據(jù)上的問(wèn)題,通過(guò)多個(gè)角度的統(tǒng)計(jì),來(lái)發(fā)現(xiàn)目前數(shù)據(jù)和模型的問(wèn)題,例如在多分類(lèi)場(chǎng)景,統(tǒng)計(jì)各個(gè)類(lèi)目的準(zhǔn)確率、召回率甚至各個(gè)類(lèi)目的數(shù)據(jù)占比,找出類(lèi)目短板,對(duì)類(lèi)目短板進(jìn)行針對(duì)性提升是可以很大程度上提升總體指標(biāo)的;后者,則是進(jìn)行case分析,找出bad case的一些共性,并對(duì)共性問(wèn)題進(jìn)行針對(duì)性解決,當(dāng)然這里也會(huì)考驗(yàn)到不同角度的bad case抽取,這個(gè)可以結(jié)合前面宏觀的分析結(jié)論來(lái)抽樣處理。

解決方案的制定

有了前面信息的支撐,我們是可以開(kāi)始進(jìn)行效果調(diào)優(yōu)了,然而,用什么方法來(lái)解決,也是一個(gè)問(wèn)題,如何去找最合適的方法來(lái)解決我們上面分析出的問(wèn)題。

首先,我們要知道,有哪些可行的解決方案。如果是只會(huì)換模型,調(diào)參數(shù),那招數(shù)屬實(shí)有點(diǎn)少,如果是這種情況,我們就應(yīng)該去調(diào)研,多去看看業(yè)界和科研界的主要方案(平時(shí),也需要),另一方面,我們也看看簡(jiǎn)單地,從樣本、模型、規(guī)則上是否有快速的解決方案,增加手里能打的牌,才有可能有好牌,只有儲(chǔ)備的夠多,才更容易從中找出好東西來(lái)解決問(wèn)題。

第二步,就是方案的選擇,要從眾多方案中,找出最優(yōu)的方案,這里大家需要考慮這幾個(gè)問(wèn)題:

方案對(duì)問(wèn)題的解決程度是否可以明確,看能解決當(dāng)前多少的問(wèn)題。

方案的上下限在哪,除了解決問(wèn)題本身外,還有沒(méi)有別的問(wèn)題可以解決,或者帶來(lái)哪些傷害,換言之,方案的優(yōu)缺點(diǎn)是什么,這點(diǎn)要明確。

方案需要投入多少的時(shí)間、人力、機(jī)器、數(shù)據(jù)等資源。

這些問(wèn)題大家平時(shí)多少都會(huì)考慮到,但是并不一定全,尤其是后者,玩NLP的多少都會(huì)手癢試試BERT,包括我在內(nèi),但是理性思考后其實(shí)很可能不會(huì)當(dāng)做一個(gè)優(yōu)先級(jí)較高的方案了,尤其是問(wèn)題都很明確的情況下。

調(diào)優(yōu)的難點(diǎn)問(wèn)題

說(shuō)到調(diào)優(yōu),其實(shí)難度比較大的,是這么幾個(gè)位置。

首先,是問(wèn)題的定位難,我們往往很容易通過(guò)直觀的指標(biāo)知道我們的方案是有問(wèn)題,有一定空間的,但是,具體突破口在哪里,這個(gè)會(huì)很困難。這里給大家?guī)讉€(gè)建議吧:

多看case,好的壞的,都多看看,理解業(yè)務(wù)里面常見(jiàn)的用例,只有理解,才能更多地發(fā)現(xiàn)問(wèn)題。

當(dāng)然,我們也可以多看看很多文章,論文的、技術(shù)分享的等等,很多文章都會(huì)去聊他們面臨的問(wèn)題以解決方案,這些問(wèn)題其實(shí)給我們提供思路,例如“我們會(huì)不會(huì)也遇到和他們一樣的問(wèn)題”。

然后,是解決方案的儲(chǔ)備問(wèn)題。方案分兩種,一種是針對(duì)性方案,根據(jù)明顯的問(wèn)題我們可以想到一些快速的解決方案,這個(gè)往往取決于我們對(duì)業(yè)務(wù)的理解能力和方法的熟悉程度。第二種,是一些長(zhǎng)期的,依賴儲(chǔ)備的方案,很多業(yè)界的方法會(huì)給我們很多思路,這些思路的內(nèi)化能讓我們很快從中找到解決方案。無(wú)論是前者還是后者,其實(shí)都很依賴我們的平時(shí)積累,這個(gè)積累不僅在于量,還在于質(zhì),也就是深度,對(duì)方案理解的越清楚,越能看清本質(zhì),我們用起來(lái)其實(shí)會(huì)更加得心應(yīng)手。

第三點(diǎn),是技術(shù)方案的權(quán)衡。權(quán)衡是根據(jù)我們需要面臨的技術(shù)環(huán)境的,例如數(shù)據(jù)、機(jī)器、時(shí)間、人力等,有的方案可能可以很好的解決問(wèn)題,但是會(huì)花費(fèi)很多成本,例如NLPer最喜歡的預(yù)訓(xùn)練模型,他是很依賴機(jī)器的,后續(xù)即使效果真的會(huì)有提升,也要考慮到性能和機(jī)器的問(wèn)題最終可能上不了線就功虧一簣了。這個(gè)其實(shí)挺吃經(jīng)驗(yàn),權(quán)衡這個(gè)能力是需要經(jīng)過(guò)項(xiàng)目的歷練,逐步形成的,坑才多了才能把坑繞過(guò),這點(diǎn)需要大家在進(jìn)行項(xiàng)目的過(guò)程中多思考多總結(jié)。

調(diào)優(yōu)能力

上面聊了很多有關(guān)調(diào)優(yōu)流程的東西,但是,調(diào)優(yōu)本身的能力要求還是比較高的,這里我整理了一些有關(guān)調(diào)優(yōu)能力的能力項(xiàng)和成長(zhǎng)的階段,看看對(duì)大家有沒(méi)有什么幫助,當(dāng)然,我自己的能力也沒(méi)到很高的水平,持續(xù)學(xué)習(xí)和成長(zhǎng)吧。

首先是執(zhí)行力,在問(wèn)題都給清楚了,解決方案也明確了,這個(gè)時(shí)候能編碼實(shí)現(xiàn),這個(gè)應(yīng)該是最基本的能力了。

第二層就是獨(dú)立完成的能力。

首先,能通過(guò)多種分析手段,診斷出現(xiàn)有方案的問(wèn)題。

第二,就是解決方案的提出。這里背后,比較重要的事解決方案和技術(shù)的儲(chǔ)備。這點(diǎn)是需要長(zhǎng)期積累的,一方面是對(duì)數(shù)據(jù)、場(chǎng)景的熟悉,另一方面是對(duì)業(yè)界和科研界的技術(shù)的了解,如果儲(chǔ)備不夠,很多問(wèn)題絕對(duì)是解決不了的。

第三層,其實(shí)除了獨(dú)立完成以外,能有整個(gè)項(xiàng)目的視野。

現(xiàn)狀的理解和未來(lái)的規(guī)劃,能帶著規(guī)劃去設(shè)計(jì)解決方案。

能夠跳出問(wèn)題,結(jié)合業(yè)務(wù)等因素來(lái)解決問(wèn)題和甚至到框架和系統(tǒng)的設(shè)計(jì)。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4810

    瀏覽量

    98610

原文標(biāo)題:談?wù)勑Ч{(diào)優(yōu)的流程和能力

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Nginx高并發(fā)連接調(diào)優(yōu)實(shí)戰(zhàn)手冊(cè)

    Nginx 的高性能源自其事件驅(qū)動(dòng)架構(gòu)。與 Apache 的"每連接一線程"模型不同,Nginx 使用單線程事件循環(huán)處理數(shù)千個(gè)并發(fā)連接。理解這套架構(gòu)是調(diào)優(yōu)的前提。
    的頭像 發(fā)表于 03-16 15:28 ?491次閱讀

    算法工程師需要具備哪些技能?

    、鏈?zhǔn)椒▌t等。應(yīng)用場(chǎng)景:梯度下降優(yōu)化算法、反向傳播計(jì)算等。 優(yōu)化理論核心內(nèi)容:凸優(yōu)化、非凸優(yōu)化、拉格朗日乘數(shù)法等。應(yīng)用場(chǎng)景:模型參數(shù)調(diào)優(yōu)、資源分配問(wèn)題等。 編程語(yǔ)言Python:主流選擇,用于數(shù)據(jù)處理、模型
    發(fā)表于 02-27 10:53

    解鎖Zephyr實(shí)時(shí)操作系統(tǒng)深度調(diào)優(yōu)能力

    可以說(shuō),代碼編寫(xiě)只是項(xiàng)目開(kāi)發(fā)的起點(diǎn),而隨之而來(lái)的資源分析與性能調(diào)優(yōu)才是確保系統(tǒng)穩(wěn)定可靠的關(guān)鍵環(huán)節(jié)。
    的頭像 發(fā)表于 01-30 09:16 ?6319次閱讀

    Linux系統(tǒng)內(nèi)核參數(shù)調(diào)優(yōu)實(shí)戰(zhàn)指南

    Linux 內(nèi)核參數(shù)調(diào)優(yōu)是系統(tǒng)性能優(yōu)化的核心環(huán)節(jié)。隨著云原生架構(gòu)的普及和硬件性能的飛速提升,默認(rèn)的內(nèi)核參數(shù)配置往往無(wú)法充分發(fā)揮系統(tǒng)潛力。在高并發(fā) Web 服務(wù)、大數(shù)據(jù)處理、容器化部署等場(chǎng)景下,合理的內(nèi)核參數(shù)調(diào)整可帶來(lái) 30%-200% 的性能提升。
    的頭像 發(fā)表于 01-28 14:27 ?759次閱讀

    實(shí)戰(zhàn)RK3568性能調(diào)優(yōu):如何利用迅為資料壓榨NPU潛能-在Android系統(tǒng)中使用NPU

    《實(shí)戰(zhàn)RK3568性能調(diào)優(yōu):如何利用迅為資料壓榨NPU潛能-在Android系統(tǒng)中使用NPU》
    的頭像 發(fā)表于 11-07 13:42 ?1150次閱讀
    實(shí)戰(zhàn)RK3568性能<b class='flag-5'>調(diào)</b><b class='flag-5'>優(yōu)</b>:如何利用迅為資料壓榨NPU潛能-在Android系統(tǒng)中使用NPU

    天翼云基于開(kāi)源歐拉的智能調(diào)優(yōu)實(shí)踐

    在數(shù)字經(jīng)濟(jì)加速滲透的當(dāng)下,操作系統(tǒng)作為底層基礎(chǔ)設(shè)施的核心,其穩(wěn)定性與適配性直接關(guān)系到行業(yè)數(shù)字化進(jìn)程。隨著CentOS停止維護(hù),國(guó)內(nèi)企業(yè)面臨操作系統(tǒng)遷移的緊迫需求,天翼云基于開(kāi)源歐拉研發(fā)的CTyunOS,不僅成為這一遷移浪潮中的關(guān)鍵解決方案,更通過(guò)智能調(diào)優(yōu)實(shí)踐,為數(shù)字經(jīng)濟(jì)筑
    的頭像 發(fā)表于 10-17 11:04 ?830次閱讀

    音頻DSP設(shè)計(jì)與應(yīng)用

    庫(kù),克服了物理?yè)P(yáng)聲器的限制,提供卓越的音頻性能和專業(yè)級(jí)解決方案。 量身定制的專業(yè)調(diào)優(yōu)工具具有直觀的調(diào)試界面,可簡(jiǎn)化項(xiàng)目開(kāi)發(fā): 在整個(gè) DSP 系列中,新唐科技采用了 MaxxBass 智能低音增強(qiáng)
    發(fā)表于 09-05 07:45

    HarmonyOSAI編程智慧調(diào)優(yōu)

    DevEco Studio提供智慧調(diào)優(yōu)能力,支持通過(guò)自然語(yǔ)言交互,分析并解釋當(dāng)前實(shí)例或項(xiàng)目中存在的性能問(wèn)題,幫助開(kāi)發(fā)者快速定位影響性能的具體原因。該功能從DevEco Studio 6.0.0
    發(fā)表于 09-01 15:15

    HarmonyOS AI輔助編程工具(CodeGenie)智慧調(diào)優(yōu)

    DevEco Studio提供智慧調(diào)優(yōu)能力,支持通過(guò)自然語(yǔ)言交互,分析并解釋當(dāng)前實(shí)例或項(xiàng)目中存在的性能問(wèn)題,幫助開(kāi)發(fā)者快速定位影響性能的具體原因。該功能從DevEco Studio 6.0.0
    發(fā)表于 08-14 11:12

    Linux網(wǎng)絡(luò)性能調(diào)優(yōu)方案

    在當(dāng)今高并發(fā)、大流量的互聯(lián)網(wǎng)環(huán)境下,網(wǎng)絡(luò)性能往往成為系統(tǒng)的瓶頸。作為一名資深運(yùn)維工程師,我在生產(chǎn)環(huán)境中遇到過(guò)無(wú)數(shù)次因?yàn)門(mén)CP/IP參數(shù)配置不當(dāng)導(dǎo)致的性能問(wèn)題。今天分享一套完整的Linux網(wǎng)絡(luò)性能調(diào)優(yōu)方案,幫助大家徹底解決網(wǎng)絡(luò)性能瓶頸。
    的頭像 發(fā)表于 08-06 18:01 ?1524次閱讀

    Linux內(nèi)核參數(shù)調(diào)優(yōu)方案

    在高并發(fā)微服務(wù)環(huán)境中,網(wǎng)絡(luò)性能往往成為K8s集群的瓶頸。本文將深入探討如何通過(guò)精細(xì)化的Linux內(nèi)核參數(shù)調(diào)優(yōu),讓你的K8s節(jié)點(diǎn)網(wǎng)絡(luò)性能提升30%以上。
    的頭像 發(fā)表于 08-06 17:50 ?1189次閱讀

    Linux系統(tǒng)性能調(diào)優(yōu)方案

    關(guān)鍵要點(diǎn)預(yù)覽:本文將深入解析Linux系統(tǒng)性能瓶頸的根本原因,提供可直接落地的調(diào)優(yōu)方案,讓你的系統(tǒng)性能提升30-50%!
    的頭像 發(fā)表于 08-06 17:49 ?1095次閱讀

    MySQL配置調(diào)優(yōu)技巧

    上個(gè)月,我們公司的核心業(yè)務(wù)系統(tǒng)突然出現(xiàn)大面積超時(shí),用戶投訴電話不斷。經(jīng)過(guò)緊急排查,發(fā)現(xiàn)是MySQL服務(wù)器CPU飆升到99%,大量慢查詢堆積。通過(guò)一系列配置調(diào)優(yōu)和SQL優(yōu)化,最終在30分鐘內(nèi)恢復(fù)了服務(wù)。
    的頭像 發(fā)表于 07-31 10:27 ?835次閱讀

    Nginx在企業(yè)環(huán)境中的調(diào)優(yōu)策略

    Nginx作為現(xiàn)代互聯(lián)網(wǎng)架構(gòu)中最重要的Web服務(wù)器和反向代理服務(wù)器,其性能調(diào)優(yōu)對(duì)企業(yè)級(jí)應(yīng)用的穩(wěn)定性和效率至關(guān)重要。本指南將從運(yùn)維實(shí)踐角度出發(fā),詳細(xì)介紹Nginx在企業(yè)環(huán)境中的各種
    的頭像 發(fā)表于 07-14 11:13 ?817次閱讀

    手把手教你如何調(diào)優(yōu)Linux網(wǎng)絡(luò)參數(shù)

    在高并發(fā)網(wǎng)絡(luò)服務(wù)場(chǎng)景中,Linux內(nèi)核的默認(rèn)網(wǎng)絡(luò)參數(shù)往往無(wú)法滿足需求,導(dǎo)致性能瓶頸、連接超時(shí)甚至服務(wù)崩潰。本文基于真實(shí)案例分析,從參數(shù)解讀、問(wèn)題診斷到優(yōu)化實(shí)踐,手把手教你如何調(diào)優(yōu)Linux網(wǎng)絡(luò)參數(shù),支撐百萬(wàn)級(jí)并發(fā)連接。
    的頭像 發(fā)表于 05-29 09:21 ?1219次閱讀
    马关县| 旌德县| 克东县| 高邑县| 信宜市| 莎车县| 珲春市| 册亨县| 波密县| 永昌县| 谢通门县| 普宁市| 平阳县| 布尔津县| 赤壁市| 塘沽区| 巴南区| 南开区| 宁化县| 南岸区| 镇沅| 无为县| 新平| 静海县| 繁峙县| 司法| 房产| 于田县| 庆城县| 册亨县| 额敏县| 合江县| 新乡市| 额尔古纳市| 定南县| 博客| 太湖县| 六枝特区| 玉山县| 五大连池市| 吴忠市|