日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

幫助弱者讓你變得更強:利用多任務(wù)學(xué)習(xí)提升非自回歸翻譯質(zhì)量

深度學(xué)習(xí)自然語言處理 ? 來源:南大NLP ? 作者:南大NLP ? 2022-11-09 16:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

01

研究動機

目前最先進的神經(jīng)機器翻譯模型主要是自回歸(autoregressive, AR)[1][2]模型,即在解碼時從左向右依次生成目標端單詞。盡管具有很強的性能,但這種順序解碼會導(dǎo)致較高的解碼時延,在效率方面不令人滿意。相比之下,非自回歸(non-autoregressive, NAR)模型[3]使用更加高效的并行解碼,在解碼時同時生成所有的目標端單詞。為此,NAR模型需要對目標端引入條件獨立假設(shè)。然而,這一假設(shè)無法在概率上準確地描述人類語言數(shù)據(jù)中的多模態(tài)現(xiàn)象(或多樣性現(xiàn)象,即一條源端句存在多個正確的翻譯結(jié)果)。這為NAR模型帶來了嚴峻的挑戰(zhàn),因為條件獨立假設(shè)與傳統(tǒng)的極大似然估計(Maximum Likelihood Estimate, MLE)訓(xùn)練方式無法為NAR模型提供足夠信息量的學(xué)習(xí)信號和梯度。因此,NAR模型經(jīng)常產(chǎn)生較差的神經(jīng)表示,尤其是在解碼器(Decoder)部分。而由于解碼器部分直接控制生成,從而導(dǎo)致了NAR模型顯著的性能下降。為了提升NAR模型的性能,大多數(shù)先前的研究旨在使用更多的條件信息來改進目標端依賴關(guān)系的建模(GLAT[4], CMLM[5])。我們認為,這些研究工作相當于在不改變NAR模型概率框架的前提下提供更好的替代學(xué)習(xí)信號。并且,這些工作中的大部分需要對模型結(jié)構(gòu)進行特定的修改。

沿著這個思路,我們希望能夠為NAR模型提供更具信息量的學(xué)習(xí)信號,以便更好地捕獲目標端依賴。同時,最好可以無需對模型結(jié)構(gòu)進行特定的修改,適配多種不同的NAR模型。因此,在本文中我們提出了一種簡單且有效的多任務(wù)學(xué)習(xí)框架。我們引入了一系列解碼能力較弱的AR Decoder來輔助NAR模型訓(xùn)練。隨著弱AR Decoder的訓(xùn)練,NAR模型的隱層表示中將包含更多的上下文和依賴信息,繼而提高了NAR模型的解碼性能。同時,我們的方法是即插即用的,且對NAR模型的結(jié)構(gòu)沒有特定的要求。并且我們引入的AR Decoder僅在訓(xùn)練階段使用,因此沒有帶來額外的解碼開銷。

02

貢獻

1、我們提出了一個簡單有效的多任務(wù)學(xué)習(xí)框架,使NAR模型隱層表示包含更豐富的上下文和依賴信息。并且我們的方法無需對模型結(jié)構(gòu)進行特定的修改,適配多種NAR模型。

2、一系列AR Decoder的引入帶來了較大的訓(xùn)練開銷。為此我們提出了兩種降低訓(xùn)練開銷的方案,在幾乎不損失性能的前提下顯著降低了參數(shù)量和訓(xùn)練時間。

3、在多個數(shù)據(jù)集上的實驗結(jié)果表明,我們的方法能夠為不同的NAR模型帶來顯著的提升。當使用束搜索解碼時,我們的模型在所有數(shù)據(jù)集上均優(yōu)于強大的Transformer模型,同時不引入額外的解碼開銷。

03

解決方案

3.1、模型結(jié)構(gòu)

我們的模型結(jié)構(gòu)如圖1所示。對于每個NAR Decoder層,我們都引入了一個輔助的弱AR Decoder(每個AR Decoder僅包含1層Transformer Layer)。我們令這些AR Decoder基于對應(yīng)的NAR隱層表示進行解碼,即令NAR隱層表示作為AR Decoder Cross-Attention的Key和Value。由于AR Decoder的解碼能力較弱,因此很難自行捕捉目標句的依賴關(guān)系。只有當其對應(yīng)的NAR隱層表示中的信息足夠充分,AR Decoder才能夠正確地解碼。因此,AR Decoder為NAR模型帶來了新的訓(xùn)練信號,迫使NAR Decoder變得更強,在隱層表示中包含更多的上下文和依賴信息來支持AR Decoder的解碼。在這個過程中,NAR提升了自己的表示能力,從而在實際解碼時獲得了更好的表現(xiàn)。

9a185f60-5f58-11ed-8abf-dac502259ad0.png

圖1:我們的方法示意圖

3.2、訓(xùn)練目標

我們的訓(xùn)練目標如下式所示

9a3715d6-5f58-11ed-8abf-dac502259ad0.png

對于NAR部分,我們保持NAR模型的原始訓(xùn)練目標不變。如對于CTC模型,我們使用CTC Loss作為NAR的損失函數(shù)。對于AR部分,我們使用交叉熵損失進行訓(xùn)練,并將所有AR Decoder的損失相加。最終的損失函數(shù)是兩部分的加權(quán)和,權(quán)重是超參數(shù)。

3.3、Glancing Training訓(xùn)練策略

Glancing Training是一種有效提升NAR模型性能的訓(xùn)練策略[4]。我們在我們的方法中應(yīng)用了Glancing Training。具體來說,在訓(xùn)練時根據(jù)模型當前的解碼質(zhì)量,隨機采樣參考句中的token作為NAR Decoder的輸入。模型當前解碼質(zhì)量越差則采樣越多,反之亦然。然后令A(yù)R Decoder基于NAR隱層表示進行解碼。

3.4、降低解碼開銷

我們?yōu)槊繉覰AR Decoder都配置了一個AR Decoder,這可能會帶來較大的訓(xùn)練開銷。為此,我們從模型參數(shù)量和訓(xùn)練時間的角度,提出了兩種降低訓(xùn)練開銷的方案。

Parameter Sharing:令所有的AR Decoder之間共享參數(shù),降低參數(shù)量;

Layer Dropout:每個訓(xùn)練步隨機選擇一半數(shù)量的AR Decoder進行訓(xùn)練,降低訓(xùn)練時間。

3.5、解碼過程

在解碼時,我們不使用AR Decoder,僅使用NAR模型自身進行解碼。因此,我們的方法沒有引入額外的解碼開銷。

04

實驗

我們在機器翻譯領(lǐng)域目前最廣泛使用的數(shù)據(jù)集上進行了實驗:WMT14英德(4.5M語言對)、WMT16英羅(610K語言對)、IWSLT14德英(160K語言對)。我們遵循Gu和Kong[6]的工作中的數(shù)據(jù)預(yù)處理方式,并且使用了BLEU[9]指標作為機器翻譯質(zhì)量評價指標。為了緩解數(shù)據(jù)集中多模態(tài)現(xiàn)象導(dǎo)致的訓(xùn)練困難,我們對所有數(shù)據(jù)集使用了知識蒸餾技術(shù)進行處理[3]。

4.1、實驗結(jié)果

我們的方法可以對不同類型的NAR模型帶來提升。

我們使用了Vanilla-NAR[3]和CTC[7]作為我們的基線模型,并在基線模型上應(yīng)用我們的方法,實驗結(jié)果如表1所示??梢钥吹?,我們的方法一致且顯著地提高了每個基線模型在每個語言對上的翻譯質(zhì)量。這說明了我們方法的通用性。

表1:對不同的基線模型應(yīng)用我們的方法

9a494d1e-5f58-11ed-8abf-dac502259ad0.png

與其他的NAR模型相比,我們的方法獲得了更好的結(jié)果。

我們選用CTC模型應(yīng)用我們的方法作為我們的模型,并與其他強大的NAR模型進行比較,實驗結(jié)果如表2所示。可以看到,我們的方法顯著提高了翻譯質(zhì)量,并優(yōu)于其他強大的基線模型。此外,當應(yīng)用Glancing Training技術(shù)后,我們的方法可以帶來更大程度的提升。

與采取迭代解碼的模型(CMLM)相比,我們的方法僅使用單步解碼,具備更快的解碼速度,并在除了WMT14英德之外的所有語言對上獲得了更好的性能。

Hao等人[8]的工作與我們的工作相關(guān),都使用了多任務(wù)學(xué)習(xí)框架。我們在CTC模型上復(fù)現(xiàn)了他們的方法(CTC+MTL)。實驗結(jié)果表明我們的方法可以為模型帶來更明顯的提升。

表2:與其他強大的NAR模型比較。9a5b6e7c-5f58-11ed-8abf-dac502259ad0.png代表使用k輪迭代解碼

9a70d4a6-5f58-11ed-8abf-dac502259ad0.png

4.2、實驗分析

較弱的AR Decoder是否有必要?

在我們的方法中,AR Decoder的解碼能力需要足夠弱,由此強迫NAR Decoder變得更強。我們對這一點進行了驗證。我們使用不同層數(shù)的AR Decoder進行實驗(1、3、6層),實驗結(jié)果如圖2所示。每種深度的AR Decoder都可以為NAR模型帶來增益,但是隨著AR Decoder層數(shù)的增加,AR Decoder解碼能力增強,為NAR模型帶來的增益也在逐漸降低。這也驗證了我們的動機:一個較弱的AR Decoder能夠使NAR Decoder包含更多有用的信息。

9a946d9e-5f58-11ed-8abf-dac502259ad0.png

圖2:不同層數(shù)的AR Decoder為模型帶來了不同程度的增益

關(guān)于訓(xùn)練開銷的消融實驗。

我們在IWSLT14德英數(shù)據(jù)集上評估了我們提出的降低訓(xùn)練開銷策略的效果。如表3所示,在使用了Param Sharing和Layer Dropout兩種策略后,參數(shù)量(83.8M vs 55.3M)和訓(xùn)練時間(31.2h vs 19.4h)均得到了顯著的降低,同時保持模型性能幾乎沒有變化

表3:兩種降低訓(xùn)練開銷策略的效果評估

9aaa27d8-5f58-11ed-8abf-dac502259ad0.png

我們的方法使模型能夠更好地解碼長句。

為了進一步分析NAR模型在生成不同長度目標端句時的表現(xiàn)差異,我們在WMT14英德數(shù)據(jù)集的測試集上進行了實驗,將目標端句按照長度分成不同的區(qū)間。如表4所示,隨著句子長度的增加,我們的模型和Transformer之間的差距在逐漸降低。當目標端句長度大于60時,我們的模型能夠超過Transformer的解碼性能。在解碼更長的句子時,模型需要處理更復(fù)雜的上下文關(guān)聯(lián)。我們推測我們提出的多任務(wù)學(xué)習(xí)方法顯著改善了NAR隱藏狀態(tài)下包含的上下文和依賴信息,因此在長句子翻譯中具有更好的性能。

表4:生成不同長度目標端句時的性能差異

9ac170e6-5f58-11ed-8abf-dac502259ad0.png

我們的方法使模型減少了重復(fù)生成。

由于數(shù)據(jù)集中的多模態(tài)現(xiàn)象,NAR模型會出現(xiàn)重復(fù)生成的翻譯錯誤。表5展示了在應(yīng)用我們的方法前后,NAR模型出現(xiàn)重復(fù)生成現(xiàn)象的比率??梢钥吹剑覀兊姆椒@著降低了重復(fù)單詞的出現(xiàn)頻率,使NAR模型的生成質(zhì)量更好。值得注意的是,盡管CTC模型本身已經(jīng)能夠產(chǎn)生很少的重復(fù)生成,我們的方法依然可以進一步降低重復(fù)生成的比率。

表5:重復(fù)生成的比率

9adb01aa-5f58-11ed-8abf-dac502259ad0.png

不使用知識蒸餾技術(shù)時的性能表現(xiàn)。

盡管知識蒸餾是一種常用的約減多模態(tài)現(xiàn)象的手段,但它限制了NAR模型在AR教師模型下的性能,同時構(gòu)建教師模型也需要額外的開銷。為了驗證我們的方法在原始數(shù)據(jù)場景中的有效性,我們在WMT14和IWSLT14數(shù)據(jù)集上進行了實驗。如表6所示,我們的方法可以為基線模型(CTC)帶來非常顯著的提升,進一步縮小了與Transformer模型的差距。

表6:不使用知識蒸餾的實驗結(jié)果

9afd0700-5f58-11ed-8abf-dac502259ad0.png

我們的方法相對于其他多任務(wù)學(xué)習(xí)方法的優(yōu)勢。

Hao等人[8]的工作也使用了多任務(wù)學(xué)習(xí)框架,但我們的方法能夠為NAR模型帶來更顯著的提升。我們認為我們的方法在多任務(wù)學(xué)習(xí)模塊(即AR Decoder)的位置和容量上更有優(yōu)勢。

對于AR Decoder的位置,我們認為Decoder決定生成過程,因此將AR Decoder部署于NAR Decoder上能夠更直接和顯式地改善NAR的生成過程,而Hao等人的工作是部署于NAR Encoder上的。

對于AR Decoder的容量,我們認為AR Decoder應(yīng)盡可能弱,這樣AR Decoder無法自行對目標端句進行建模,從而迫使NAR Decoder隱層表示包含更多的上下文和依賴信息。而Hao等人的工作使用的標準AR Decoder,對NAR隱層表示的要求更低,因此為NAR帶來的提升更少。

05

總結(jié)

在本文中,我們?yōu)镹AR模型提出了一個多任務(wù)學(xué)習(xí)框架,引入了一系列弱AR解碼器輔助訓(xùn)練NAR模型。隨著弱AR解碼器的訓(xùn)練,NAR隱藏狀態(tài)將包含更多的上下文和依賴信息,從而提高NAR模型的性能。在多個數(shù)據(jù)集上的實驗表明,我們的方法可以顯著且一致地提高翻譯質(zhì)量。當使用束搜索解碼時,我們基于CTC的NAR模型在所有基準測試上都優(yōu)于強大的Transformer,同時不引入額外的解碼開銷。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1225

    瀏覽量

    43793
  • Ar
    Ar
    +關(guān)注

    關(guān)注

    25

    文章

    5294

    瀏覽量

    176767
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3835

    瀏覽量

    52293

原文標題:EMNLP'22 | 幫助弱者讓你變得更強:利用多任務(wù)學(xué)習(xí)提升非自回歸翻譯質(zhì)量

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Arm SME2技術(shù)加速騰訊翻譯大模型推理

    騰訊混元將翻譯大模型 Hy-MT1.5 壓縮至最小 440MB(1.25-bit 模型),輕輕松松裝進手機。不僅如此,依托第二代 Arm 可伸縮矩陣擴展 (Arm SME2) 技術(shù)加持,推理表現(xiàn)進一步提升,隨時隨地
    的頭像 發(fā)表于 05-06 10:07 ?284次閱讀
    Arm SME2技術(shù)加速騰訊<b class='flag-5'>翻譯</b>大模型推理

    螞蟻集團全模態(tài)代碼算法團隊研OpAgent技術(shù)框架

    為應(yīng)對真實 Web 環(huán)境的結(jié)構(gòu)化復(fù)雜性、時序不穩(wěn)定性與交互隱式邏輯等挑戰(zhàn),螞蟻集團全模態(tài)代碼算法團隊提出了一套結(jié)合了多任務(wù)微調(diào)、在線強化學(xué)習(xí)與模塊化協(xié)作的綜合解決方案:OpAgent。
    的頭像 發(fā)表于 03-18 17:13 ?1038次閱讀
    螞蟻集團全模態(tài)代碼算法團隊<b class='flag-5'>自</b>研OpAgent技術(shù)框架

    算法工程師需要具備哪些技能?

    :自動化任務(wù)(如數(shù)據(jù)預(yù)處理、模型訓(xùn)練調(diào)度)。Git版本控制:團隊協(xié)作開發(fā)(如分支管理、代碼合并)。 機器學(xué)習(xí)監(jiān)督學(xué)習(xí):線性回歸、邏輯回歸、決
    發(fā)表于 02-27 10:53

    嵌入式單片機開發(fā)學(xué)習(xí)路徑

    嵌入式系統(tǒng)是現(xiàn)代科技的重要組成部分,廣泛應(yīng)用于智能家居、汽車電子、工業(yè)控制、醫(yī)療設(shè)備等領(lǐng)域。學(xué)習(xí)嵌入式單片機開發(fā)不僅能提升個人技能,還能開拓職業(yè)發(fā)展路徑。本文將為提供一條詳細的嵌入式單片機開發(fā)
    發(fā)表于 02-09 15:42

    強化學(xué)習(xí)自動駕駛模型學(xué)習(xí)更快嗎?

    是一種機器通過“試錯”學(xué)會決策的辦法。與監(jiān)督學(xué)習(xí)不同,監(jiān)督學(xué)習(xí)是有人提供示范答案,模型去模仿;而強化學(xué)習(xí)不會把每一步的“正確答案”都告訴
    的頭像 發(fā)表于 01-31 09:34 ?864次閱讀
    強化<b class='flag-5'>學(xué)習(xí)</b>會<b class='flag-5'>讓</b>自動駕駛模型<b class='flag-5'>學(xué)習(xí)</b>更快嗎?

    西得樂利用 CADENAS ENTERPRISE 3Dfindit 優(yōu)化批量生產(chǎn)

    的戰(zhàn)略零件管理之前,Seidel 不得不手動執(zhí)行許多任務(wù),這往往會減慢甚至完全停止生產(chǎn)流程。自從引入ENTERPRISE 3Dfindit 后,Seidel 看到了成功,如節(jié)約成本、節(jié)省時間和更好的組織性
    發(fā)表于 01-22 13:49

    一文說透了如何實現(xiàn)單片機的多任務(wù)并發(fā)!

    在嵌入式系統(tǒng)開發(fā)中,多任務(wù)并發(fā)是非常常見的,對于處理復(fù)雜的應(yīng)用場景、提升系統(tǒng)的并發(fā)能力、提高系統(tǒng)的實時性等方面都有很大好處。在單片機中實現(xiàn)多任務(wù)并發(fā)是非常重要的,本文將為大家介紹如何在單片機中實現(xiàn)
    發(fā)表于 01-06 06:46

    多任務(wù)系統(tǒng)中,如何平衡任務(wù)調(diào)度以防止因高負載導(dǎo)致的再次進入低功耗模式的延遲?

    多任務(wù)系統(tǒng)中,如何平衡任務(wù)調(diào)度以防止因高負載導(dǎo)致的再次進入低功耗模式的延遲?
    發(fā)表于 12-04 06:37

    學(xué)習(xí)RTOS的意義?

    對于嵌入式軟件工程師,學(xué)習(xí)RTOS非常有必要。 1. 項目需要 隨著產(chǎn)品要實現(xiàn)的功能越來越多,單純的裸機系統(tǒng)已經(jīng)不能完美地解決問題,反而會使編程變得更加復(fù)雜,如果想降低編程的難度,就必須引入
    發(fā)表于 11-27 08:16

    一句話,多個命令同時執(zhí)行,AI語音模組也能多任務(wù)處理?

    、 Ai-WV02-32S ? 將語音識別、喚醒、語義理解等核心功能, 濃縮在一顆小小的模組中。 安信可AI語音模組支持 MCP 協(xié)議(Multi Command Processing,多命令并行處理) ,語音交互從“單線程”進化為真正的“多任務(wù)協(xié)同”! 一句話喚醒“
    的頭像 發(fā)表于 10-31 14:45 ?705次閱讀
    一句話,多個命令同時執(zhí)行,AI語音模組也能<b class='flag-5'>多任務(wù)</b>處理?

    愛普科技PSRAM加速wisun無線模塊多任務(wù)處理

    愛普科技256Mb PSRAM(如APS256XXN-OBR-BG)為WiSUN無線模塊提供高速數(shù)據(jù)緩存與臨時存儲解決方案,其166MHz速率、1.8V低功耗及小尺寸封裝顯著提升模塊在智能電網(wǎng)、工業(yè)自動化中的多任務(wù)處理能力和穩(wěn)定性。
    的頭像 發(fā)表于 10-14 09:25 ?558次閱讀
    愛普科技PSRAM加速wisun無線模塊<b class='flag-5'>多任務(wù)</b>處理

    揭秘LuatOS Task:多任務(wù)管理的“智能中樞”

    Task任務(wù)作為LuatOS的核心組成部分,通過智能化的任務(wù)管理機制,實現(xiàn)任務(wù)的創(chuàng)建、調(diào)度與協(xié)同運行,復(fù)雜應(yīng)用得以高效并行處理,滿足實時場景下的嚴苛需求。 sys核心庫是LuatOS
    的頭像 發(fā)表于 08-28 13:48 ?814次閱讀
    揭秘LuatOS Task:<b class='flag-5'>多任務(wù)</b>管理的“智能中樞”

    電控系統(tǒng)的 “功率翻譯官”:車規(guī)電容如何能源利用效率提升 10%?

    官"的關(guān)鍵角色。最新行業(yè)數(shù)據(jù)顯示,采用新一代車規(guī)電容技術(shù)的電控系統(tǒng),可實現(xiàn)能源利用效率提升10%的突破性進展,這相當于為續(xù)航500公里的電動車額外增加50公里續(xù)航能力。 車規(guī)電容之所以能成為能源效率提升的"幕后功臣",源于其
    的頭像 發(fā)表于 07-31 16:07 ?1004次閱讀

    快速入門——LuatOS:sys庫多任務(wù)管理實戰(zhàn)攻略!

    在嵌入式開發(fā)中,多任務(wù)管理是提升系統(tǒng)效率的關(guān)鍵。本教程專為快速入門設(shè)計,聚焦LuatOS的sys庫,通過實戰(zhàn)案例帶你快速掌握多任務(wù)創(chuàng)建、調(diào)度與同步技巧。無論是零基礎(chǔ)新手還是希望快速
    的頭像 發(fā)表于 05-29 14:36 ?1026次閱讀
    快速入門——LuatOS:sys庫<b class='flag-5'>多任務(wù)</b>管理實戰(zhàn)攻略!

    工業(yè)通信的“超級翻譯官”Modbus轉(zhuǎn)Profinet如何稱重設(shè)備實現(xiàn)語言自由

    在競爭激烈的工業(yè)自動化領(lǐng)域,設(shè)備間通信協(xié)議的差異常常成為提升生產(chǎn)效率的絆腳石。但別擔(dān)心,我們?yōu)槟鷰砹艘粋€卓越的解決方案——VING微硬創(chuàng)新Modbus轉(zhuǎn)Profinet連接稱重設(shè)備的實現(xiàn)方案,
    發(fā)表于 05-21 15:45
    眉山市| 台湾省| 巴中市| 朝阳市| 汝南县| 乌兰县| 临朐县| 台东市| 颍上县| 囊谦县| 衡水市| 朔州市| 新绛县| 定安县| 理塘县| 闸北区| 苍溪县| 惠水县| 郯城县| 任丘市| 陆良县| 田林县| 樟树市| 台安县| 类乌齐县| 洪江市| 湘西| 宜都市| 泰来县| 海阳市| 晴隆县| 松江区| 昭苏县| 手游| 田林县| 凌云县| 泽库县| 图片| 嘉黎县| 巴中市| 荔浦县|