日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

聆心智能聯(lián)合清華大學(xué)CoAI實(shí)驗(yàn)室共同發(fā)布大模型安全評(píng)估框架,邁向可控可信的大模型

硬科技星球 ? 來(lái)源:硬科技星球 ? 作者:硬科技星球 ? 2023-03-20 15:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

ChatGPT 正在引領(lǐng)人類(lèi)進(jìn)入無(wú)縫人機(jī)交互的新時(shí)代,比爾蓋茨在接受福布斯采訪(fǎng)時(shí)也表示,“ChatGPT的意義不亞于PC和互聯(lián)網(wǎng)的誕生?!辈贿^(guò),當(dāng)搜索引擎 New Bing 與 ChatGPT 結(jié)合,伴隨著“ChatGPT 黑化”等一系列輿論事件的發(fā)生,人們也開(kāi)始對(duì)人工智能帶來(lái)的道德、倫理、安全等風(fēng)險(xiǎn)感到恐慌。

雖然近年來(lái)隨著技術(shù)的不斷突破,大模型獲得了快速發(fā)展并開(kāi)始在各個(gè)場(chǎng)景廣泛應(yīng)用,但仍存在著事實(shí)性錯(cuò)誤、知識(shí)盲區(qū)和常識(shí)偏差等諸多問(wèn)題,還面臨訓(xùn)練數(shù)據(jù)來(lái)源合規(guī)性、數(shù)據(jù)使用的偏見(jiàn)性、生成內(nèi)容的安全性等風(fēng)險(xiǎn)。如何提高模型的準(zhǔn)確度和可靠性,使 AI 生成的內(nèi)容安全、可信、可靠已經(jīng)成為了當(dāng)前大模型在應(yīng)用方向亟待解決的問(wèn)題。

要規(guī)避安全風(fēng)險(xiǎn),降低人工智能對(duì)人類(lèi)的負(fù)面影響,關(guān)鍵在于大模型底座。對(duì)此,清華大學(xué)計(jì)算機(jī)系長(zhǎng)聘副教授、北京聆心智能科技有限公司創(chuàng)始人黃民烈認(rèn)為:“大規(guī)模語(yǔ)言模型(LLM)發(fā)展到現(xiàn)在,模型結(jié)構(gòu)和規(guī)模已經(jīng)有了很大的進(jìn)展,但實(shí)用性還有待加強(qiáng),我們應(yīng)該通過(guò)技術(shù)讓模型更加安全、可控,使其快速適配更多的應(yīng)用場(chǎng)景?!?/p>

據(jù)悉,針對(duì)大模型的安全倫理問(wèn)題,由黃民烈?guī)ьI(lǐng)的研究團(tuán)隊(duì)歷經(jīng)兩年沉淀,建立了大模型安全分類(lèi)體系,并從系統(tǒng)層面和模型層面出發(fā),打造更可控、可信的大模型安全框架。安全框架的建立,定義了大模型的應(yīng)用邊界,促進(jìn)大模型生態(tài)的健康發(fā)展,引領(lǐng)國(guó)內(nèi)學(xué)術(shù)界和工業(yè)界邁向更有用(helpful)、更可信(truthful)、更安全(harmless)的AI研究和應(yīng)用。

相比過(guò)去在安全倫理方面考慮較少的大模型,ChatGPT 背后所依托的大模型取得了巨大的發(fā)展,不僅允許用戶(hù)進(jìn)行后續(xù)更正,還能夠拒絕不當(dāng)請(qǐng)求和預(yù)測(cè),這得益于ChatGPT在安全部分的特別設(shè)計(jì),不過(guò)仍無(wú)法完全避免其生成不安全的內(nèi)容和產(chǎn)生有風(fēng)險(xiǎn)的行為。

此前,由黃民烈?guī)ьI(lǐng)的研究團(tuán)隊(duì)已經(jīng)在安全倫理方面開(kāi)展了相關(guān)研究,并依此建立了大模型安全分類(lèi)體系,其中不安全的對(duì)話(huà)場(chǎng)景包括:政治敏感、犯罪違法、身體健康、心理健康、財(cái)產(chǎn)隱私、歧視/偏見(jiàn)、辱罵/仇恨言論、倫理道德八大方面。這些問(wèn)題與人們的價(jià)值觀(guān)和倫理道德息息相關(guān),可能會(huì)導(dǎo)致用戶(hù)接收不當(dāng)信息、甚至影響用戶(hù)產(chǎn)生有害的行為,限制大模型的發(fā)展和應(yīng)用。

與此同時(shí),研究團(tuán)隊(duì)也針對(duì)以上八大安全場(chǎng)景對(duì)大模型進(jìn)行針對(duì)性升級(jí)。通過(guò)收集多輪安全數(shù)據(jù)訓(xùn)練模型,使模型具備基本的安全性,能夠在遇到安全問(wèn)題時(shí)給予正確的回復(fù)策略,不去做判斷和誤導(dǎo)。進(jìn)一步對(duì)模型進(jìn)行自動(dòng)測(cè)試,針對(duì)安全缺陷通過(guò)微調(diào)的方式進(jìn)行快速迭代,促使模型越來(lái)越符合人類(lèi)的認(rèn)知理解模式,生成更加安全可信的內(nèi)容。

值得一提的是,著眼于容易觸發(fā)安全問(wèn)題的類(lèi)型,研究團(tuán)隊(duì)收集和構(gòu)造了相應(yīng)的hard case(更難識(shí)別和處理的安全測(cè)試用例),總結(jié)和設(shè)計(jì)了六種一般模型難以處理的安全攻擊方式,稱(chēng)為指令攻擊。使安全體系更加完善,進(jìn)一步改進(jìn)和優(yōu)化模型表現(xiàn)。

不論國(guó)內(nèi)國(guó)外,當(dāng)前大模型的安全問(wèn)題仍面臨著嚴(yán)峻的困難和挑戰(zhàn),人工智能作為一門(mén)前沿科技,可以給人類(lèi)帶來(lái)巨大福祉,也會(huì)給人類(lèi)造成未知的隱患。確保強(qiáng)大的人工智能系統(tǒng)能夠被負(fù)責(zé)任地建構(gòu)和部署,打造安全、可信、可靠的 AGI Companion,是該研究團(tuán)隊(duì)的最終愿景。

未來(lái),研究團(tuán)隊(duì)將打造中文大模型的安全風(fēng)險(xiǎn)評(píng)估的 Leaderboard,為國(guó)內(nèi)對(duì)話(huà)大模型的安全評(píng)估提供公平公開(kāi)的測(cè)試平臺(tái),并提供:

  1. 針對(duì)中文對(duì)話(huà)的8個(gè)安全場(chǎng)景,40個(gè)安全類(lèi)別做全面精細(xì)的測(cè)試,包括人工評(píng)估和自動(dòng)評(píng)估。
  2. 額外設(shè)置6種安全攻擊(如目標(biāo)劫持等)的超難指令攻擊測(cè)試樣例,探索模型的安全上限。
  3. 設(shè)置公開(kāi)和隱藏測(cè)試集,眾人皆可參與評(píng)測(cè)。

黃民烈?guī)ьI(lǐng)的研究團(tuán)隊(duì)致力于構(gòu)建具有類(lèi)人水平的對(duì)話(huà)智能體,將依托自身的核心技術(shù),在可控可信的超擬人大模型基礎(chǔ)之上,通過(guò)建立安全、可控的模型邊界,讓AI提供可信、可靠的輸出,引領(lǐng)人工智能走向 AGI 時(shí)代。相信在不遠(yuǎn)的未來(lái),AGI Companion 不僅滿(mǎn)足人類(lèi)信息需求,更可以滿(mǎn)足社交和情感的需求,以打造更加和諧的人機(jī)共融社會(huì)。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41586

    瀏覽量

    302876
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50420

    瀏覽量

    267356
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3847

    瀏覽量

    52302
  • ChatGPT
    +關(guān)注

    關(guān)注

    31

    文章

    1605

    瀏覽量

    10408
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3825

    瀏覽量

    5285
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    博世與清華大學(xué)簽約,共同探索碳中和領(lǐng)域前沿技術(shù)研究合作

    4月23日,博世集團(tuán)董事會(huì)主席史蒂凡?哈通博士 (Stefan Hartung) 一行訪(fǎng)問(wèn)清華大學(xué)。校長(zhǎng)李路明在工字廳東廳會(huì)見(jiàn)來(lái)賓,并共同出席清華大學(xué)與博世合作簽約儀式,雙方共同探索碳
    的頭像 發(fā)表于 04-27 09:59 ?178次閱讀
    博世與<b class='flag-5'>清華大學(xué)</b>簽約,<b class='flag-5'>共同</b>探索碳中和領(lǐng)域前沿技術(shù)研究合作

    高德地圖攜手清華大學(xué)共建低空異構(gòu)載具智能控制北京市重點(diǎn)實(shí)驗(yàn)室

    事和我們未來(lái)的出行、物流、城市管理,甚至“抬頭看見(jiàn)的天空”都有關(guān)系。 這個(gè)實(shí)驗(yàn)室清華大學(xué)牽頭,聯(lián)合高德、中國(guó)航天電子技術(shù)研究院等單位共同建設(shè),重點(diǎn)研究低空飛行器
    的頭像 發(fā)表于 04-24 15:43 ?324次閱讀

    清華大學(xué)體育鍛煉數(shù)字化案例:基于藍(lán)牙物聯(lián)網(wǎng)的學(xué)生運(yùn)動(dòng)健康管理

    發(fā)展,如何科學(xué)、有效地落實(shí)體育鍛煉要求,真實(shí)評(píng)估學(xué)生體質(zhì)并保障運(yùn)動(dòng)安全,成為了新的挑戰(zhàn)。清華大學(xué)體育部主任劉波曾坦言:清華體育傳統(tǒng)很好,但學(xué)生的體質(zhì)健康水平確實(shí)是在下降,有必要采取略強(qiáng)
    發(fā)表于 04-15 17:31

    清華大學(xué)電子工程系到訪(fǎng)天數(shù)智芯參觀(guān)交流

    近日,清華大學(xué)電子工程系、清華校友總會(huì)電子工程系分會(huì)、清華大學(xué)上海校友會(huì)電子信息專(zhuān)委會(huì)組織師生、校友代表到訪(fǎng)天數(shù)智芯,開(kāi)展深度校企交流活動(dòng),共話(huà)國(guó)產(chǎn)算力創(chuàng)新與產(chǎn)學(xué)研協(xié)同發(fā)展。
    的頭像 發(fā)表于 04-07 17:40 ?1640次閱讀

    理想汽車(chē)智能超充動(dòng)力電池北京市重點(diǎn)實(shí)驗(yàn)室正式揭牌

    3月30日,理想汽車(chē)“智能超充動(dòng)力電池北京市重點(diǎn)實(shí)驗(yàn)室”(以下簡(jiǎn)稱(chēng)“理想智能超充重點(diǎn)實(shí)驗(yàn)室”)揭牌儀式暨學(xué)術(shù)研討會(huì)正式在理想汽車(chē)北京研發(fā)總部舉行。此次學(xué)術(shù)研討會(huì)匯聚了來(lái)自中國(guó)科學(xué)院、
    的頭像 發(fā)表于 03-31 13:56 ?469次閱讀

    沐曦股份聯(lián)合清華大學(xué)發(fā)布磁性材料AI原子基座模型

    2月27日,沐曦股份聯(lián)合清華大學(xué)等多家研究機(jī)構(gòu)聯(lián)合發(fā)布了磁性材料AI原子基座模型。該模型是首個(gè)覆蓋寬溫壓域的磁性材料AI原子
    的頭像 發(fā)表于 03-03 15:25 ?622次閱讀
    沐曦股份<b class='flag-5'>聯(lián)合</b><b class='flag-5'>清華大學(xué)</b><b class='flag-5'>發(fā)布</b>磁性材料AI原子基座<b class='flag-5'>模型</b>

    香港科技大學(xué)與英特爾共建聯(lián)合實(shí)驗(yàn)室,聚焦高能效智能計(jì)算

    香港科技大學(xué)與英特爾宣布成立“香港科技大學(xué)-英特爾聯(lián)合實(shí)驗(yàn)室”(以下簡(jiǎn)稱(chēng)“聯(lián)合實(shí)驗(yàn)室”)。該
    的頭像 發(fā)表于 02-05 16:30 ?826次閱讀
    香港科技<b class='flag-5'>大學(xué)</b>與英特爾共建<b class='flag-5'>聯(lián)合</b><b class='flag-5'>實(shí)驗(yàn)室</b>,聚焦高能效<b class='flag-5'>智能</b>計(jì)算

    壁仞科技與階躍星辰及上海儀電智算服務(wù)成立人工智能聯(lián)合實(shí)驗(yàn)室

    2月2日,壁仞科技(06082.HK)與上海儀電旗下智算服務(wù)、階躍星辰攜手打造的人工智能聯(lián)合實(shí)驗(yàn)室正式揭牌。人工智能聯(lián)合
    的頭像 發(fā)表于 02-04 10:14 ?490次閱讀

    中興通訊聯(lián)合發(fā)布供應(yīng)鏈智能技術(shù)應(yīng)用白皮書(shū)

    近日,中興通訊聯(lián)合清華大學(xué)、德勤共同編寫(xiě)的《供應(yīng)鏈智能技術(shù)應(yīng)用白皮書(shū)》(以下簡(jiǎn)稱(chēng)《白皮書(shū)》)正式發(fā)布。
    的頭像 發(fā)表于 12-09 11:31 ?916次閱讀

    華為聯(lián)合崖州灣國(guó)家實(shí)驗(yàn)室發(fā)布農(nóng)業(yè)育種智能基座

    11月11日,在2025年植物表型組學(xué)國(guó)際研討會(huì)上,崖州灣國(guó)家實(shí)驗(yàn)室與華為共同發(fā)布面向農(nóng)業(yè)育種領(lǐng)域的智能基座——“繁|未來(lái)農(nóng)業(yè)智能樞紐”。通過(guò)構(gòu)建多地多中心的統(tǒng)一數(shù)據(jù)平臺(tái),實(shí)現(xiàn)多模態(tài)種
    的頭像 發(fā)表于 11-14 16:43 ?1552次閱讀

    強(qiáng)強(qiáng)聯(lián)合:之江實(shí)驗(yàn)室與沐曦股份共建智算集群聯(lián)合實(shí)驗(yàn)室

    2025年10月22日, 之江實(shí)驗(yàn)室與沐曦集成電路(上海)股份有限公司(以下簡(jiǎn)稱(chēng)“沐曦股份”)正式簽署合作協(xié)議,共同組建“智算集群聯(lián)合實(shí)驗(yàn)室”,攜手推進(jìn)人工
    的頭像 發(fā)表于 10-23 10:50 ?1617次閱讀

    光峰科技與深圳技術(shù)大學(xué)簽署聯(lián)合實(shí)驗(yàn)室合作協(xié)議

    10月16日,光峰科技公告官宣,與深圳技術(shù)大學(xué)擬簽署《光峰科技與深圳技術(shù)大學(xué)聯(lián)合實(shí)驗(yàn)室合作協(xié)議》,圍繞半導(dǎo)體激光前沿領(lǐng)域進(jìn)行合作研發(fā),共同建立聯(lián)合
    的頭像 發(fā)表于 10-17 17:32 ?1622次閱讀

    思大模型智能FAE,看得懂技術(shù),答得準(zhǔn)問(wèn)題

    思大模型智能FAE,看得懂技術(shù),答得準(zhǔn)問(wèn)題 在智能硬件開(kāi)發(fā)的嵌入式技術(shù)支持中,響應(yīng)遲緩、人員培訓(xùn)成本高企、服務(wù)時(shí)間覆蓋不足等痛點(diǎn),常常制約FAE團(tuán)隊(duì)效率
    發(fā)表于 09-30 11:29

    比亞迪與香港科技大學(xué)成立具身智能實(shí)驗(yàn)室

    近日,比亞迪汽車(chē)工業(yè)有限公司與香港科技大學(xué)(以下簡(jiǎn)稱(chēng)“港科大”)簽署合作框架協(xié)議,共同成立“香港科技大學(xué)-比亞迪具身智能
    的頭像 發(fā)表于 07-10 18:08 ?1381次閱讀

    南京航空航天大學(xué)與慧爾視共建低空安全感知聯(lián)合實(shí)驗(yàn)室

    近日,南京航空航天大學(xué)(以下簡(jiǎn)稱(chēng)“南航”)與南京慧爾視智能科技有限公司(以下簡(jiǎn)稱(chēng)“慧爾視”)正式宣布共建“低空安全感知聯(lián)合實(shí)驗(yàn)室”。作為落實(shí)
    的頭像 發(fā)表于 06-25 17:08 ?1489次閱讀
    二手房| 图木舒克市| 钦州市| 塔河县| 西藏| 澄迈县| 阿拉善右旗| 南汇区| 高台县| 全南县| 观塘区| 长沙市| 西华县| 昭觉县| 建瓯市| 松阳县| 梁平县| 湘阴县| 克山县| 延长县| 句容市| 和政县| 盐山县| 灵石县| 天峨县| 四子王旗| 乐安县| 台江县| 台山市| 赤峰市| 桑植县| 三明市| 清水县| 裕民县| 叙永县| 当雄县| 将乐县| 井研县| 延庆县| 武定县| 朔州市|