日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

看圖“猜車禍”,用谷歌街景數(shù)據(jù)建立車禍預測新模型

電子工程師 ? 來源:YXQ ? 2019-05-14 09:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

預測是機器學習算法最重要的一個研究方向。眾多保險公司利用機器學習算法為他們的客戶建立預測模型。其中,車禍預測模型是眾多模型里面最難建立的。

車禍發(fā)生的影響因素多種多樣,變化多端,著實讓人摸不著頭腦。

與其他商品不同的是,車禍保單的最終成本在初始銷售時是未知的。因此,建立一個合理的定價機制是非常具有挑戰(zhàn)的。有些保險公司嘗試使用統(tǒng)計方法來解決這一問題:預測每個客戶的未來風險。

例如,非常經(jīng)典的汽車保險。大部分的保險公司確定的保險風險因素有司機的年齡、他的汽車配置相關以及汽車發(fā)生事故的歷史情況。這也是為什么保險公司會在成交汽車保險之前需要客戶提供的詳細信息的原因。

下載地址:

https://arxiv.org/abs/1904.05270

波蘭華沙大學經(jīng)濟科學系的Kinga Kita-Wojciechowska和斯坦福大學生物工程系的?ukasz Kidziński利用谷歌Google街景收集相對應的房屋圖像,通過標釋房屋的特征:例如年齡、類型以及其它條件。然后與目前最先進的保險風險模型相比,最后發(fā)現(xiàn)用谷歌街景數(shù)據(jù)建立的模型,能夠有效地改進了汽車事故風險預測。

作者通過對谷歌街景數(shù)據(jù)的研究,發(fā)現(xiàn)下列結(jié)論?

房子的特征與居民的發(fā)生車禍風險相關,

與谷歌街景的其他研究用途相比,此模型數(shù)據(jù)特征來自于地址,并不是按照郵政編碼或地區(qū)進行匯總,可能存在更為精細的劃分;

從地址中提取的數(shù)據(jù)(房屋的圖像)可用于保險和其他行業(yè);

現(xiàn)代數(shù)據(jù)收集和科技技術允許對個人數(shù)據(jù)進行前所未有的利用,可能會超過立法的發(fā)展速度,并增加個人隱私威脅。

建模數(shù)據(jù)收集方法與特點

保險公司之前進行的風險建模和定價,通常只使用郵政編碼這一特征。然而匯總到郵政編碼的索賠數(shù)據(jù)仍然太不穩(wěn)定,所以還需要進一步地調(diào)整。

另一方面,對于一些“外人”來說,保險公司客戶的信息數(shù)據(jù)很難獲得。本文使用的谷歌街景數(shù)據(jù)可以從來自Google街景的公開圖像信息中提取出來。

圖1.位于同一郵政編碼中不同房屋的示例,根據(jù)當前保險公司的模型,這些房屋的居民具有相同的預期索賠頻率。

此數(shù)據(jù)集包含20,000條記錄的汽車保險數(shù)據(jù)集,數(shù)據(jù)來源于2012年1月至2015年12月期間收集到在波蘭的保險投資組合的隨機樣本。

其中每項記錄均涵蓋汽車發(fā)動機第三方責任(MTPL)保險單的特點,包括投保人的地址、風險敞口(定義為一小部分有效年份在2013-2015年期間的保單)以及2013-2015年間發(fā)生的財產(chǎn)損壞索賠的統(tǒng)計數(shù)量。保險公司還提供了這些保單的財產(chǎn)損失索賠的預期頻率,是根據(jù)他們目前最好的風險模型進行估計的,是根據(jù)客戶的郵政編碼進行分區(qū)的。

圖2.使用注釋功能將為數(shù)據(jù)庫中提供的地址,匹配收集谷歌衛(wèi)星視圖和谷歌街景圖像。

對圖像中可見的房屋中以下特征作了說明:居民的年齡、狀況、財富以及鄰近地區(qū)其他建筑物的類型。根據(jù)Fleiss’kappa(屬性型測量分析)統(tǒng)計數(shù)據(jù)結(jié)果表明,它們之間大多數(shù)是一致穩(wěn)健的。

繼續(xù)注釋剩余的19,371個地址(還從本研究的范圍中刪除了129個地址,因為它們要么是另外區(qū)域的,要么是Google地圖找不到的),剩余的都將得到了一組單獨的、隨機選擇的地址。

研究者比較了收集到的注釋的分布情況,并在最后對四個注釋器進行了小的修正,以匹配平均值和標準差。

表1。在進行了必要的簡化后,風險模型中對7個新創(chuàng)建的變量進行了統(tǒng)計

建模過程

接下來,估計一個廣義線性模型(GLM)來研究新創(chuàng)建的變量對于風險預測的重要性。

假設索賠的概率模型如下:

頻率為f,定義為索賠次數(shù)除以風險敞口:

其中,MTPL保險中的一些財產(chǎn)損失索賠是服從泊松分布的,X是自變量的向量,也是系數(shù)的向量。

為了對方法所帶來的增加值進行評價,引入了三個模型:

模型A(空模型),其中向量為

模型B(一流保險商模型):其中向量為

模型C(研究者使用的模型):其中向量為

保險人為數(shù)據(jù)集中的每條記錄提供了模型B的實現(xiàn)。

該模型是在一個更大的未對外披露數(shù)據(jù)集上進行估計的,包含j個預測變量(駕駛員特征、車輛特征、索賠歷史、地理區(qū)域等)。

利用GLMs的特性,可以將模型C分解為兩個部分:一個對應于模型B,另一個則包含新變量。

因此,模型C為:

這些系數(shù)的值是否為非零,將表明研究者構(gòu)造的變量為模型提供了額外的預測能力。在本研究中新創(chuàng)建的七個變量中,有五個對于預測財產(chǎn)損壞MTPL索賠頻率模型具有重要意義,而在最好的保險公司模型中使用的許多其它評級變量都是重要的(表1)。

通過觀察a、B、C模型的基尼系數(shù)的顯著變異性,特別是對于模型A(只包含截距且沒有選擇其他變量的空模型)在20次重采樣試驗中,其變化范圍為20 ~ 38%。將其解釋為證據(jù),即所提供的數(shù)據(jù)集非常小(20,000條記錄),用于構(gòu)建MTPL保險中的罕見事件,如財產(chǎn)損失索賠(平均頻率為5%)。

圖3.在20個自舉試驗中獲得的20%的檢驗樣本上的基尼系數(shù)(A),從零模型(A)到最好的保險公司的模型(B)和研究者新建立的變量模型(C)。

盡管數(shù)據(jù)的波動性很大,但將五個簡單變量加入到保險公司的模型中,在20次重新采樣試驗中的18次中嘗試,提高了它的性能,并提高了基尼系數(shù)的平均水平。提高系數(shù)接近2個百分點(從38.2%到40.1%)。

通常保險公司的模型會運用更大的數(shù)據(jù)集,并包含了廣泛的變量選擇(例如駕駛員特征、汽車特征、索賠歷史和基于客戶郵政編碼的地理區(qū)域),將基尼系數(shù)與空模型從0~30%提高到0~38%,提高了8個百分點(見圖3)。

創(chuàng)新之處

通常保險公司的預測模型都是以常規(guī)的特征進行預測的,比如駕駛車輛習慣,索賠歷史和客戶財富級別等特征。

但是文中的模型使用了全新的谷歌街景地圖的特征,比如街景地圖中房屋所在周圍環(huán)境,所在區(qū)域的密度,街景的質(zhì)量和房屋類型年限等特征,評測結(jié)果也是比較令人欣慰,三個模型的基尼系數(shù)變動范圍在20%—38%之間,我們能從圖3中看見,經(jīng)過20次的重采樣實驗得到的結(jié)果:具有街景新特征的模型比使用原有的優(yōu)秀傳統(tǒng)模型還要高出接近2個百分點。

當然由于數(shù)據(jù)樣本量比較少,大概只有2萬條左右,所以這也在一定程度上影響了基尼系數(shù)的提升。但是這在預測模型的研究方向中,給了我們一個新的思路,原來街景地圖的特征會比傳統(tǒng)的特征更加有效。當然未來肯定還會有更加有效的特征出現(xiàn),來幫助我們提升預測準確度。

譯者注:

基尼系數(shù)通常判定超過60%就是一個好模型,但是文章中的數(shù)據(jù)量有點少,所以這個系數(shù)可能沒有60%,但是肯定不能說這個思路錯的,希望大家可以嘗試自己更換數(shù)據(jù)集來做復現(xiàn)。

總結(jié)

從一張房子的圖像中可見的特征預測發(fā)生車禍的風險,而且獨立于經(jīng)常使用的變量,如年齡或郵政編碼。

這一發(fā)現(xiàn)邁出了一大步。它不僅提供了更為精確的風險預測模型,而且還說明了社會科學的一種新方法。

在這種方法中,真實世界中的細粒度數(shù)據(jù)可以經(jīng)過大規(guī)模收集后進行分析。從保險公司的實際情況來看,給出的實驗結(jié)果是顯著的。研究者使用的模型中的5個變量包含了來自不完全注釋的一些偏差,與保險公司在其最佳風險模型中已經(jīng)使用的眾多變量帶來的8個百分點的改進相比,基尼系數(shù)提高了近2個百分點。

保險行業(yè)可能很快就會被銀行效仿,因為保險風險模型與信用風險之間存在著已被證明的相關性。從谷歌街景(GoogleStreetView)中提取有價值信息的方法本身,不僅為金融業(yè)提供了各種機會。

此方法和深層次的學習技術可以使它在一個大規(guī)模自動化的模型中進行。同時,這種做法引起了人們對存儲在公開可用的Google街景、Microsoft Bing Streetside、Mapillary或類似的私有數(shù)據(jù)集中的數(shù)據(jù)隱私的擔憂。

客戶同意公司存放其地址信息并不一定意味著同意儲存有關其房屋外觀的信息。特別是房屋的特征可以是種族、宗教或與一個人的社會地位有關的其他特征的代名詞,法律上也禁止將這些特征用于任何歧視,例如某些區(qū)域的價格歧視。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6264

    瀏覽量

    112137
  • 機器學習
    +關注

    關注

    67

    文章

    8569

    瀏覽量

    137361

原文標題:[機器人頻道|物聯(lián)網(wǎng)]斯坦福最新研究:看圖“猜車禍”,用谷歌街景數(shù)據(jù)建立車禍預測新模型

文章出處:【微信號:robovideo,微信公眾號:機器人頻道】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    《多模態(tài)大模型 前沿算法與實戰(zhàn)應用 第一季》精品課程簡介

    ,提高肺癌診斷準確率。 3. 自動駕駛系統(tǒng):視覺+激光雷達+高精地圖的多模態(tài)感知 多源數(shù)據(jù)對齊 :將激光雷達的3D點云投影到圖像平面,建立像素與點云的對應關系。 特征融合 :PointPillars
    發(fā)表于 05-01 17:46

    谷歌評論卡,碰一碰即可完成谷歌評論 #谷歌評論卡 #NFC標簽 #nfc卡

    谷歌
    深圳市融智興科技有限公司
    發(fā)布于 :2026年01月15日 17:02:00

    每年10億美元,蘋果與谷歌官宣合作,Gemini大模型注入Siri

    該協(xié)議,下一代蘋果基礎模型(Apple Foundation Models)將基于谷歌的Gemini模型和云技術。 ? 蘋果:借Gemini之力,加速AI追趕 ? 長期以來,蘋果在AI領域的發(fā)展相對滯后,其語音助手Siri的功能
    的頭像 發(fā)表于 01-13 14:59 ?5989次閱讀

    數(shù)據(jù)模型:如何預測細節(jié)距鍵合的剪切力?

    預估其剪切力?行業(yè)內(nèi)的研究數(shù)據(jù)為我們揭示了可能性。今天,科準測控小編將帶您了解如何基于實驗數(shù)據(jù)建立并應用預測模型,實現(xiàn)從“測量”到“預估”的
    發(fā)表于 01-08 09:45

    API數(shù)據(jù)分析:淘寶銷售預測模型,決策更科學!

    ? ?在電商領域,精準的銷售預測直接影響庫存管理、營銷策略和資金周轉(zhuǎn)效率。本文將介紹如何基于淘寶API數(shù)據(jù)構(gòu)建銷售預測模型,并通過代碼實現(xiàn)全流程分析。 1.
    的頭像 發(fā)表于 12-31 09:46 ?475次閱讀
    API<b class='flag-5'>數(shù)據(jù)</b>分析:淘寶銷售<b class='flag-5'>預測</b><b class='flag-5'>模型</b>,決策更科學!

    模型賦能物資需求精準預測與采購系統(tǒng)軟件平臺

    ? ? 北京五木恒潤大模型賦能物資需求精準預測與采購平臺系統(tǒng)軟件,深度融合多源數(shù)據(jù)與智能算法,大幅提升需求預測準確性與采購決策科學性,成為企業(yè)優(yōu)化供應鏈管理、降低運營成本的核心工具。以
    的頭像 發(fā)表于 12-17 16:37 ?437次閱讀

    模型賦能物資需求精準預測與采購系統(tǒng):功能特點與平臺架構(gòu)解析

    ? ? 大模型賦能物資需求預測與采購智能化:核心功能與價值解析 ? ?大模型賦能物資需求精準預測與采購系統(tǒng)通過深度整合多源數(shù)據(jù)、構(gòu)建動態(tài)
    的頭像 發(fā)表于 12-16 11:54 ?496次閱讀

    世界模型是讓自動駕駛汽車理解世界還是預測未來?

    ? [首發(fā)于智駕最前沿微信公眾號]世界模型在自動駕駛技術中已有廣泛應用。但當談及它對自動駕駛的作用時,難免會出現(xiàn)分歧。它到底是讓自動駕駛汽車得以理解世界,還是為其提供了預測未來的視角? 世界模型到底
    的頭像 發(fā)表于 12-16 09:27 ?1072次閱讀
    世界<b class='flag-5'>模型</b>是讓自動駕駛汽車理解世界還是<b class='flag-5'>預測</b>未來?

    泰凌微:布局端側(cè)AI,產(chǎn)品支持谷歌LiteRT、TVM開源模型

    。 ? 公司發(fā)布的基于TL721X系列芯片的TL-EdgeAI平臺,支持谷歌LiteRT、TVM等開源模型,是目前世界上功耗最低的智能物聯(lián)網(wǎng)連接協(xié)議平臺。其芯片已在谷歌(Google)的Pixel Bud Pro 2智能耳機方案
    的頭像 發(fā)表于 12-15 08:21 ?1w次閱讀

    labview如何實現(xiàn)數(shù)據(jù)的采集與實時預測

    現(xiàn)有以下問題:labview可以實現(xiàn)數(shù)據(jù)的采集以及調(diào)用python代碼,但如何將這兩項功能集成在一個VI文件里,從而實現(xiàn)數(shù)據(jù)的采集與實時預測。現(xiàn)有條件如下:已完成數(shù)據(jù)的采集系統(tǒng),pyt
    發(fā)表于 12-03 21:13

    谷歌AlphaEarth和維智時空AI大模型的核心差異

    谷歌AlphaEarth和維智時空AI大模型在技術理念上存在諸多共性,但兩者在目標尺度、數(shù)據(jù)來源、技術實現(xiàn)和應用模式上存在顯著差異。
    的頭像 發(fā)表于 10-22 14:50 ?1115次閱讀

    谷歌AlphaEarth和維智時空AI大模型的技術路徑

    谷歌AlphaEarth和維智時空AI大模型在應用場景和技術實現(xiàn)上各有側(cè)重,但兩者在底層技術理念上存在顯著共性。
    的頭像 發(fā)表于 10-22 14:48 ?1108次閱讀

    如何將訓練好的神經(jīng)網(wǎng)絡模型部署到蜂鳥e203開發(fā)板上

    。如果模型輸出的數(shù)據(jù)類型不同,您需要相應地更改輸出數(shù)據(jù)的指針類型和處理方式。 這些步驟將使用TFLite模型進行圖像預測。確保根據(jù)您的具體應
    發(fā)表于 10-22 08:04

    基于全局預測歷史的gshare分支預測器的實現(xiàn)細節(jié)

    GShare預測機制簡介 GShare預測機制作為一種常用的分支預測機制,通過基于分支歷史和分支地址來預測分支指令的執(zhí)行路徑。分支歷史是指處理器在執(zhí)行程序時遇到的所有分支指令的執(zhí)行情
    發(fā)表于 10-22 06:50

    模型在半導體行業(yè)的應用可行性分析

    有沒有這樣的半導體專用大模型,能縮短芯片設計時間,提高成功率,還能幫助新工程師更快上手?;蛘哕浻布梢栽谠O計和制造環(huán)節(jié)確實有實際應用。會不會存在AI缺陷檢測。 能否應用在工藝優(yōu)化和預測性維護中
    發(fā)表于 06-24 15:10
    盐城市| 沾化县| 九龙坡区| 炎陵县| 德江县| 广安市| 晴隆县| 常德市| 南安市| 南郑县| 上高县| 枝江市| 乐山市| 松阳县| 靖州| 浑源县| 前郭尔| 阿拉尔市| 乌兰县| 马山县| 鄂托克旗| 龙里县| 巴南区| 望谟县| 中牟县| 且末县| 平顺县| 米易县| 德州市| 建瓯市| 丰原市| 资阳市| 洛浦县| 平乡县| 苍溪县| 万州区| 梅河口市| 布尔津县| 青河县| 响水县| 通州区|