国产又粗又爽又猛又黄的视频_日韩精品一区二区三区69_草久在线观看高清_免费人成视频在线看片

      1. <menu id="mzh5k"><thead id="mzh5k"></thead></menu>
        <span id="mzh5k"></span>

        新疆信息港歡迎您!

        新疆信息港
        新疆信息港 > 資訊 >金融風(fēng)控場景的機(jī)器學(xué)習(xí)模型可解釋性淺析

        金融風(fēng)控場景的機(jī)器學(xué)習(xí)模型可解釋性淺析

        2022-05-18 09:25:45
        來源:互聯(lián)網(wǎng)
        閱讀:-

        金融風(fēng)控場景的機(jī)器學(xué)習(xí)模型可解釋性淺析...

              機(jī)器學(xué)習(xí)作為人工智能技術(shù)的重要分支,已經(jīng)廣泛應(yīng)用在包含金融風(fēng)控等多個(gè)場景中,成為大數(shù)據(jù)與人工智能時(shí)代的“基礎(chǔ)能力”。而隨著機(jī)器學(xué)習(xí)發(fā)展和應(yīng)用的深入,模型“可解釋性”的問題也越來越被公眾關(guān)注。2021年出臺(tái)的《個(gè)人信息保護(hù)法》,要求自動(dòng)化決策應(yīng)當(dāng)保證決策的透明度和結(jié)果公平、公正,不得在交易條件上實(shí)行不合理的差別待遇;通過自動(dòng)化決策方式作出對(duì)個(gè)人權(quán)益有重大影響的決定,個(gè)人有權(quán)要求個(gè)人信息處理者予以說明。本文基于對(duì)常見機(jī)器學(xué)習(xí)模型的介紹,以國內(nèi)外真實(shí)案例為基礎(chǔ),嘗試探討金融風(fēng)控場景模型可解釋性問題的成因及對(duì)策,并給出了一些解釋風(fēng)險(xiǎn)認(rèn)定的準(zhǔn)則。


              一、機(jī)器學(xué)習(xí)模型的信任危機(jī)

              我們是如何區(qū)分哈士奇和狼的?我們?nèi)祟惪梢酝ㄟ^經(jīng)驗(yàn)來區(qū)分溫順的家犬和危險(xiǎn)的野生動(dòng)物。但是機(jī)器學(xué)習(xí)算法根據(jù)模型分類器的數(shù)據(jù)和權(quán)重,這個(gè)結(jié)果的判斷是如何做出的則是個(gè)謎。

              2016 年,加州大學(xué)歐文分校的研究表明,區(qū)分哈士奇犬和狼的高度準(zhǔn)確的算法并不是通過區(qū)別動(dòng)物本身的樣貌屬性,而是根據(jù)輔助數(shù)據(jù)做出決策的——特別是雪的存在。這一測試結(jié)果引出了一個(gè)重要的問題:如果我們無法解釋機(jī)器學(xué)習(xí)算法的黑盒工作原理,我們怎么相信它給出的結(jié)果?

              機(jī)器學(xué)習(xí)的種類繁多,但是一般我們會(huì)根據(jù)訓(xùn)練期間接受的監(jiān)督數(shù)量和監(jiān)督類型進(jìn)行分類,將機(jī)器學(xué)習(xí)分為以下兩種類型:有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)。

              在有監(jiān)督學(xué)習(xí)中,算法需要解決方案的訓(xùn)練數(shù)據(jù)來做標(biāo)簽或標(biāo)記,以此指導(dǎo)算法作出符合訓(xùn)練規(guī)律的決策。簡單的有監(jiān)督線性模型中,我們可以通過檢查分類器的結(jié)構(gòu)獲得線索,從而了解運(yùn)算邏輯。但隨著模型復(fù)雜性的增加,機(jī)器學(xué)習(xí)模型變成了“黑盒”,算法越復(fù)雜,結(jié)果就越難解釋。同時(shí),我們也認(rèn)為數(shù)據(jù)標(biāo)簽越多,結(jié)果也越準(zhǔn)確。準(zhǔn)確性和可解釋性在有監(jiān)督算法的實(shí)際落地中產(chǎn)生了矛盾。


              二、為什么金融風(fēng)控需要可解釋性?

              當(dāng)機(jī)器學(xué)習(xí)的預(yù)測結(jié)果對(duì)用戶的隱私和安全產(chǎn)生影響,而機(jī)器學(xué)習(xí)的建模者或用戶會(huì)因此面臨法律或財(cái)務(wù)風(fēng)險(xiǎn)時(shí),一個(gè)具有可解釋性和說服力的風(fēng)控結(jié)論就變得至關(guān)重要。高盛的Apple Card就曾發(fā)生過一起機(jī)器學(xué)習(xí)模型訓(xùn)練結(jié)論存在爭議的負(fù)面事件,一位知名企業(yè)家指責(zé)高盛存在歧視,因?yàn)樗钠拮颖M管信用評(píng)分比他高,但仍被拒絕增加信用額度,高盛的信用卡業(yè)務(wù)因此受到了審查。這起投訴事件引發(fā)了紐約州金融服務(wù)部(DFS)進(jìn)行了一項(xiàng)關(guān)于算法的調(diào)查,調(diào)查信用額度的算法是否存在性別歧視等違法行為。由此可見,可解釋性是保護(hù)消費(fèi)者權(quán)益的必需品,也是保證金融機(jī)構(gòu)健康、安全、合規(guī)運(yùn)行的重要指標(biāo)。


              三、金融風(fēng)控的痛點(diǎn)

              雖然我們已經(jīng)了解到可解釋性在金融風(fēng)控中的重要性,但是想要將可解釋性的算法落地在金融風(fēng)控場景并不是一件易事。金融行業(yè)的大數(shù)據(jù)資源豐富,數(shù)據(jù)應(yīng)用由來已久,為滿足豐富的用戶需求和不斷提升的用戶體驗(yàn),對(duì)金融業(yè)務(wù)創(chuàng)新模式的要求和對(duì)大數(shù)據(jù)處理能力的要求也水漲船高。

              ?數(shù)字化的欺詐風(fēng)險(xiǎn)升級(jí)

              傳統(tǒng)銀行在數(shù)字化過程中,欺詐攻擊也隨著銀行數(shù)字化業(yè)務(wù)的升級(jí)一并進(jìn)化,個(gè)人欺詐攻擊向有組織的團(tuán)伙型欺詐攻擊轉(zhuǎn)變,規(guī)模更大,技術(shù)更加專業(yè),所造成的欺詐損失也更多。

              ?風(fēng)控體系需要智能化與專家決策的有機(jī)結(jié)合

              隨著數(shù)據(jù)的不斷積累,運(yùn)營客戶的案例和數(shù)據(jù)的維度都更加豐富,在這種背景下傳統(tǒng)的專家決策模式在效率和精度上都存在問題,所以需要以智能方案為核心、依據(jù)量化結(jié)論形成決策、并結(jié)合專家運(yùn)營輸出可解釋的風(fēng)控意見。

              ?風(fēng)控決策時(shí)間要求極短

              原有的金融風(fēng)控體系響應(yīng)時(shí)間長,難以做到實(shí)時(shí)檢測。當(dāng)前更多的業(yè)務(wù)正在往線上轉(zhuǎn)移,留給技術(shù)后臺(tái)的處理時(shí)間可能只有一秒鐘,這就對(duì)大數(shù)據(jù)處理的技術(shù)架構(gòu)提出了極高的要求。而產(chǎn)生客訴后,留給風(fēng)控業(yè)務(wù)的審核時(shí)間也是少之又少。


              四、無監(jiān)督模型在風(fēng)控領(lǐng)域的工作原理

              一個(gè)常見的誤區(qū)是:無監(jiān)督機(jī)器學(xué)習(xí)(UML)由于其不需要標(biāo)記數(shù)據(jù)來發(fā)現(xiàn)新模式,更像是一種黑盒模型。

              但是,事實(shí)相反。

              無監(jiān)督學(xué)習(xí)模型可以風(fēng)控領(lǐng)域識(shí)別欺詐者時(shí),提供良好的解釋性。無監(jiān)督學(xué)習(xí)與有監(jiān)督學(xué)習(xí)的核心區(qū)別是訓(xùn)練數(shù)據(jù)只有自變量沒有因變量(就是沒有Y值)。常見的無監(jiān)督學(xué)習(xí)有聚類算法、可視化和降維、關(guān)聯(lián)規(guī)則學(xué)習(xí)。

              聚類或基于關(guān)聯(lián)分析的無監(jiān)督學(xué)習(xí)在風(fēng)控場景可以得到極佳的應(yīng)用,因?yàn)樗軌蛱峁┏鎏厥饨灰谆蚱墼p活動(dòng)的具體原因代碼,主要是通過聚類出不同維度的特征,如活動(dòng)、行為、時(shí)間和其他因素,結(jié)果常常以可疑的分組形式出現(xiàn)。這些特征可以在模型的圖表中直觀地聚集在一起,這些聚集行為展示了欺詐團(tuán)伙的可疑活動(dòng)、聯(lián)系方式和作案規(guī)律。這樣我們既可以獲得高準(zhǔn)確性的欺詐團(tuán)伙捕捉,又可以解釋機(jī)器學(xué)習(xí)的決策理由。

              圖中展現(xiàn)了無監(jiān)督機(jī)器學(xué)習(xí)的特點(diǎn),它將可疑用戶和事件聚集,因?yàn)閺娘L(fēng)控經(jīng)驗(yàn)上講:“好人分散,壞人扎堆”。為了集中獲得高的欺詐收益,欺詐者往往會(huì)躲避規(guī)則的同時(shí)又在規(guī)則的極限邊緣試探,從而形成了一些正常用戶不會(huì)出現(xiàn)的行為數(shù)據(jù),這在不同聚類子空間中會(huì)被定義為可疑團(tuán)伙。


              五、無監(jiān)督機(jī)器學(xué)習(xí)的風(fēng)險(xiǎn)事件認(rèn)定

              無監(jiān)督學(xué)習(xí)依靠其不依賴標(biāo)簽、捕捉特殊群組、具有可解釋性的這三大特點(diǎn),它為何能夠在金融風(fēng)控領(lǐng)域成功落地并解決金融風(fēng)控中的核心痛點(diǎn)呢?

              ?第一,因?yàn)槠墼p者為逃避風(fēng)控規(guī)則,其手法變化快,僅依賴歷史數(shù)據(jù)和標(biāo)簽往往難以捕捉新型未知欺詐。

              ?第二,現(xiàn)代欺詐逐漸形成了鏈條化、組織化的專業(yè)形態(tài),巨額欺詐損失的背后是團(tuán)伙型欺詐者的高效工作。

              ?第三,金融機(jī)構(gòu)追求客戶體驗(yàn),而風(fēng)控業(yè)務(wù)人員又不希望規(guī)則造成大量客訴,具有可解釋性的模型至關(guān)重要。

              基于這三點(diǎn),無監(jiān)督學(xué)習(xí)的用武之地可見是風(fēng)控領(lǐng)域。

              不過,無監(jiān)督學(xué)習(xí)在實(shí)際落地中的可用性和效果一直存疑,人們常問:靠聚類如何區(qū)分是欺詐團(tuán)伙還是行為良好的團(tuán)隊(duì)?其實(shí),僅靠一些開源的無監(jiān)督算法,比如K-means或DBSCAN,聚類邏輯主要依靠運(yùn)算距離等方式,這樣的預(yù)測結(jié)果的確是不可用的。想要穩(wěn)穩(wěn)落地,一個(gè)可用的算法必須結(jié)合風(fēng)控經(jīng)驗(yàn)來打通邏輯,也就是在聚類子空間中,“聚”出針對(duì)風(fēng)控場景的可疑群組,這既需要經(jīng)驗(yàn)支持,也有一定技術(shù)門檻。

              那么,一個(gè)可用的無監(jiān)督學(xué)習(xí)算法是如何判定風(fēng)險(xiǎn)事件和欺詐用戶的?維擇科技在服務(wù)全球金融機(jī)構(gòu)的案例中,總結(jié)了許多可復(fù)用的聚類子空間和規(guī)則。


              案例一:

              維擇科技依靠無監(jiān)督學(xué)習(xí)算法,發(fā)現(xiàn)了疑似黑中介代辦的欺詐申請(qǐng)團(tuán)伙,其中涉及18個(gè)申請(qǐng)人分別通過虛假信息包裝提交貸款申請(qǐng)。欺詐者運(yùn)用了一定的偽裝手法:該群組中申請(qǐng)人的個(gè)人信息(名稱、證件號(hào)、手機(jī)號(hào)、家庭地址等)均不相同,大多數(shù)申請(qǐng)人的單位名稱不同。申請(qǐng)時(shí)間相對(duì)分散在周內(nèi)的不同時(shí)間。在一般規(guī)則審查中,很難發(fā)現(xiàn)這些看似不相關(guān)的人是同一個(gè)犯罪團(tuán)伙。

              無監(jiān)督算法從不同聚類子空間中摘出了這些申請(qǐng)人的可疑共同點(diǎn):

              ?18個(gè)申請(qǐng)賬戶中12個(gè)賬戶的家庭地址與征信信息中的家庭地址不一致,且11個(gè)賬戶的城市信息不一致;

              ?18個(gè)申請(qǐng)均通過手機(jī)瀏覽器完成,其中使用的蘋果手機(jī)IOS版本較低;

              ?每單申請(qǐng)過程中均出現(xiàn)登陸的GPS不唯一,且存在跨城市的現(xiàn)象;

              ?不同申請(qǐng)之間都有登錄同一城市的GPS信息,且登陸的均為蘋果手機(jī)。


              案例二:

              維擇科技在為某股份制銀行卡中心進(jìn)行信用卡反詐場景的檢測服務(wù)時(shí),發(fā)現(xiàn)了疑似養(yǎng)卡提額的團(tuán)伙,他們緊扣住銀行信用評(píng)估系統(tǒng)和風(fēng)控系統(tǒng)的規(guī)則,投入成本并長期保持信用卡活躍,制造出真人刷卡消費(fèi)的假象。

              無監(jiān)督算法則能夠摘出這些持卡人的可疑共同點(diǎn):

              ?特定借記卡給多個(gè)信用卡賬戶還款,還款金額集中;

              ?每個(gè)信用卡賬戶都在過固定多個(gè)商戶交易,且為同一家收單機(jī)構(gòu),收單機(jī)構(gòu)所在地相同;

              ?每個(gè)卡的消費(fèi)總額是授信額度的數(shù)倍;

              ?每天1分鐘同一個(gè)商戶消費(fèi)多筆,且金額類似;

              ?每天還款1筆,且金額集中。

              這兩個(gè)案例中的特征合并在一起看,是高度可疑的,但在逐個(gè)篩查中極難被發(fā)現(xiàn)。

              總而言之,并非所有機(jī)器學(xué)習(xí)模型都是黑盒,對(duì)于大多數(shù)應(yīng)用場景來說,一定程度的可解釋性足以滿足法律和監(jiān)管的要求。對(duì)于金融場景的欺詐檢測,從業(yè)者則更推崇準(zhǔn)確性與可解釋性并存的算法。發(fā)現(xiàn)不同機(jī)器學(xué)習(xí)的用武之地,向所有人展示“這是狼,不是哈士奇”的理由。

        作者:維擇科技李夢曉

        推薦閱讀:旗龍

        免責(zé)聲明:本文僅代表企業(yè)觀點(diǎn),與新疆信息港無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。
        熱門圖片
        熱門搜索