日本在线看视频亚洲-热久久最新网址-黄视频在线观看www免费-在线视频这里只有精品|www.lajishu.com

客服熱線:400-615-8698
林果

大數(shù)據(jù)于金融領(lǐng)域的思維與實(shí)踐

2013年10月18日 TAG: 本站

大數(shù)據(jù)于金融領(lǐng)域的思維與實(shí)踐 

?

來源:21世紀(jì)經(jīng)濟(jì)報道

?

互聯(lián)網(wǎng)金融出現(xiàn)以后,更大的變化是把市場體量做大了,不是只服務(wù)于我們現(xiàn)有的客戶,還可以把碎片化的需求和供給進(jìn)行整合,進(jìn)而細(xì)化滲透到很多中小企業(yè)市場和中小客戶市場。


大數(shù)據(jù)幫助金融企業(yè)提升IQ

互聯(lián)網(wǎng)對于金融,主要是支付、信貸、儲蓄三個方面。我們認(rèn)為,現(xiàn)在大數(shù)據(jù)在互聯(lián)網(wǎng)金融領(lǐng)域主要解決三個問題,第一是解決運(yùn)營交易成本過高的問題。網(wǎng)銀降低了20萬個網(wǎng)點(diǎn)成本,而阿里主要是把信用和抵押進(jìn)行置換。第二是提供流動性,解決資產(chǎn)與負(fù)債流動性不匹配的問題。P2P就是將存款進(jìn)行轉(zhuǎn)讓,比如眾籌。第三是拓展4000萬中小微企業(yè)市場。互聯(lián)網(wǎng)金融出現(xiàn)以后,更大的變化是把市場體量做大了,不是只服務(wù)于我們現(xiàn)有的客戶,還可以把碎片化的需求和供給進(jìn)行整合,進(jìn)而細(xì)化滲透到很多中小企業(yè)市場和中小客戶市場。

而我們也關(guān)注到了市場的另一端,即高端客戶市場,也就是理財?shù)倪\(yùn)營市場。對于理財市場客戶,應(yīng)該是通過線下接觸最好。但海外金融機(jī)構(gòu)也提到,對于每一位高端客戶,與他接觸的次數(shù)以及準(zhǔn)確接觸的能力都是非常有限的。那么,怎樣把精準(zhǔn)的內(nèi)容和手段提供給高端理財客戶?這也是大數(shù)據(jù)解決的問題之一。

大家都在談互聯(lián)網(wǎng)的優(yōu)勢,覺得互聯(lián)網(wǎng)很美妙。但是要研究互聯(lián)網(wǎng),一定要面對互聯(lián)網(wǎng)自身的問題,其中最具挑戰(zhàn)的就是信息過載問題。在互聯(lián)網(wǎng)上,信息以WebPage的形式呈現(xiàn),等待人們?nèi)c(diǎn)擊,那么互聯(lián)網(wǎng)的主體必然是注意力經(jīng)濟(jì)。例如,20131月,財經(jīng)金融類網(wǎng)站總訪問次數(shù)381539萬,訪問時長9122萬小時,即10413年。在此情況下,不可能用傳統(tǒng)的方式獲取所有的信息。如何從這些過載的信息中獲取被稀釋了的數(shù)據(jù)價值呢?這是移動互聯(lián)網(wǎng)面對的最具挑戰(zhàn)的一個問題。

那么,是不是互聯(lián)網(wǎng)就是終極形態(tài)?我們給出了一個經(jīng)濟(jì)范疇的定義,即這樣的模式怎么去掙錢。互聯(lián)網(wǎng)早期最簡單的業(yè)務(wù)形式是2B,傳統(tǒng)經(jīng)濟(jì)模式下,企業(yè)向客戶出售產(chǎn)品或服務(wù),以直接賺取金錢為目的,衡量指標(biāo)就是產(chǎn)量等概念。第二個時代就是2C,互聯(lián)網(wǎng)經(jīng)濟(jì)下,企業(yè)盡可能多地發(fā)展用戶,不以直接從用戶處賺取金錢為目的,希望通過后向收費(fèi)或者發(fā)掘用戶終身價值等方式賺取利潤。這個時代,像谷歌、Facebook等公司主要是經(jīng)營用戶,用戶體量就是衡量標(biāo)準(zhǔn)。

未來我們看到的將是2D的業(yè)務(wù)形態(tài),也就是大數(shù)據(jù)經(jīng)濟(jì)。數(shù)據(jù)將是未來企業(yè)的重要資產(chǎn),企業(yè)通過數(shù)據(jù)創(chuàng)造新的商業(yè)模式,或直接通過數(shù)據(jù)售賣以及利用數(shù)據(jù)提供增值服務(wù)獲得巨大利潤。在這一時代,海量用戶和良好的數(shù)據(jù)資產(chǎn)將成為未來核心競爭力與收入的重要來源。這個數(shù)據(jù)未必是靠人的點(diǎn)擊。比如,你可能與運(yùn)營商沒有任何交易往來,但是手機(jī)的傳感器在持續(xù)記錄你的位置信息,這個信息在不斷地跟基站通訊,你的行為就已經(jīng)被運(yùn)營商捕捉了。所以2D更多的是以數(shù)據(jù)為驅(qū)動力的生意模式。這種生意模式把附加值擴(kuò)展得很大。而互聯(lián)網(wǎng)只能通過廣告來盈利,因?yàn)樗揽康氖亲⒁饬?jīng)濟(jì)。這種模式下,很難掙錢,只有少量通過馬太效應(yīng)才能盈利。現(xiàn)在細(xì)分市場的很多數(shù)據(jù)規(guī)模能驅(qū)動產(chǎn)生新的價值。

以上是大的經(jīng)濟(jì)形態(tài)。具體來講,大數(shù)據(jù)更多的是幫助金融企業(yè)包括傳統(tǒng)銀行獲得金融IQ,即接觸市場和接觸用戶的權(quán)利和能力。在我們看來,傳統(tǒng)銀行的數(shù)據(jù)價值遠(yuǎn)大于互聯(lián)網(wǎng)公司。其實(shí),金融企業(yè)很多線下的數(shù)據(jù)沉睡在數(shù)據(jù)庫里了,大家千萬不要小瞧,這些數(shù)據(jù)的價值遠(yuǎn)遠(yuǎn)大于阿里數(shù)據(jù)的價值。

金融用規(guī)則創(chuàng)造了一個很好的商業(yè)形態(tài),但是這種形態(tài)離市場和用戶越來越遠(yuǎn),幾千萬用戶的數(shù)據(jù)對銀行而言是陌生的圖像。而互聯(lián)網(wǎng)因?yàn)槠渲苯邮敲赓M(fèi)使用,所以必須非常準(zhǔn)確地定位用戶,而一個用戶身后甚至有超過十萬個標(biāo)簽,這些標(biāo)簽的維度非常稀疏。大家可能對精準(zhǔn)推薦比較好奇,比如高跟鞋,分高跟、坡跟、外高跟、內(nèi)高跟等,這種精確的描述是對以前那種定向化的數(shù)據(jù)維度一個極大的突破。而這種突破,使得對于客戶的理解和描述非常清晰。這個手段,就是我們說的大數(shù)據(jù)手段。

綜合來看,識別用戶的行為和潛在需求,了解和感知市場,進(jìn)而形成一個正反饋的干預(yù)市場的能力,這可以看做是金融企業(yè)的IQ

金融企業(yè)如何擁抱大數(shù)據(jù)?

大數(shù)據(jù)可以幫助金融企業(yè)解決信息不對稱,解決營銷、定價、風(fēng)險和欺詐問題。一年來我們做了一些案例,主要體現(xiàn)在三個方面:

第一是市場營銷,包括交叉銷售、二次銷售方面,體現(xiàn)在如何進(jìn)行客戶挽留、客戶價值評估等。例如給保險(放心保)公司做了全量的數(shù)據(jù)處理后,就可以實(shí)現(xiàn)很多財險和壽險的匹配。還包括客服投訴評估和產(chǎn)品投放評估等。某一個產(chǎn)品的上線和下線數(shù)據(jù),不需要幾個月以后從市場上獲得,而是直接從線上的數(shù)據(jù)來獲取。第二是信貸和風(fēng)險,主要是信用分配、風(fēng)險評估、實(shí)施授權(quán)、風(fēng)險干預(yù)和欺詐識別等。第三是預(yù)測與估價,包括周期行為分析、量化分析、流失分析、催收分析等。

實(shí)現(xiàn)路徑很關(guān)鍵的點(diǎn),就是“去IOE”(替代IBM的小型機(jī)、Oracle數(shù)據(jù)庫、EMC的存儲)。完備數(shù)據(jù)是核心,能處理一千倍以上數(shù)據(jù)規(guī)模,而這需要顛覆性的系統(tǒng)架構(gòu)才能解決。我們?yōu)橐患掖蟮墓煞葜沏y行做完備數(shù)據(jù)做了很長時間,這個過程很有意義。它可以幫助用戶看到以前看不到的很多事實(shí),過去需要通過業(yè)務(wù)規(guī)則、銀行家的經(jīng)驗(yàn)形成的業(yè)務(wù)判斷,現(xiàn)在通過機(jī)器學(xué)習(xí)的方式,發(fā)現(xiàn)了很多新規(guī)則。比如異常交易、欺詐等,很多都是通過數(shù)據(jù)本身的特性發(fā)現(xiàn)的。

科技創(chuàng)新本身帶來的深刻變革就發(fā)生在今天。自阿里巴巴2009年高調(diào)宣布“去IOE”戰(zhàn)略以來,今年歡送為支付寶用戶服務(wù)了5年的最后一臺小型機(jī),標(biāo)志著阿里巴巴“去IOE運(yùn)動”的又一階段性成果。現(xiàn)在太多銀行用僵化的表結(jié)構(gòu),用字段的方式去對客戶、市場、業(yè)務(wù)規(guī)則做描述,而新的互聯(lián)網(wǎng)的思路是用一張表就處理完成。我們給運(yùn)營商只用一張單維的表,就能全部覆蓋2.5億用戶。數(shù)據(jù)可以非常稀疏,但是省了很多數(shù)據(jù)處理邏輯的復(fù)雜操作。這些新的結(jié)構(gòu)完全是依賴于云計算新的方式。

另外,金融業(yè)本身也在發(fā)生業(yè)務(wù)革新。銀行屬性從記賬式的賣方更多轉(zhuǎn)向風(fēng)險、欺詐、定價的買方屬性,而這些特點(diǎn)很多都是非線性的,需要大量的計算能力。業(yè)務(wù)驅(qū)動加之科技目標(biāo)驅(qū)動,使得新的基礎(chǔ)設(shè)施部署成為必然。

大數(shù)據(jù)首先要數(shù)據(jù)全量在線。現(xiàn)在太多系統(tǒng)都是孤立的,銀行的對公、對私,還有卡業(yè)務(wù)都是分開的,當(dāng)把所有業(yè)務(wù)糅合在一起時,會發(fā)現(xiàn)很多客觀規(guī)律。

舍恩伯格的《大數(shù)據(jù)時代》在國內(nèi)非常暢銷,書中有一個核心的概念——全量。因?yàn)槿恳暯窍驴吹降膬?nèi)容、方式完全不一樣。有一個保險公司的案例,這家保險公司以前只能做抽樣,對高端人群、對某一個險種人群的調(diào)查,通過在兩千個維度里抽取一些維度,比如收入,進(jìn)行建模,建模之后進(jìn)行試用,再考察結(jié)論。現(xiàn)在有了大規(guī)模的計算能力,就不進(jìn)行干預(yù),完全讓機(jī)器自己去找規(guī)律,讓機(jī)器學(xué)習(xí)出在兩千個維度里到底什么是建模的規(guī)則,這完全是黑箱建模的思路。

黑箱建模讓我們發(fā)現(xiàn)了很多以前我們不知道的內(nèi)容和規(guī)律。比如,實(shí)現(xiàn)機(jī)器學(xué)習(xí)以后,我們能發(fā)現(xiàn)反洗錢有1000多條在線規(guī)則。對于保險用戶,我們也發(fā)現(xiàn)很多有意思的現(xiàn)象,在九千多萬用戶里有百分之零點(diǎn)幾的用戶的年收入4萬多,但是買了7萬多的保險產(chǎn)品。那么相應(yīng)的銷售人員是以怎樣的保險理財理念去推銷產(chǎn)品的?有怎樣的經(jīng)驗(yàn)?這是需要發(fā)掘的。當(dāng)然,為了面向用戶,所有大數(shù)據(jù)的處理要做到容易解讀。在這個過程中,全量數(shù)據(jù)可以幫助發(fā)現(xiàn)業(yè)務(wù)規(guī)則。

在無假設(shè)條件下,通過機(jī)器學(xué)習(xí)能發(fā)現(xiàn)用戶的一些特征。這些工具、方式、方法,幫助金融用戶非常清楚地了解到以前未知的市場和未知的用戶。

現(xiàn)在大數(shù)據(jù)又?jǐn)U展到另外一個范疇。自然語義的內(nèi)容、視覺的內(nèi)容、行為關(guān)系網(wǎng)絡(luò)等復(fù)雜的關(guān)系,這些內(nèi)容在以前的數(shù)據(jù)結(jié)構(gòu)上很難處理,現(xiàn)在有了大規(guī)模的計算平臺,大數(shù)據(jù)可以讓系統(tǒng)用新的組織方式,比如矩陣、向量進(jìn)行處理。比如關(guān)系網(wǎng)絡(luò),快遞人員給許多收件人打電話,這些人沒有互相形成拓?fù)浣Y(jié)構(gòu)。這個數(shù)據(jù)非常稀疏,但是有很大的社會屬性和經(jīng)濟(jì)價值,它會通過評估關(guān)系的鏈條來描述出很多個體的社會屬性,也就是個體的社會資本。現(xiàn)在供應(yīng)鏈金融規(guī)模比較大,但是是靠線下、專業(yè)領(lǐng)域技巧去識別供應(yīng)鏈。其實(shí)銀行根據(jù)轉(zhuǎn)賬記錄建立一個大的社交網(wǎng)絡(luò)就可以傳播這些鏈條,就可以把一些細(xì)碎的、小型供應(yīng)鏈通過計算模式挖掘出來。

以前我們了解一件事情,可能大多是非常準(zhǔn)確、非常精確的,不允許有任何混雜性的操作,要完全匹配。比如,面對流感這樣的突發(fā)性疫情,利用互聯(lián)網(wǎng)信息可以快速確認(rèn)疫情分布。傳統(tǒng)做法是通過搜索引擎技術(shù)對相關(guān)關(guān)鍵詞進(jìn)行主題跟蹤,得到疫情分布。

大數(shù)據(jù)一個著名的故事,就是Googletwitter的數(shù)據(jù)做預(yù)測,也是最早利用大數(shù)據(jù)技術(shù)對美國流感分布情況進(jìn)行預(yù)測,并取得成功。比如不久前我國爆發(fā)的H7N9禽流感,天云大數(shù)據(jù)公司采用語義空間主題投影方式,跟蹤了數(shù)百個相互關(guān)聯(lián)的信息點(diǎn),建立語義網(wǎng)絡(luò),在二度以上傳播空間深度挖掘,從而發(fā)現(xiàn)了更多不為認(rèn)知的事實(shí)。其中用到了上千個變量,有H7N9、流感、豆粕、雞、發(fā)熱、口罩、醫(yī)院等,每一個變量有權(quán)重,每一個變量有依賴關(guān)系,這些依賴關(guān)系和權(quán)重從數(shù)億片的論壇、微博、專業(yè)資訊網(wǎng)站里抽取出來。建立模型以后,可以跟蹤整個主題變化。將主題熱度與豆粕價格做比較,顯示出明顯的負(fù)相關(guān)性。對于期貨公司而言,這些碎片化的公共的信息具有巨大經(jīng)濟(jì)價值。這些以前我們認(rèn)為碎片化的東西、情緒化的東西,很難量化,現(xiàn)在可以被大數(shù)據(jù)的能力所量化了。

對數(shù)據(jù)進(jìn)行分析可以挖掘出大量沉睡的文字性內(nèi)容。比如銀行信用卡記錄,以前我們只能靠用戶的消費(fèi)水平去識別這個用戶屬于高端、中端還是低端。除了數(shù)字以外,是不是還有其他信息呢?比如消費(fèi)記錄,他是經(jīng)常去沃爾瑪還是其他超市購物,經(jīng)常去夜店還是星巴克,怎么識別他是一個白領(lǐng)還是一個新新人類?這些通過分類能非常清晰地獲取。也就是以前我們可以對數(shù)據(jù)進(jìn)行操作,現(xiàn)在對文字也同樣可以進(jìn)行操作。

怎樣刻畫人與人之間的關(guān)系?例如,社會資本來自運(yùn)營商通話記錄的評估,運(yùn)營商可以通過電話的輸入輸出記錄把一個人社會資本客觀地做一個輸出。人力資本來自招聘網(wǎng)站、社交網(wǎng)絡(luò),可以通過他的簡歷進(jìn)行評估。金融資本來自網(wǎng)上交易、生活繳付、房屋車輛不動產(chǎn)。

怎么解決互聯(lián)網(wǎng)上的過載問題?一位股票分析師每天要花四五個小時看大量信息,其過程可以讓機(jī)器自動化實(shí)現(xiàn),通過機(jī)器寫出縮略的方式把過載的東西突出出來。這個還不夠,關(guān)鍵是情緒,把大漲、猛增、下跌這些有極性的內(nèi)容突出顯示。極性在機(jī)器里理解,就是一個維度,一個值,這個值可以跟商品期貨做一個相關(guān)性的匹配。

大數(shù)據(jù)的實(shí)踐

要精確,還是要混雜?

比如一家保險公司,怎樣評估它的產(chǎn)品?品牌是很模糊、很難量化的東西,我們用了十多億條微博數(shù)據(jù)和論壇數(shù)據(jù)來畫一條曲線,也就是在這個周期之內(nèi)品牌的波動,就可以把品牌感知量化,把產(chǎn)品投放也量化。

要群體,還是要個體?

如何來看大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的區(qū)別?銀行做數(shù)據(jù)業(yè)務(wù)做了十多年,那么大數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)的倉庫有哪些差異?實(shí)際上就是群體和個體的差異。互聯(lián)網(wǎng)數(shù)據(jù)完全瞄向個體,數(shù)據(jù)結(jié)構(gòu)也是精準(zhǔn)于個體,而傳統(tǒng)的數(shù)據(jù)面向經(jīng)營指標(biāo)、面向群體。宏觀意義上來看,假如小明去了一百次書店,以前要回答的問題是他第一百零一次買不買書,即業(yè)績和經(jīng)營指標(biāo)的問題;而現(xiàn)在,互聯(lián)網(wǎng)關(guān)心的是什么?最關(guān)心的是他第一百零一次買什么書,需要將什么樣的內(nèi)容推薦給他。這不是一個概率問題,而是一個模糊的程度問題。

要量化這個程度,我們一定要基于個體,而不是基于群體的共性描述。傳統(tǒng)定義上,更多關(guān)注的是一類人群,用同一類規(guī)則制訂套餐給他們;而在互聯(lián)網(wǎng)時代,要把每個人都精準(zhǔn)刻畫出來,進(jìn)行精準(zhǔn)匹配。有電商說他們要做到一百萬用戶要有一百萬個商店,特別是在移動的小屏幕上,三次點(diǎn)擊以后就會損失一個客戶。所以差異化絕對不可能是對群體共性的描述,而完全是對個體差異的刻畫。

要決策,還是要工具?

大數(shù)據(jù)到底是面向決策還是面向工具?很多人認(rèn)為大數(shù)據(jù)是決策性的,是讓人獲得更多洞察力的一個工具。實(shí)際上大數(shù)據(jù)更多的是一個自動化的匹配工具。

一個典型案例,我們?yōu)橐患冶kU公司計算了九千萬用戶在每一個險種上的流失概率,之后他們要求我們匯總成一份報告,將流失百分比的數(shù)據(jù)向領(lǐng)導(dǎo)匯報。當(dāng)結(jié)論上升到領(lǐng)導(dǎo)的時候,這個決策必須是宏觀的,而且周期很長,幾個月以后反饋回來可能就有偏差了。而大數(shù)據(jù)的動作是直接把東西下沉,九千萬個用戶的所有流失概率全部分給五萬個保險代理人,每個人通過專門的程序就可以看到由他負(fù)責(zé)的客戶到底在做什么樣的動作,而這個行動是由基層直接完成的。所以是把這些權(quán)限和能力全部推到一線,而不是上升、匯總到總部做決策。所以大數(shù)據(jù)更多的是一個自動進(jìn)行的過程,而不是分析決策的過程。

(作者系天云大數(shù)據(jù)CEO。本文為作者在上海新金融研究院主辦的“互聯(lián)網(wǎng)金融外灘論壇”上所做的主題演講,由上海新金融研究院整理,經(jīng)作者審核。)

?

本文鏈接:http://www.lajishu.com/product/html/26.html轉(zhuǎn)載請注明!
掃描加入
Copyright © 2015 - 2024 上海林果實(shí)業(yè)股份有限公司    滬ICP備11027956號