股海點心: 大數據在金融領域是如何應用的？(轉載)

近期股市真是淡如水，完全沒有興趣去研究。所以我去了學習大數據知識，有不少得著。

以下內容是我從知乎網站找出來，值得留意留意。

大數據在金融領域是如何應用的？

能否舉幾個例子？

https://www.zhihu.com/question/21094114/answer/25720122

回答１：

應用很廣，定價、授信、風控領域尤其多，隨便說幾個：

車險。其實根據車主的日常行車路線、里程、行車習慣、出險記錄、職業、年齡、性別，可以給出非常不同的定價。比如一個開中級車，每天固定路線往返幾公里通勤的熟練女白領車主，和一個開同樣車型每天在珠三角或者長三角跑生意的中年暴躁小老板車主，假設後者出險概率是前者的3倍，那麼完全可以定3倍於前者的價格（商業部分）。對於保險公司，前者才是優質客戶，後者做了生意也是賠錢貨，不如趕到競爭對手那裡去。

貸款。現在各種小額貸款、消費貸款、供應鏈金融，都是在吃4大行懶得吃的散客市場，之所以他們懶得吃，就是怕麻煩。最麻煩的就是授信環節，對於一個沒有固定資產等擔保物的客戶，能授信多少額度是個問題。淘寶能做小微是因為商家的流水在他們手裡，白領的消費貸敢做是因為有穩定的現金流收入。但除了淘寶可以做到比較準確的模型，其他的業務都非常的粗放，基本每個領域都是根據幾條死規則來做業務。這意味著這個市場還有很大的潛力可以挖掘，比如一個小老闆，其實風險不大，他需要100w周轉，但你沒把握估算他的風險，只敢貸50w出去，就少賺了那50w的利息。

問題是現在整體上受到諸多限制，真正能應用起來的地方不多，限制最大的兩個方面：

數據。阿里是因為有淘寶的交易資料，所以是先天優勢，傳統金融機構根本沒有有效的能夠拿來建模的資料。倒是各個互聯網公司，比如地圖、行車、電商、社交等等，有很多零散的資料。但這些公司不可能直接拿自己的命根子來賣錢，國內又沒有中間層的資料公司來撮合（目前的商業環境估計很難撮合起來），只有一些灰色的公司在倒數據，這些資料往往是電話號碼什麼的，使用方式也簡單粗暴，談不上大資料。

政策，比方說費率的問題，說是xx年要放開管制，費率自由化，但到時候真能放開麼？放開了，肯定起來一批，倒下一批。都是一輪輪各路勢力的利益博弈。

非專業、行外人士，胡說八道，且看且拍磚。

回答２：

首先先瞭解什麼是大資料，當然是大啦，大資料時代不再是隨機的抽樣調查，而是全體資料。

在大資料時代進行抽樣分析就像在汽車時代騎馬一樣，一切都在改變。我們得到的資料再也不是隨機的抽樣，而是所有的資料。“樣本=總體”。

大資料的核心：預測。它是把數學演算法運用到海量的資料上來預測事情發生的可能性。
例如,

名為Farecast的公司，找到了一個行業機票的預定資料庫，系統預測的結果是根據美國商業航空產業中，每一條航線上每一架飛機內的每一個座位一年內的綜合票價記錄而得出的。通過預測機票價格的走勢以及增降幅度，Farecast票價預測工具能幫助消費者抓住最佳購買時機。到2012年為止，Faecast系統用了將近十萬億條價格記錄來説明預測美國國內航班的票價，Farecast票價預測的準確度已經高達75％，使用Fcat票價預測工具購買機票的旅客，平均每張機票可節省50美元。

大資料以一種前所未有的方式，通過對海量資料進行分析，獲得有巨大價值的產品和服務，或深刻的洞見。

然後回答題主的問題，大資料和金融。

麻省理工與通貨緊縮預測軟體

“10億價格項目”(The Billion Prices Project ,BBP提供了一個有趣的例子。美國勞工統計局的人員每個月都要公佈消費物價指數（CPI），這是用來測試通貨膨脹率的。這些資料對投資者和商家都非常重要。在決定是否增減銀行利率的時候，美聯儲也會考慮消費指數。一旦發生通貨膨脹，工人工資也會增加。聯邦政府在支付社會福利和債券利息的款項時，這項指數也是他們參考的依據。聯邦政府為了得到這些資料，會雇用很多人向全美”個城市的商店、辦公室打電話、發傳真甚至登門拜訪。他們回饋回來的各種各樣的價格資訊達80000種，包括土豆的價格、計程車的票價等。政府採集這些資料每年大概需要花費兩億五千萬美元。

這些資料是精確的也是有序的，但是這個採集結果的公佈會有幾周的滯後。2008年的經濟危機表明，這個滯後是致命的。政策決策者為了更好地應對變化，需要及時瞭解通貨膨脹率，但如果以傳統的依賴採樣和追求精確的方式進行資料收集，政府就不可能及時獲得資料了。麻省理工學院（MT）的兩位經濟學家，阿爾貝托·卡瓦略和羅伯托·裡哥本 o be no Rigobon）就對此提出了一個大資料方案，那就是接受更混亂的資料。通過一個軟體在互聯網上收集資訊，他們每天可以收集到50萬種商品的價格。收集到的資料很混亂，也不是所有資料都能輕易進行比較。但是把大資料和好的分析法相結合，這個項目在2008年9月雷曼兄弟破產之後馬上就發現了通貨緊縮趨勢，然而那些依賴官方資料的人直到11月份才知道這個情況。——資料來源《大資料時代》

我們不製造答案，我們只是答案的搬運工。

大資料並不是一個充斥著運算法則和機器的冰冷世界，其中仍需要人類扮演重要角色，人類獨有的弱點，錯覺錯誤都是十分必要的，因為這些特性的另一頭牽著的是人類的創造力、直覺和天賦。偶爾也會帶來屈辱或固執的同樣混亂的大腦運作，也能帶來成功，或在偶然間促成我們的偉大。這提示我們應該樂於接受類似的不準確，因為不準確正是我們之所以為人的特徵之一。就好像我們學習處理混亂資料一樣，因為這些資料服務的是更加廣大的目標。畢竟混亂構成了世界的本質，也構成了人腦的本質而無論是世界的混亂還是人腦的混亂，學會接受和應用它們才能得益

大資料是一種資源，也是一種工具，大資料提供的不是最終答案，只是參考答案，為我們提供暫時的幫助，以便等待更好的方法和答案的出現。這也提醒我們在使用工具時侯，應當懷有謙恭之心，銘記人性之本。

股海點心

精選文章

一年內由5億到650億的2326 百靈達國際控股

2016年8月31日星期三

大數據在金融領域是如何應用的？(轉載)

沒有留言:

張貼留言