導讀:我們提出了一個車輛指數(shù)的算法,比如這張圖給出了一個城市某一塊區(qū)域的衛(wèi)星圖片,大家可以看到停車場,或者高速公路上有很多車輛行駛,我們通過AI的算法可以準確檢測出地面上車輛的數(shù)量。
今天經(jīng)濟學已經(jīng)變成了一個可以被感知的“有生命的活體”,我們稱之為可感知經(jīng)濟學(Senseable Economics)。
可感知經(jīng)濟學是說,我們?nèi)绾螌@得的傳感器數(shù)據(jù),結(jié)合人工智能技術(shù),去分析一些重大社會學和經(jīng)濟學的問題。
我最近看了一個BBC新拍的紀錄片,叫《從太空看地球》,這張圖片是衛(wèi)星拍攝的地球某一個角落的圖像,大家可以猜一下金黃色的部分是什么東西?
第一眼看到這個圖片的時候,我以為這是某個區(qū)域發(fā)現(xiàn)了一個重大的金礦,這里閃爍著金子的光芒。
但其實鏡頭再繼續(xù)放大,我發(fā)現(xiàn)它又像油漆,是不是某一個行為藝術(shù)學家做了一幅藝術(shù)作品呢?
然后鏡頭又繼續(xù)拉近,我發(fā)現(xiàn)它既不是油畫,它也不是金礦,其實是云南羅平的油菜花。
通過衛(wèi)星從不同的尺度去觀看地球的壯觀景象讓人非常感慨,我想起了英國著名天文學家弗雷德·霍伊爾(Fred Hoyle)爵士說過這么一句話:
“一旦我們有辦法,可以從地球之外的角度去拍攝我們的地球,那么我們將可以釋放一個有史以來最為偉大的思想?!?/p>
今天,隨著太空技術(shù)的發(fā)展,弗雷德爵士的這句話已經(jīng)變成現(xiàn)實:
第一,衛(wèi)星已經(jīng)變得越來越小。
以前大家想到衛(wèi)星的時候,可能是一個長達幾百米,重達幾噸,造價幾億的龐然大物,但現(xiàn)在,衛(wèi)星已經(jīng)變得非常小,有的只有幾十厘米長,重約幾公斤,造價也從幾億美元降低到了大概幾萬美元。
圖上最小的那顆衛(wèi)星,它是美國Planet Labs公司發(fā)射的鴿子衛(wèi)星,這個公司已經(jīng)成功向太空發(fā)射了300顆這樣的衛(wèi)星,它們每天對地球進行實時的分析和監(jiān)測。
此外,我們向太空發(fā)射的衛(wèi)星的數(shù)量也越來越多。
這張圖來自《經(jīng)濟學人》,顯示的是從上個世紀60年代一直到今天,不同國家向太空成功發(fā)射衛(wèi)星的數(shù)量變化。綠色代表的是中國,數(shù)量已經(jīng)開始領(lǐng)先其他國家。
這些衛(wèi)星可以用來干什么呢?
可以監(jiān)測經(jīng)濟數(shù)據(jù)。非洲的一些國家,極端貧困,晚上沒有任何燈光亮度。世界銀行如果想去幫助這些非洲國家,首先就得想盡辦法去分析、了解這個區(qū)域的經(jīng)濟發(fā)展狀況。
那怎么操作呢?
首先是使用衛(wèi)星拍攝的彩色的遙感圖片,斯坦??茖W家通過人工智能技術(shù)和CN算法(Color Names,目標跟蹤算法的一種)去分析這些圖像,結(jié)合遷移學習和衛(wèi)星燈光亮度圖,進而預測非洲貧困國家的經(jīng)濟收入水平和貧困狀況。
結(jié)果到底準不準?
左邊這張圖是2017年非洲某個國家官方統(tǒng)計的經(jīng)濟收入數(shù)字,右邊這張圖就是用人工智能技術(shù)分析遙感圖像,經(jīng)過深度學習、遷移學習的結(jié)果,大家可以看出兩者之間是非常相關(guān)的。
我們能不能用衛(wèi)星拍攝的遙感圖片去監(jiān)測不同尺度的經(jīng)濟活動?
這張圖上中國區(qū)域里的每一個小點就是一個工業(yè)園區(qū),一共有4000多個,基本覆蓋了大概50萬平方公里。
我們針對這4000個工業(yè)園區(qū)的衛(wèi)星圖像,通過人工智能技術(shù)去分析它的變化,提取特征,然后監(jiān)測它的經(jīng)濟和制造活動,紅色代表這塊的區(qū)域經(jīng)濟活動比較強。
這是怎么做到的?
首先針對一塊區(qū)域,通過深度學習去學習它的特征,大家可以想一下,如果有一片區(qū)域原來一開始是一個草坪,后來它變成了一塊水泥地,那就說明這一塊區(qū)域產(chǎn)生了經(jīng)濟活動。
那么,透過這4000多個工業(yè)園區(qū)的衛(wèi)星圖像數(shù)據(jù),我們就可以實時感知中國生產(chǎn)制造業(yè)的發(fā)展,也就意味著我們可以通過衛(wèi)星去管制一個區(qū)域的PMI指數(shù)(采購經(jīng)理指數(shù)),我們稱之為SMI指數(shù)(衛(wèi)星制造業(yè)指數(shù))。
衡量宏觀經(jīng)濟走勢的時候,最常見的一個值叫PMI指數(shù),這個指數(shù)一般是通過訪談或者電話采購經(jīng)理獲取,更新頻率大概是一個月一次。
而通過衛(wèi)星感知PMI指數(shù),基本上可以實現(xiàn)一個星期更新一次,頻率大大地提高,而且大家可以看到,SMI指數(shù)和官方給出的PMI指數(shù)整體還是非常接近的。
除了能夠分析不同區(qū)域的經(jīng)濟發(fā)展,我們還想通過衛(wèi)星遙感數(shù)據(jù),去幫助我們分析一個城市不同區(qū)域的經(jīng)濟狀況。
一個城市的發(fā)展和城市的交通物流是息息相關(guān)的。
我們提出了一個車輛指數(shù)的算法,比如這張圖給出了一個城市某一塊區(qū)域的衛(wèi)星圖片,大家可以看到停車場,或者高速公路上有很多車輛行駛,我們通過AI的算法可以準確檢測出地面上車輛的數(shù)量。
綠色的小塊就是我們通過衛(wèi)星圖像檢測的車的位置,我們通過檢測車輛,然后再評估車輛的數(shù)量,就可以評估一個區(qū)域的經(jīng)濟發(fā)展程度。
大家知道現(xiàn)在中國每年我們政府有將近1000億的扶貧基金去幫助農(nóng)村進行發(fā)展,農(nóng)村的經(jīng)濟也發(fā)生了翻天覆地的變化,但是這些變化到底怎么去量化,怎么去評估?
大家知道中國有句老話叫“想致富,先修路”,所以如果我們能夠通過衛(wèi)星圖像去識別農(nóng)村路網(wǎng)的變化,我們就可以去評估一個農(nóng)村經(jīng)濟的變化。
因為中國的農(nóng)村分布比較分散,你很難用衛(wèi)星的夜光數(shù)量和亮度去評估,所以左邊和右邊兩張圖白色的區(qū)域,就是我們通過深度學習算法,識別出兩個不同的農(nóng)村區(qū)域的路網(wǎng)的結(jié)果,據(jù)此我們就可以去評估不同農(nóng)村區(qū)域的發(fā)展,評估扶貧的進度等等。
講完通過衛(wèi)星觀看地球,接下來我再介紹另外一種數(shù)據(jù)。
大家看,這是一張什么圖?
大家可以看到這樣一個關(guān)于中國的亮度圖,相對比衛(wèi)星拍攝的夜光亮度,這個數(shù)據(jù)我覺得更加壯觀,也更加細膩。
我們除了能夠看到整個中國人口的黑河——騰沖的分布線,我們還可以清晰地看到北京、上海、廣州三個非常亮的區(qū)域,以及整個我們祖國的山川河流輪廓,都可以從里面看到。
它不是衛(wèi)星拍攝的夜光數(shù)據(jù),而是2015年除夕一天手機位置數(shù)據(jù)經(jīng)過脫敏聚合后的可視化結(jié)果。
這是中國的華北平原區(qū),我們甚至可以看到黃河的形狀,右下角是太湖,崇明島,在整個華北平原上像星星一樣的這些小點可能是某個四五線城市,或者是某個縣城,我們對比除夕這一天的數(shù)據(jù)和平時數(shù)據(jù),發(fā)現(xiàn)這些點的燈光明顯比平時亮了很多。
因為這幾個省,山東、河南、河北是外出務(wù)工大省,在除夕這天,很多人返回家里與家人團聚,所以使得這塊區(qū)域的亮度比平時亮了非常多。
手機位置數(shù)據(jù)如何去評估一個區(qū)域的經(jīng)濟發(fā)展,感知一個區(qū)域經(jīng)濟的變化呢?
這里是一個MIT的研究人員在英國做的一個項目,他們拿出了三萬個小區(qū)的電話通訊數(shù)據(jù),認為任何兩個小區(qū)之間的通話意味著它們之間存在社會關(guān)聯(lián),據(jù)此搭建起了人脈網(wǎng)絡(luò),統(tǒng)計出通話網(wǎng)絡(luò)多樣性指數(shù)。
舉個簡單的例子,比如說我們打開自己的微信朋友圈,我們可以通過幾個維度來定義我們的人際網(wǎng)絡(luò)多樣性指數(shù)。
比如說我們有多少個好友;我們的好友都分布在中國的哪些省份;我們這些好友的職業(yè)是不是分散得很廣,如果說你的好友又多,分布區(qū)域又廣,他的職業(yè)分布又廣,恭喜你,其實你的好友多樣性指數(shù)非常高。
而且他們研究發(fā)現(xiàn),把右邊這張圖X軸的多樣性指數(shù),和不同小區(qū)的收入水平做關(guān)聯(lián),他們發(fā)現(xiàn)這兩者之間呈現(xiàn)73%的關(guān)聯(lián)性,也就是說,如果你的好友很多的話,分布區(qū)域越廣,分布越散的話,你就是傳說中的土豪。
同樣,我們還可以通過移動的數(shù)據(jù)來做人口普查的分析,大家知道中國每10年做一次人口普查,費時費力,而且可能等我們做完人口普查,人口結(jié)構(gòu)又發(fā)生了變化。
這個是歐洲的研究人員通過分析葡萄牙手機基站數(shù)據(jù),做的人口密度動態(tài)評估。A是官方統(tǒng)計的人口動態(tài)密度,B是用手機位置數(shù)據(jù)來估算的人口動態(tài)密度,C是用衛(wèi)星遙感圖像來分析出來的人口密度分布。
大家可以看到,B和C和A的結(jié)果都非常接近,數(shù)據(jù)分析這兩者之間的關(guān)聯(lián)性將近90%。
此外,我們還可以通過手機的數(shù)據(jù)去預測不同國家區(qū)域的貧困程度,這是伯克利大學的科學家分析非洲盧旺達這些國家的貧困收入。
他們通過分析用戶的手機數(shù)據(jù),比如打電話的時長,各種社交網(wǎng)絡(luò)關(guān)系和出行信息來作為特征,通過機器學習算法去預測一個人的收入水平,然后他們把不同區(qū)域的數(shù)據(jù)再聚合起來,就能得出聚合后不同區(qū)域的收入水平和貧困狀況。
通過這種方法,他們得出了整個盧旺達國家的人均收入和財富分布的變化,這個數(shù)據(jù)其實和官方公布的結(jié)果非常接近,但是它可以幾乎是實時地更新,可以動態(tài)地更新,可以為世界銀行這種機構(gòu)提供非常有價值的參考。
最后,我想分享一個用手機數(shù)據(jù)回答的一個長期以來困擾很多中國人的經(jīng)濟謎團,那就是中國的房地產(chǎn)空置率到底是多少?中國傳說中的空城或者叫鬼城到底在哪里?
傳統(tǒng)的手段,可以入戶調(diào)查,或者看晚上有多少個空調(diào),亮了多少盞燈來分析一個區(qū)域的空置率的變化,我們是通過用機器學習的算法,去分析預測用戶的居住地和工作地的分布。
這張圖是上海某區(qū)域的工業(yè)園區(qū)和居民區(qū)的分布密度圖,結(jié)合用戶的手機數(shù)據(jù)和衛(wèi)星圖像深度學習檢測不同的住宅區(qū),不同的工業(yè)園區(qū),我們就可以評估一個住宅區(qū)的空置程度。
通過這種方法,我們是第一次通過數(shù)據(jù)的手段去感知到了中國空置率比較高的一些樓盤,這個項目叫做“空城計”,計算的計。
這張圖給出了監(jiān)測到空置區(qū)樓盤比較多的九個中國城市,在這里就不點名了,大家可以根據(jù)自己地理學知識,結(jié)合衛(wèi)星圖像去感知這是哪個城市的哪個區(qū)域。
我們在做這個項目的同時,也發(fā)現(xiàn)了一個非常有趣的現(xiàn)象。大家知道國外的媒體經(jīng)常拿鄭州的鄭東新區(qū)作為鬼城的典型例子,但其實我們在兩三年前的研究中就發(fā)現(xiàn),其實鄭東新區(qū)的勞動力活躍指數(shù)已經(jīng)非常高,我們很難再把它當成一個鬼城。
大家知道,比如在上海,我們可能有2000萬人,如果這個城市多了十萬人,或者少了十萬人,我們是很難感受到的,但是數(shù)據(jù)就可以看出來,一個城市的勞動力趨勢的變化,它就像一個城市的心電圖一樣。
這是通過數(shù)據(jù)分析得出的東莞和南寧的月度勞動力趨勢圖。
由于中國有兩個法定長假,春節(jié)和國慶,因此對月度的勞動力趨勢帶來了季節(jié)性波動,但是我們依然可以通過長期的數(shù)據(jù),看到不同城市整體的勞動力的趨勢是上升還是下降。
因為一個城市的發(fā)展,無論如何都離不開勞動力,它包括了像你我這樣可能需要996的工作者,也包括那些可能一年只能回家一次的農(nóng)民工,所以如果我們能夠通過數(shù)據(jù)去感知一個城市勞動力的變化,我們就可以去預測這個城市將來的走勢。
我們這個研究當時得到了美國彭博新聞社的報道,彭博當時采訪了北大光華管理學院的Jeffery Towson教授,他這樣評價我們這個研究,我覺得非常形象,他說:
“之前我們分析一個區(qū)域的經(jīng)濟就好像是拿著一個手電筒去看,現(xiàn)在我們幾乎是點了一盞燈,一下子我們所有東西都可以看得非常清楚?!?/p>
這都歸功于我們今天傳感器和物聯(lián)網(wǎng)的發(fā)展。
我們今天主要講了兩個案例,一個是天上的衛(wèi)星,一個是地下的手機的數(shù)據(jù),
未來,隨著5G的到來,傳感器可能會遍布在我們身邊每個地方。
可能我們今天看到這個燈,它上面就是有一個傳感器,能夠幫助我們感受到區(qū)域的燈光的亮度,和這塊區(qū)域用電的亮度,那么通過這些數(shù)據(jù)就可以更加準確地,去實時地感知我們整個經(jīng)濟的發(fā)展。
我們放遠了往前看五年或者十年,可能上海的大街上跑的是幾十萬輛無人車,它們就好比幾十萬雙眼睛,幫助我們?nèi)ビ^察著這個城市的一點一滴的變化。
它能夠幫我們感知到海底撈,麥當勞前面有多少個用戶,也能幫助我們觀察到張江高科技園區(qū),不同的公司面前有多少員工出現(xiàn)。
所有的這些數(shù)據(jù)都可以幫助我們?nèi)シ治鑫覀兘?jīng)濟的發(fā)展,感知我們經(jīng)濟的動態(tài)。
更能讓我們感知到經(jīng)濟背后的溫度和故事。