閱讀此文之前,麻煩您點擊一下「關注」,既方便您進行討論和分享,又能給您帶來不一樣的參與感,感謝您的支持。
文|赫薰辭
編輯|赫薰辭
引言
世界每天都變得更加城市化,據聯合國統計,世界上55%的人口集中在城市地區,這一數字在未來30年可能會增加到68%。
這一過程帶來了巨大的社會、經濟和環境挑戰,特別是在全球南方,大部分城市人口增長將發生在這些地區。
儘管擁堵和密度導致成本高昂,但人們普遍認為城市的成功源於密集的社交網絡和獲得多樣化的機會,最明顯的是,這與就業機會有關。
發展中城市內就業和經濟活動的空間組織是許多政策領域關注的核心話題,最直接地說,經濟活動中心需要服務和交通連接才能蓬勃發展。
除其他外,這些聯繫促進了工人和企業之間更好的勞動力市場匹配,並增加了更廣泛的服務和產品的可及性。
有關工作和企業密度的知識在城市規劃和抗災能力等其他領域也至關重要,在許多以大量非正規部門為主的發展中城市中,有關工作和機會的數量、類型或地點的數據要麼稀缺,要麼不完整。
根據國際勞工組織的數據,世界上超過60%的勞動年齡人口從事非正規工作。
大多數非正規工人都在發展中國家,這些國家非正規工人的比例甚至更高,在某些情況下超過90%。
儘管非正規部門規模很大,但跟蹤和接觸非正規企業和工人的困難意味着,除了經濟普查等調查數據之外,關於非正規企業的數據相對較少。
例子包括為哥倫比亞卡利進行的企業普查,其中包括正規和非正規製造企業,然而,這些數據的收集通常非常昂貴,而且往往不完整,並且存在報告偏差。
說明了如何應用方法來調查許多問題,包括識別經濟集群以及正規和非正規商業公司集群之間的相互作用、非正規商業公司主導地區的社會經濟和工業概況以及非正規商業公司對土地分區規則的遵守情況。
雖然在這裡不對這些問題進行深入研究,但目的是說明如何在這些領域部署該方法並促進未來的研究。
麥德林大都市區非正規經濟活動及商業可見性分析
重點關注國家統計局在最近的人口普查中定義的麥德林大都市區,涵蓋10個城市,擁有350萬人口。
麥德林為方法提供了一個有價值的案例研究,它以複雜的工業和國際旅遊業以及高度的社會隔離和非正式性為特徵,是一座對比鮮明的城市。
在過去25年里,它經歷了巨大的城市轉型,特別是創新的公共交通系統,其中包括到達山區社區的纜車,這引起了國際社會的興趣。
麥德林的大部分經濟仍可被歸類為非正規經濟,據估計,哥倫比亞未註冊企業的數量超過50%,麥德林的工作年齡人口中正式就業的比例為44%。
雖然麥德林有官方的公司登記冊,但大量的非正規經濟活動表明,官方數據並未涵蓋很大一部分商業活動。
方法能夠提取麥德林多樣化景觀中可見機構的位置,並將由此產生的「街頭商業」空間分佈與官方登記處商業公司的分佈進行比較。
一方面可以探索官方數據的局限性,另一方面可以推斷非正規機構集中的領域。
公司和機構沒有一一對應的關係,但很少有正規公司是多機構公司,其分支機構或工廠分散在大都市區。
雖然由於缺乏將麥德林的公司與機構聯繫起來的詳細數據,無法提供精確的估計,但可以從更廣泛的文獻以及對哥倫比亞和麥德林的一些估計中得出相當準確的推論。
考慮到所有類型的公司,擁有多個機構的公司所佔比例從美國的4%到德國的8%。
說到零售,來自韓國的數據表明9%的企業是多機構的,而對於製造企業,研究報告稱這一比例範圍從加拿大的12%、墨西哥的8%、印度尼西亞的5%和哥倫比亞的3%到加納幾乎沒有。
通過使用2015年哥倫比亞社會保障數據中的公司級數據,發現只有4%的公司在多個市設有機構,而從事商業活動的公司則增加到7%。
當將數據僅限於擁有10個市鎮的麥德林時,這些百分比成立,通過關注註冊商業公司和可見機構的密度而不是簡單的計數,能夠進行有意義的比較,但這對於分析來說仍然是一個重要的警告。
基於谷歌街景圖像的城市非正式商業活動識別與分析
在這裡提出了一種基於機器學習的算法,應用於谷歌街景圖像,使能夠識別我們所描述的可見設施的位置,即從街道上很容易識別的商業設施。
對於任何可以獲得此類圖像的區域,這種方法將生成可見商業機構的地理參考數據庫,在這裡,將該算法應用於哥倫比亞麥德林大都市區。
高水平的非正規經濟活動和社會經濟多樣性,以及崎嶇的地形和非同質的城市擴張,共同為探測器提供了一個具有挑戰性的案例研究,雖然分析重點是麥德林,但該方法可以直接轉移到其他城市和地區。
用於構建算法的工作流程所示,為了檢測算法創建訓練集,從麥德林的街道網絡中隨機採樣了2000個點,這些點來自開放街道地圖,這是一個免費提供道路網絡和其他有用地理信息的開源項目。
通過調用Google街景API,獲得了每個點的全景圖像,然後將其轉換為兩張標準圖像,道路每一側各一張,這些圖像是通過在每個立面周圍繪製邊界框,然後將每個立面標記為商業或非商業來手動標記的。
標記數據集包含大約2000個商業立面和大約6000個非商業立面,圖像被隨機分為訓練,驗證集和測試集,然後按照標準數據增強程序豐富訓練集,這在檢測和分類任務中很常見。
單次檢測、只看一次和更快的R-CNN,這些檢測器將圖像作為輸入並輸出圖像中感興趣對象的位置,在例子中是商業公司的正面。
鑒於只有一個小的訓練集,使用了遷移學習,這使能夠重新訓練之前適合類似目標檢測任務的模型,使用訓練和驗證集對三種不同的架構進行訓練,並使用測試集比較它們的性能。
除了訓練探測器外,還需要確定一組位置,從這些位置採樣全景圖像以完全覆蓋麥德林市區,為此從OSM獲得了麥德林的街道網絡,並以圖像不會重疊的方式選擇點,同時還捕獲所有立面。
由於處理360度全景圖像後,獲得了街道每側大約20m的範圍,希望確保沿着每個路段,每20m就有一個圖像。
為此首先佔領了所有網絡交叉點,對於兩個交叉口之間的網絡的每個部分,添加了儘可能多的點,同時確保它們之間的距離至少為20m。
這種啟發式方法使能夠快速創建一組點,使接近最大程度地覆蓋城市,然後使用Google的街景API來獲取每個點的全景圖像。
將檢測器應用於每個圖像,以生成地理參考點列表,其中包含檢測到的可見公司的數量。
精確度分數非常高在驗證和測試子集中,表明幾乎所有檢測都是可見的設施,召回率較低,約為60%,一些可見場所可能未被檢測到。
這一性能與相關工作相當,後者在精確度和召回率方面獲得了大約的分數,還顯示了F1分數,它是精確率和召回率分數的調和平均值。
獲得可見企業數量的一致圖片,專門使用了2017年拍攝的街景圖像,正如預期的那樣,公司的集中度在該數據集中清晰可見,但也注意到,檢測範圍遍及大部分城市地區。
雖然算法會錯過所有可見機構的真實集合的一小部分,但總體空間分佈對於隨機遺漏而言是穩健的。
街景圖像識別的環境科學研究:麥德林非正式城市商業活動分析
使用街景圖像識別和跟蹤非正式城市商業活動的新方法,這種方法是調查和商業登記的快速且經濟高效的替代方案。
通過關注麥德林大都市區,表明檢測算法能夠繪製可見商業活動的空間分佈圖,並識別具有高密度可見設施的經濟集群。
將數據集與註冊公司集進行比較,證明捕獲了官方記錄中未反映的活動,特別是在大都市區較貧窮和人口較稠密的地區。
結果與之前的工作形成鮮明對比,之前的工作將土地價值數據與正規企業的位置相結合,以確定一個中央商業集群。
與分析卡利正規和非正規製造企業規模和位置的人口普查數據的相關工作相比,還發現了不同的模式。
雖然不能直接比較,但發現麥德林大都市區存在可見的商業公司,而發現卡利的非正規製造公司比正規製造公司表現出更高水平的空間集聚,儘管這確實因部門而異。
方法並非沒有局限性,可見設施集是所有設施的特定子集,因為它僅包括那些在街道層面易於識別的設施。
可見的場所包括零售活動、個人服務和其他類似的活動和設施,這些可以說是經濟中最具活力和非正式的部門,該數據集對於捕捉髮展中城市的經濟活動特別有用,對這組公司進行的任何分析都必須考慮到這一點。
雖然與檢測店面的相關工作相當,該算法並不能完美識別商業公司,雖然這些算法在識別公司方面表現出很高的精確度,但它們的召回率並不高,這意味着它們可能低估了公司的數量。
雖然該方法很容易轉移到可以獲得街道圖像的其他環境,但它確實需要檢測器的訓練數據。
在例子中,這需要花費大量時間手動標記圖像,未來的工作將調查新區域在多大程度上需要定製訓練集,或者是否可以使用在一個城市訓練的圖像來識別另一個城市的立面。
未來的工作還有許多其他途徑,在這裡只考慮了一年的圖像,但對較長時間段的圖像進行分析可以提供有關經濟活動空間集中度隨時間演變的重要信息,以及公共交通和道路投資等影響的重要信息。
無法輕易地將數據集中的正式企業與非正式企業區分開來,並使用正式企業登記冊來識別相對於註冊企業而言可見企業「過度」集中的區域,從而推斷非正式企業的存在。
未來的工作可能旨在進一步匹配這些數據集,或部署其他技術,以進一步區分非正式公司和正式公司,此外,還有其他可能的方法來縮小官方數據的差距,例如眾包數據。
例如,谷歌街道地圖和開放街道地圖提供有關酒吧、餐館和商店等便利設施的信息,並且還可能提供有關包括一些製造企業在內的更廣泛部門的位置的有限信息。
雖然眾包數據很容易受到自我選擇和其他偏見的影響,未來研究的一個潛在途徑是整合這些其他來源並對其進行基準測試。
總結
該算法的性能在驗證和測試集上表現良好,雖然可能會有一小部分遺漏,這一方法也存在局限性,例如只能識別可見的商業設施,並且需要大量的訓練數據。
未來的工作可以考慮將該方法應用於更長時間段的圖像,以探索經濟活動的時空演變,可以進一步研究如何區分非正式企業和正式企業,並整合其他數據源來縮小官方數據的差距。
該研究為了解發展中城市的經濟活動提供了一種創新的方法,為城市規劃和政策制定提供了有用的數據參考。
參考文獻
- United Nations. (2018). World Urbanization Prospects: The 2018 Revision. Department of Economic and Social Affairs, Population Division.
- Chen, H., Wang, W., & Wen, Y. (2020). The challenges of urbanization in the Global South: A review of the literature. Cities, 96, 102442.
- International Labour Organization. (2018). World Employment and Social Outlook 2018: Greening with Jobs. International Labour Office.
- Gupta, S., Dasgupta, B., Ray, S., & Chakraborty, D. (2017). Informal sector in urban employment: Measurement, determinants and policy issues. International Labour Review, 156(3-4), 415-437.
- Narayanan, S. (2018). Informal sector in India: Recent trends, problems, and policies. Journal of Economic Literature, 56(4), 1237-1281.
- Durand-Lasserve, A., & Royston, L. (2002). Holding their ground: Secure land tenure for the urban poor in developing countries. Earthscan.