阅读此文之前,麻烦您点击一下“关注”,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持。
文|赫薰辞
编辑|赫薰辞
引言
世界每天都变得更加城市化,据联合国统计,世界上55%的人口集中在城市地区,这一数字在未来30年可能会增加到68%。
这一过程带来了巨大的社会、经济和环境挑战,特别是在全球南方,大部分城市人口增长将发生在这些地区。
尽管拥堵和密度导致成本高昂,但人们普遍认为城市的成功源于密集的社交网络和获得多样化的机会,最明显的是,这与就业机会有关。
发展中城市内就业和经济活动的空间组织是许多政策领域关注的核心话题,最直接地说,经济活动中心需要服务和交通连接才能蓬勃发展。
除其他外,这些联系促进了工人和企业之间更好的劳动力市场匹配,并增加了更广泛的服务和产品的可及性。
有关工作和企业密度的知识在城市规划和抗灾能力等其他领域也至关重要,在许多以大量非正规部门为主的发展中城市中,有关工作和机会的数量、类型或地点的数据要么稀缺,要么不完整。
根据国际劳工组织的数据,世界上超过60%的劳动年龄人口从事非正规工作。
大多数非正规工人都在发展中国家,这些国家非正规工人的比例甚至更高,在某些情况下超过90%。
尽管非正规部门规模很大,但跟踪和接触非正规企业和工人的困难意味着,除了经济普查等调查数据之外,关于非正规企业的数据相对较少。
例子包括为哥伦比亚卡利进行的企业普查,其中包括正规和非正规制造企业,然而,这些数据的收集通常非常昂贵,而且往往不完整,并且存在报告偏差。
说明了如何应用方法来调查许多问题,包括识别经济集群以及正规和非正规商业公司集群之间的相互作用、非正规商业公司主导地区的社会经济和工业概况以及非正规商业公司对土地分区规则的遵守情况。
虽然在这里不对这些问题进行深入研究,但目的是说明如何在这些领域部署该方法并促进未来的研究。
麦德林大都市区非正规经济活动及商业可见性分析
重点关注国家统计局在最近的人口普查中定义的麦德林大都市区,涵盖10个城市,拥有350万人口。
麦德林为方法提供了一个有价值的案例研究,它以复杂的工业和国际旅游业以及高度的社会隔离和非正式性为特征,是一座对比鲜明的城市。
在过去25年里,它经历了巨大的城市转型,特别是创新的公共交通系统,其中包括到达山区社区的缆车,这引起了国际社会的兴趣。
麦德林的大部分经济仍可被归类为非正规经济,据估计,哥伦比亚未注册企业的数量超过50%,麦德林的工作年龄人口中正式就业的比例为44%。
虽然麦德林有官方的公司登记册,但大量的非正规经济活动表明,官方数据并未涵盖很大一部分商业活动。
方法能够提取麦德林多样化景观中可见机构的位置,并将由此产生的“街头商业”空间分布与官方登记处商业公司的分布进行比较。
一方面可以探索官方数据的局限性,另一方面可以推断非正规机构集中的领域。
公司和机构没有一一对应的关系,但很少有正规公司是多机构公司,其分支机构或工厂分散在大都市区。
虽然由于缺乏将麦德林的公司与机构联系起来的详细数据,无法提供精确的估计,但可以从更广泛的文献以及对哥伦比亚和麦德林的一些估计中得出相当准确的推论。
考虑到所有类型的公司,拥有多个机构的公司所占比例从美国的4%到德国的8%。
说到零售,来自韩国的数据表明9%的企业是多机构的,而对于制造企业,研究报告称这一比例范围从加拿大的12%、墨西哥的8%、印度尼西亚的5%和哥伦比亚的3%到加纳几乎没有。
通过使用2015年哥伦比亚社会保障数据中的公司级数据,发现只有4%的公司在多个市设有机构,而从事商业活动的公司则增加到7%。
当将数据仅限于拥有10个市镇的麦德林时,这些百分比成立,通过关注注册商业公司和可见机构的密度而不是简单的计数,能够进行有意义的比较,但这对于分析来说仍然是一个重要的警告。
基于谷歌街景图像的城市非正式商业活动识别与分析
在这里提出了一种基于机器学习的算法,应用于谷歌街景图像,使能够识别我们所描述的可见设施的位置,即从街道上很容易识别的商业设施。
对于任何可以获得此类图像的区域,这种方法将生成可见商业机构的地理参考数据库,在这里,将该算法应用于哥伦比亚麦德林大都市区。
高水平的非正规经济活动和社会经济多样性,以及崎岖的地形和非同质的城市扩张,共同为探测器提供了一个具有挑战性的案例研究,虽然分析重点是麦德林,但该方法可以直接转移到其他城市和地区。
用于构建算法的工作流程所示,为了检测算法创建训练集,从麦德林的街道网络中随机采样了2000个点,这些点来自开放街道地图,这是一个免费提供道路网络和其他有用地理信息的开源项目。
通过调用Google街景API,获得了每个点的全景图像,然后将其转换为两张标准图像,道路每一侧各一张,这些图像是通过在每个立面周围绘制边界框,然后将每个立面标记为商业或非商业来手动标记的。
标记数据集包含大约2000个商业立面和大约6000个非商业立面,图像被随机分为训练,验证集和测试集,然后按照标准数据增强程序丰富训练集,这在检测和分类任务中很常见。
单次检测、只看一次和更快的R-CNN,这些检测器将图像作为输入并输出图像中感兴趣对象的位置,在例子中是商业公司的正面。
鉴于只有一个小的训练集,使用了迁移学习,这使能够重新训练之前适合类似目标检测任务的模型,使用训练和验证集对三种不同的架构进行训练,并使用测试集比较它们的性能。
除了训练探测器外,还需要确定一组位置,从这些位置采样全景图像以完全覆盖麦德林市区,为此从OSM获得了麦德林的街道网络,并以图像不会重叠的方式选择点,同时还捕获所有立面。
由于处理360度全景图像后,获得了街道每侧大约20m的范围,希望确保沿着每个路段,每20m就有一个图像。
为此首先占领了所有网络交叉点,对于两个交叉口之间的网络的每个部分,添加了尽可能多的点,同时确保它们之间的距离至少为20m。
这种启发式方法使能够快速创建一组点,使接近最大程度地覆盖城市,然后使用Google的街景API来获取每个点的全景图像。
将检测器应用于每个图像,以生成地理参考点列表,其中包含检测到的可见公司的数量。
精确度分数非常高在验证和测试子集中,表明几乎所有检测都是可见的设施,召回率较低,约为60%,一些可见场所可能未被检测到。
这一性能与相关工作相当,后者在精确度和召回率方面获得了大约的分数,还显示了F1分数,它是精确率和召回率分数的调和平均值。
获得可见企业数量的一致图片,专门使用了2017年拍摄的街景图像,正如预期的那样,公司的集中度在该数据集中清晰可见,但也注意到,检测范围遍及大部分城市地区。
虽然算法会错过所有可见机构的真实集合的一小部分,但总体空间分布对于随机遗漏而言是稳健的。
街景图像识别的环境科学研究:麦德林非正式城市商业活动分析
使用街景图像识别和跟踪非正式城市商业活动的新方法,这种方法是调查和商业登记的快速且经济高效的替代方案。
通过关注麦德林大都市区,表明检测算法能够绘制可见商业活动的空间分布图,并识别具有高密度可见设施的经济集群。
将数据集与注册公司集进行比较,证明捕获了官方记录中未反映的活动,特别是在大都市区较贫穷和人口较稠密的地区。
结果与之前的工作形成鲜明对比,之前的工作将土地价值数据与正规企业的位置相结合,以确定一个中央商业集群。
与分析卡利正规和非正规制造企业规模和位置的人口普查数据的相关工作相比,还发现了不同的模式。
虽然不能直接比较,但发现麦德林大都市区存在可见的商业公司,而发现卡利的非正规制造公司比正规制造公司表现出更高水平的空间集聚,尽管这确实因部门而异。
方法并非没有局限性,可见设施集是所有设施的特定子集,因为它仅包括那些在街道层面易于识别的设施。
可见的场所包括零售活动、个人服务和其他类似的活动和设施,这些可以说是经济中最具活力和非正式的部门,该数据集对于捕捉发展中城市的经济活动特别有用,对这组公司进行的任何分析都必须考虑到这一点。
虽然与检测店面的相关工作相当,该算法并不能完美识别商业公司,虽然这些算法在识别公司方面表现出很高的精确度,但它们的召回率并不高,这意味着它们可能低估了公司的数量。
虽然该方法很容易转移到可以获得街道图像的其他环境,但它确实需要检测器的训练数据。
在例子中,这需要花费大量时间手动标记图像,未来的工作将调查新区域在多大程度上需要定制训练集,或者是否可以使用在一个城市训练的图像来识别另一个城市的立面。
未来的工作还有许多其他途径,在这里只考虑了一年的图像,但对较长时间段的图像进行分析可以提供有关经济活动空间集中度随时间演变的重要信息,以及公共交通和道路投资等影响的重要信息。
无法轻易地将数据集中的正式企业与非正式企业区分开来,并使用正式企业登记册来识别相对于注册企业而言可见企业“过度”集中的区域,从而推断非正式企业的存在。
未来的工作可能旨在进一步匹配这些数据集,或部署其他技术,以进一步区分非正式公司和正式公司,此外,还有其他可能的方法来缩小官方数据的差距,例如众包数据。
例如,谷歌街道地图和开放街道地图提供有关酒吧、餐馆和商店等便利设施的信息,并且还可能提供有关包括一些制造企业在内的更广泛部门的位置的有限信息。
虽然众包数据很容易受到自我选择和其他偏见的影响,未来研究的一个潜在途径是整合这些其他来源并对其进行基准测试。
总结
该算法的性能在验证和测试集上表现良好,虽然可能会有一小部分遗漏,这一方法也存在局限性,例如只能识别可见的商业设施,并且需要大量的训练数据。
未来的工作可以考虑将该方法应用于更长时间段的图像,以探索经济活动的时空演变,可以进一步研究如何区分非正式企业和正式企业,并整合其他数据源来缩小官方数据的差距。
该研究为了解发展中城市的经济活动提供了一种创新的方法,为城市规划和政策制定提供了有用的数据参考。
参考文献
- United Nations. (2018). World Urbanization Prospects: The 2018 Revision. Department of Economic and Social Affairs, Population Division.
- Chen, H., Wang, W., & Wen, Y. (2020). The challenges of urbanization in the Global South: A review of the literature. Cities, 96, 102442.
- International Labour Organization. (2018). World Employment and Social Outlook 2018: Greening with Jobs. International Labour Office.
- Gupta, S., Dasgupta, B., Ray, S., & Chakraborty, D. (2017). Informal sector in urban employment: Measurement, determinants and policy issues. International Labour Review, 156(3-4), 415-437.
- Narayanan, S. (2018). Informal sector in India: Recent trends, problems, and policies. Journal of Economic Literature, 56(4), 1237-1281.
- Durand-Lasserve, A., & Royston, L. (2002). Holding their ground: Secure land tenure for the urban poor in developing countries. Earthscan.