Stock Code: 300949
Position:HOME > NEWS > Viewpoint
Viewpoint
07/222022Views
Viewpoint

R&D Column: How to Observe City by AI | Development and Application of Computer Vision on New City Design in Human Dimension

卷首语丨我们时刻关注风景园林学科与事业的可持续发展。2022年5月,我们推出《研发专栏》系列文章,与业内外专业学者与实践者共同探索、讨论、分享具前瞻性、思辨性的行业观点及技术。

基于视觉的"观察"是人们感知城市空间的主要方式之一。早在1985年,阿兰·B.雅各布斯便在《观察城市》一书中奠定了基于视觉、步行的"观察",也为世界各地的城市设计实践带来广泛而深远的影响[1]。"观察"作为城市设计的研究方法有别于重技术而轻价值导向的理性规划,具有注重个体体验、注重公众参与的人本主义特点[2]。

2021年,十四五规划提出了以“人为核心”的新型城镇化建设途径。在此背景下,基于人的视角观察城市空间、通过公众参与观察共同评估城市空间,对于城市设计实践更有不可或缺的意义。

随着人工智能(AI, Artificial Intelligence)技术的不断成熟,近年来,城市设计研究中逐渐涌现了一种新的"观察"方式——通过计算机视觉技术识别并处理基于行人视角的视觉数据。这种观察方式是否能解决人本尺度城市设计的痛点?利用AI进行城市观察具有哪些优势与局限?本研究旨在探讨这一观察方式的特征及应用趋势,以有效应对企业在新型城市设计业务中的“人本主义”诉求

进行人本主义、人本尺度的城市观察,常常涉及城市形态测度(measurement)与效应评估(performance)两类方法[3]。近年来迅速增长、信息承载量日益丰富的城市视觉数据(图像、视频等)与日益成熟的视觉数据分析手段为高质、高效地进行城市观察带来了新机遇。

在城市形态测度方面,通过无人机倾斜摄影和雷达扫描技术获取的高精度三维点云数据进行分析(图1),通过python获取社交媒体的地理照片数据.通过腾讯、百度、高德等公司的街景地图API (Application Programming Interface) 获取的海量街景照片,通过街头摄像采集的图像和视频数据,已在多个城市设计研究领域中有成熟的应用,使近人尺度的城市视觉特征能够被大规模地分析[4–6]。

▲图1:深圳蛇口网谷城市形态测度

在建设效应评估方面,尤其是公众参与,近年来发展迅速的虚拟现实(VR, Virtual Reality),增强现实(AR, Augmented Reality),混合现实(MR, Mixed Reality)技术大大增加了公众与虚拟空间视觉数据沉浸式交互的可能性、趣味性(图2)。另外,结合眼动追踪(VOG, Video-Oculography)技术,使用者对于多种空间形态的视觉体验过程可以被直接记录与分析,得到更精确、更客观的公众评估结果。

 

▲图2:基于虚拟现实VR的公众参与设计

通过AI之眼进行城市观察,离不开计算机视觉技术的运用。计算机视觉是通过数学算法对二维图像中的三维物体信息进行解析、理解,以使机器能模拟人类的视觉信息解译能力的一门科学,在城市规划、设计领域的应用已有20余年的历史[6,7]。基于Nematollahi等[7]的总结及大量文献检索发现,此领域研究常用的计算机视觉技术手段有目标检测与识别、图像识别、分割及打分等(表1)。值得注意的是,除了对于图像信息的客观识别与提取,计算机视觉技术在城市规划、设计领域的应用越来越多地结合研究者及公众的评价,生成如情绪、城市意象、街道安全系数等具有主观性的观察结果[8]。

▲表1:技术手段、典型应用场景及应用示例

借助计算机视觉技术进行城市观察与城市设计,需要结合场地尺度、分析需求、技术实力等着重考虑视觉数据与分析方法的选择。此外,应考虑在哪个阶段、怎样融入人的主观思考与创造,以真正形成以人为核心的城市观察视角。

根据Engin 等[23] 针对常用城市数据来源的分类,国内城市视觉数据的来源可分为众包(crowdsourced)、私有(proprietary)、人工采集三大类。根据采集方式的不同,视觉数据所包含的信息也有所区别:社交媒体数据包含更多文本标签信息和拍摄时间信息;街景地图则提供了更完整客观的图像内容;人工采集能获取完整的图片元数据信息(如拍照地点,时间)及更有针对性的内容信息。总体上,街景图像数据和人工采集数据在研究中应用较广泛,两者分别在时间和空间连续性上各有优势。

▲表2:视觉数据来源与采集渠道

借助计算机视觉技术进行的城市设计实践,常常通过设计师与专业计算机视觉公司之间的合作完成[24]。在此之外,亦有技术门槛较低的视觉分析工具可供使用,推荐的工具与可实现分析有:

1)视觉识别API:如Clarifai, CloudCV, Azure Cognitive Services等,无需编程基础即可获取图片关键元素、图片内容、关键颜色等信息[25] ;
2)开源平台Makesense、开源目标检测算法YOLO,可进行自定义目标检测(如街道窗口检测);
3)Matlab 科学计算平台、OpenCV计算机视觉库,可进行图像基础信息采集(如HSV值提取);

除此之外,部分从事于新城市科学(New urban science)研究的商业化平台,也推出了相应的AI图像计算服务,如城市象限、城室科技等。

利用计算机视觉技术进行的城市设计研究正处于快速发展。本研究基于相关文献检索及的自主研究实践,总结出典型的AI城市观察"五招式",为深入了解这种城市观察视角评价的优势与局限,根据不同应用场景选择不同的技术方法奠定基础。

在存量型城市设计的不断发展下,对于街道空间品质的评价趋于多元化,评价特征包括但不限于绿视率、道路可达性、渗透率等[26]。同济大学计算性城市设计实验室,基于百度街景API的大规模街景数据进行街道渗透率的评价[11]。研究团队借助Makesense平台人工标记了3500张街景图像中的门洞和窗口特征,实现了自定义的街道特征识别(图3)。通过Poly-YOLO算法对更大规模街景图像中的门洞和窗进行识别训练,该项目实现了对于上海中心城区的街道渗透率较准确的评价

除街道渗透率外,可接触的城市绿化率是城市街道空间品质特征的一个重要方面[27]。随着街景数据的普及与可获得性的提高,基于人本视角进行街道绿化程度分析相较于大尺度卫星遥感影像的绿化率分析将更具评价准确性。除此方法外,通过统计图像色彩特征(HSV通道值)的方式进行绿视率分析较为简单直观,在小尺度、小规模批量分析上也有较好的表现。

在宜昌旧城区慢行廊道路由选线竞赛项目中,我们通过百度地图API批量获取街道路网数据,通过人工智能卷积神经网络(FCN, Full Convolutional Network),对采集的街景图像进行识别和语义分割,对植被等要素赋予量化数值,进而通过比例计算实现了街道绿视率的准确评估,对宜昌城市街道空间品质的要素进行系统性测度,实现高密度建成环境下城市慢行廊道选线潜力评估

▲图3:街道空间特征识别的技术流程[11]

行为-空间的相互联系是城市公共空间观察的另一重要课题[28]。胡一可等[5]基于计算机视觉技术记录准确,对被测试者心理影响较小的特点,通过对一定时长的摄录视频做帧间差值分析,还原了所摄公共空间中人的行为模式。

在数据采集阶段,研究人员选择了3处典型、潜在活动模式较丰富的街道空间,在一天中分多个人流高峰时段进行每段10分钟的俯视角度摄录,以确保场地内全部信息的收集:。同时记录的数据有固定的视点位置、天气状况等基本信息。在数据分析阶段,研究人员标记了视频中行人在每一帧的位置,并最终形成透视视角的移动轨迹图。在最终合成的轨迹图中,场地的使用情况清晰可见(图4)。

除此方法外,YOLOv5能够对行人的轨迹与行为做更精确的侧写。YOLOv5是一个基于GPL3.0开源协议的计算机视觉算法,它能够进行图片、视频的指定目标识别,进而通过视频帧间区别进行轨迹描绘。我们研究人员基于巴塞罗那的10分钟街头摄录视频进行试验,将透视视角的识别对象投影至指定地理坐标系,得出了较为准确的行人轨迹、速率、偏转角度、时空热力图等信息。此类分析可对设计前后的空间形态影响作出有力量化证据支持

▲图4:公共空间使用者行为分析技术流程[5]

20世纪60年代,凯文·林奇提出以标识、 节点、路径、边界、区域为要素的城市空间意象的认知方法。曹越皓提出基于人本尺度观察总结出的城市意象,对于城市特色的塑造与城市结构的优化有重要参考意义,并强调了城市意象在城市设计领域应用前景[16]。目前,Clarifai, CloudCV,Azure Cognitive Services等视觉识别API常常在此领域大展身手。以Clarifai为例,使用者仅需通过API接口输入任意图片,便可获得如下图所示的图像元素关键词和匹配度打分。根据得出的图像-关键词数据,规划师、设计师可以得到大尺度的城市意象信息以供参考。

▲图5:以Clarifai为例的城市意象提炼技术流程[29]

苏黎世联邦理工学院景观可视化与建模实验室,借助语义分割等技术成功实现了三维点云数据的修改与分类,使基于精确现存空间尺度的景观场地数字孪生建模、借助模拟软件或机械臂进行模型推演成为可能[30,31]。Urech等[21]利用该技术,通过激光扫描仪获取新加坡一处铁道-建筑群的三维点云数据,基于分类得到的树叶密度进行城市热能吸收的迭代优化。

利用该工作流程,基于实际场地的数字建模变得准确而高效,可实现高精度的景观过程模拟(如山体滑坡模拟)。同时,分类得出的"树"类点云所包含的高度、冠幅等信息将为碳汇、热能等环境数据计算提供便利,可实现城市景观设计与城市规划之间的量化衔接。

▲图6:三维点云数据分类与数字孪生建模技术流程[32]

将公众与研究者的主观思考纳入评价体系,是AI进行城市观察而不脱离人本主义内核的关键。其中,低门槛的众包式数据收集与利用VR、AR等技术进行的沉浸式体验数据收集具有较高应用潜力。

MIT Media Lab 在2014 年间开展了一个基于众包数据的城市感知评价项目。研究人员在问卷平台向志愿者提供随机的两张街景图片,要求志愿者选择更富生机/压抑/安全等主观感受的一张图片[33]。收集的街景-评分数据通过机器学习相关算法可挖掘出具有普遍性的元素——感知联系,用于预测其他城市的街景图片感知评价。另外,中国地质大学Urbancomp团队研究成果Street View Ratings v1.0,支持人机对抗的图片打分软件,程序根据图片特征和用户已有打分,训练机器学习模型预测当前图片的推荐得分[34]。

除根据照片进行单一打分外,VR等沉浸式的虚拟现实技术为低门槛、高质量的公众感知采集提供了可能。孙漪南等[35]根据60名志愿者对VR全景图中展示场景的综合美景度评分和偏好视角截图,开展基于SBE法(Senic Beauty Estimation Method)的美景度评价。尽管研究未采用计算机视觉技术,通过VR视角获取的截图等信息相对于社交媒体图像、街景图像能够更准确地描述城市空间使用者的需求,是极佳的潜在数据源。

▲图7:基于城市空间元素的主观感知预测技术流程[32/34]

城市风貌和城市公共空间的存量式优化是当前城市建设的重点和难点。《关于进一步加强城市规划建设管理工作的若干意见》中提出了塑造城市特色风貌、营造城市宜居环境的指导思想。然而,在城市设计实践中,对于城市风貌、城市公共空间品质的评价常常面临着数据采集困难与数据分析耗时耗力的困境。因此,目前的城市设计实践往往倾向于使用笼统的、大尺度的遥感数据进行场地的分析调研,错失了发挥场地特有优势、理解在地使用者特有场地体验的机会。

在此背景下,风景园林行业更应充分利用自身基于人本尺度进行设计的丰富经验,结合多源视觉大数据和计算机视觉技术,打造取之于民,用之于民的人本尺度综合数据服务平台。本研究综合分析行业特色、行业需求、以及技术可行性等多方面因素,提出计算机视觉技术在城市设计领域各个阶段的6点潜在应用场景:1) 针对城市设计需求的视觉大数据采集;2)公众参与式的城市设计;3)以循证设计为核心的视觉数据分析;4)基于精确点云数据的分类及参数化建模;5)设计项目的监测与回访;6)面向客户的项目展示及优化

其中,基于设计师采集的视觉大数据、公众评价大数据,结合视觉数据分析手段,基于精确点云数据分类进行的数字孪生建模,在循证设计、人本主义存量型设计不断被强调的趋势下,将为信息一体化的景观信息模型(LIM, Landscape Information Model)、城市信息模型(CIM, City Information Model)提供有效基底,为设计项目的展示和决策提供有力支持。

▲图8:计算机视觉技术在城市设计四个阶段的应用场景[36]

城市观察自提出以来便有鲜明的人本主义立场。借助AI之眼与日益丰富的近人尺度视觉数据,城市设计能够更高效,更广泛地采集"类人"观察的信息,提升城市设计的有效性。截止目前,我们在多个城市更新、城市区域研究项目中进行实践应用。

值得注意的是,在利用AI进行观察与评价的过程中,不能忽视其具有的平均化特点与潜在的数据偏见。与AI不同,人在城市公共空间的体验是动态、连续的,且因自身的社会、经济、文化背景的不同、情绪与既有观念的不同而有行为模式上的差异。因此,基于视觉数据产生的分析结果需要进行谨慎的验证与校核,需要城市空间使用者的真正参与,才能真正做到人本尺度设计中"人"的回归。

 

参考文献与引用声明

相关网页:

中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议 (mofcom.gov.cn)
住房城乡建设部关于加强生态修复城市修补工作的指导意见

相关书籍:

《观察城市》【美】 阿兰·B.雅各布斯(Allan B. Jacobs) 著, 王璐、汤颖颐译, 清华大学出版社,2021.

参考文献:

[1] 雅各布斯 阿兰·B. 著 观察城市[M/OL]. 王璐、汤颖颐, 译. 清华大学出版社, 2021[2022–07–07]. https://book.douban.com/subject/35780487/.

[2] 蒋敏, 卢峰. 宜居城市与宜居街道:艾伦·b·雅各布斯的城市设计理论与实践[J]. 建筑师, 2017(4): 75–83.

[3] 龙瀛, 叶宇. 人本尺度城市形态:测度、效应评估及规划设计响应[J]. 南方建筑, 2016(5): 41–47.

[4] 马琦伟. 基于深度学习的城市街道景观意向识别[J]. 中国建设信息化, 2018(21): 20–21.

[5] 胡一可, 丁梦月, 王志强, 等. 计算机视觉技术在城市街道空间设计中的应用[J]. 风景园林, 2017(10): 50–57. DOI:10.14085/j.fjyl.2017.10.0050.08.

[6] LEE S, MAISONNEUVE N, CRANDALL D, 等. Linking past to present: discovering style in two centuries of architecture[C/OL]//2015 IEEE International Conference on Computational Photography (ICCP). Houston, TX, USA: IEEE, 2015: 1–10[2022–05–11]. http://ieeexplore.ieee.org/document/7168368/. DOI:10.1109/ICCPHOT.2015.7168368.

[7] NEMATOLLAHI M A, SHAHBAZI S, NABIAN N. Computer vision in urban studies: theory, techniques and rules of application[M/OL]//NEMATOLLAHI M A, SHAHBAZI S, NABIAN N. Computer Vision and Audition in Urban Analysis Using the Remorph Framework. Singapore: Springer Singapore, 2019: 41–83[2022–05–13]. http://link.springer.com/10.1007/978-981-13-3543-3_3. DOI:10.1007/978-981-13-3543-3_3.

[8] 刘伦, 王辉. 城市研究中的计算机视觉应用进展与展望[J]. 城市规划, 2019, 43(1): 117–124.

[9] MIT CITY SCIENCE. Introduction " here we build cityscope[EB/OL](2021)[2022–06–07]. https://cityscope.media.mit.edu/.

[10] 亚当·汤姆金斯, 埃卡特·兰格. 增强现实技术于洪水风险沟通中的应用[J]. 风景园林, 2019, 26(9): 93–100. DOI:10.14085/j.fjyl.2019.09.0093.08.

[11] 计算性城市设计实验室(同济大学). 算法驱动型城市设计——大规模城市街道渗透率计算 – tjcud[EB/OL]([日期不详])[2022–06–07].

[12] 城市象限. 猫眼象限[EB/OL]([日期不详])[2022–07–07]. http://pro.urbanxyz.com/index.html.

[13] URBAN DATA EYE. Urban data eye[EB/OL]([日期不详])[2022–07–07]. https://urbandataeye.com/.

[14] KOSTI R, ALVAREZ J, RECASENS A, et al. Context based emotion recognition using emotic dataset[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2019: 1–1. DOI:10.1109/TPAMI.2019.2916866.

[15] RICHARDS D R, TUNÇER B. Using image recognition to automate assessment of cultural ecosystem services from social media photographs[J]. Ecosystem Services, 2018, 31: 318–325. DOI:10.1016/j.ecoser.2017.09.004.

[16] 曹越皓, 杨培峰, 龙瀛. 基于深度学习的城市意象认知方法创新与拓展——以重庆主城区为例[J]. 中国园林, 2019, 35(12): 90–95. DOI:10.19775/j.cla.2019.12.0090.

[17] 城室科技. 城室科技-首页[EB/OL]([日期不详])[2022–07–07]. https://www.citorytech.com/#/.

[18] 周垠, 龙瀛. 街道步行指数的大规模评价——方法改进及其成都应用[J]. 上海城市规划, 2017(1): 88–93.

[19] ZHU Y, DENG X, NEWSAM S. Fine-grained land use classification at the city scale using ground-level images[J]. IEEE Transactions on Multimedia, 2019, 21(7): 1825–1838. DOI:10.1109/TMM.2019.2891999.

[20] BRODU N, LAGUE D. 3D terrestrial lidar data classification of complex natural scenes using a multi-scale dimensionality criterion: applications in geomorphology[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2012, 68: 121–134. DOI:10.1016/j.isprsjprs.2012.01.006.

[21] URECH P R W, DISSEGNA M A, GIROT C, et al. Point cloud modeling as a bridge between landscape design and planning[J]. Landscape and Urban Planning, 2020, 203: 103903. DOI:10.1016/j.landurbplan.2020.103903.

[22] NAIK N, PHILIPOOM J, RASKAR R, et al. Streetscore -- predicting the perceived safety of one million streetscapes[C/OL]//2014 IEEE Conference on Computer Vision and Pattern Recognition Workshops. Columbus, OH, USA: IEEE, 2014: 793–799[2022–05–31]. https://ieeexplore.ieee.org/document/6910072. DOI:10.1109/CVPRW.2014.121.

[23] ENGIN Z, VAN DIJK J, LAN T, et al. Data-driven urban management: mapping the landscape[J]. Journal of Urban Management, 2020, 9(2): 140–150. DOI:10.1016/j.jum.2019.12.001.

[24] 城市象限. 项目-井井有条街道大脑建设[EB/OL]([日期不详])[2022–07–07]. http://urbanxyz.com/sj/11-project-jjytjddnjs/x.html.

[25] 龙瀛, 周垠. 图片城市主义:人本尺度城市形态研究的新思路[J]. 规划师, 2017, 33(2): 54–60.

[26] YE Y, YEH A, ZHUANG Y, et al. "Form syntax" as a contribution to geodesign: a morphological tool for urbanity-making in urban design[J]. URBAN DESIGN International, 2017, 22(1): 73–90. DOI:10.1057/s41289-016-0035-3.

[27] ZHOU X, PARVES RANA M. Social benefits of urban green space: a conceptual framework of valuation and accessibility measurements[J]. Management of Environmental Quality: An International Journal, 2012, 23(2): 173–189. DOI:10.1108/14777831211204921.

[28] 刘先觉. 现代建筑理论[M/OL]. 中国建筑工业出版社, 2008[2022–05–31]. https://book.douban.com/subject/3083784/.

[29] GEOFF B. Urban street network centrality – geoff boeing[EB/OL]([日期不详])[2022–06–08]. https://geoffboeing.com/2018/01/urban-street-network-centrality/.

[30] ETH ZURICH LANDSCAPE MODELLING AND VISUALIZING LABORATORY. Landscape topology: digital landscape design and analysis based on pointcloud modelling technology – professor christophe girot[EB/OL]([日期不详])[2022–06–08]. https://girot.arch.ethz.ch/research/digital-landscape-design-and-analysis.

[31] RICHARD A, VOGEL C, BLAHA M, et al. Semantic 3d reconstruction with finite element bases[C/OL]//Procedings of the British Machine Vision Conference 2017. London, UK: British Machine Vision Association, 2017: 98[2022–06–08]. http://www.bmva.org/bmvc/2017/papers/paper098/index.html. DOI:10.5244/C.31.98.

[32] CHRISTOPHE G. Design studio hs2018 " robotic landscapes ii – professor christophe girot[EB/OL]([日期不详])[2022–07–07]. https://girot.arch.ethz.ch/courses/design-studios/design-studio-hs2018-robotic-landscapesii.

[33] MIT MEDIA LAB. Project overview ‹ place pulse[EB/OL]([日期不详])[2022–06–08]. https://www.media.mit.edu/projects/place-pulse-new/overview/.

[34] Yao, Y., Liang, Z., Yuan, Z., Liu, P., Bie, Y., Zhang, J., … & Guan, Q. (2019). A human-machine adversarial scoring framework for urban perception assessment using street-view images. International Journal of Geographical Information Science, 33(12), 2363-2384.

[35] 孙漪南, 赵芯, 王宇泓, 等. 基于VR全景图技术的乡村景观视觉评价偏好研究[J]. 北京林业大学学报, 2016, 38(12): 104–112. DOI:10.13332/j.1000-1522.20160261.

[36] 成实, 张潇涵, 成玉宁. 数字景观技术在中国风景园林领域的运用前瞻[J]. 风景园林, 2021, 28(1): 46–52. DOI:10.14085/j.fjyl.2021.01.0046.07.

- END -

NEWS

# Previous #
# New #
# Next #