学术笔谈

用数据科学来支撑城市规划
作者:李栋(北京清华同衡规划设计研究院有限公司技术创新中心常务副主任,中国城市科学研究会大数据专委会委员,中关村大数据产业联盟智库专家)

从几年前大数据热的兴起开始,时下人工智能(artificial intelligence,AI)相关领域异常火爆,各类概念层出不穷,也导致了一些认识上的混淆与偏颇,不利于在城市规划行业中持续健康的引入新技术。简单而言,可将此类方法粗略划分为信息技术(informationtechnology,IT)和数据技术(datatechnol-ogy,DT),信息技术本质上是服务于信息传播的技术,诸如远程通信、互联网、以及其上构建的社交、电商、资讯等诸多应用。而数据技术则是借助机器的计算能力,对数据进行清理、分析、建模和挖掘的技术,其背后的支撑理论被称之为数据科学(datascience)。数据记录了现实世界各类主体的行为,借助数据科学人们可以全面了解城市的状态、思考和发掘潜藏规律与逻辑,有助于采取各种规划策略等改善措施。换句话说,数据科学是关乎于认知、思考和决策的学科方法。无论数据的来源是机器采集抑或人工记录,只要数据集的体量、内容达到一定规模,数据科学都能发挥重要作用。将包含信息采集在内的整个流程实现自动化后,才有可能演化出人工智能的某种雏形,很显然现实中远未达到这样的理想水平。因此当前谈论的人工智能,尤其是适用于多种问题的通用人工智能(general artificialintelligence,GAI),仍仅仅是在表述一种构想而非实用的工具。

城市是一个物理存在、开放复杂、快速进化的巨系统,与边界明确、规则清晰的棋类游戏或者IT软硬件系统有明显差异。在城市规划中直接应用人工智能还面临许多挑战,其中数据和算法的问题首当其冲。在数据方面,美国三院院士、伯克利教授MichaelI.Jordan近期撰文《人工智能:革命远未到来》,以医学诊断为例,他指出由于基础数据采集质量的局限,实验室中精细调教的算法在现实应用中会暴露出大量的问题,给医生诊断带来直接风险。他打了个比喻,“虽然人工智能大工程的积木块已经有了,但是把这些积木块组合在一起的原则还没有出现,所以这些积木的组合仅仅以特例的方式存在”。而在算法方面,Facebook首席AI科学家YannLeCun近期也谈到,AlphaGo类的强化学习算法需要大量的试错样例才能学会给定的规则,而现实中此类试验由于成本巨大导致根本无法开展(例如无人驾驶、新城建设等)。尤为重要的是现实世界中无法加速时间,AlphaGo利用并行计算在几小时内开展无限次训练的方式无法被复制。由于数据、算法、规则、标准等等挑战尚未解决,使得人工智能在真实世界中的应用还处在浅层局部。

但也必须看到,在数据科学的指引下开展定量城市研究,毫无疑问能给整个规划行业带来显著提升。在近年来的实际项目中,笔者所在团队也尝试过多种数据科学手段,如利用常见于语音识别中的长短期记忆网络算法(longshort-termmemo-
ry,LSTM)进行城市人口时空分布的短期预估等,取得了一定成效。笔者认为,通过规划师与计算机的人机交互和协同来改进工作,或可称之为另一种AI:增强智能(augmentedintelli-gence,AI),采用计算的方式来改进而非替代规划师的智力、判断力和创造力。综上,笔者认为倡导将数据科学工程化、业务化应用于规划行业的路径,将是一种更加务实可行的方式。