本文内容来源于《测绘通报》2022年第1期,审图号:GS(2022)103号
顾及属性特征的城市设施热点识别方法
康磊1, 刘海砚1, 程维应2, 陈晓慧1, 李静1
1. 信息工程大学, 河南 郑州 450001;
2. 32137部队, 河北 张家口 075001
基金项目:国家自然科学基金(41801313)
关键词:核密度估计 极值点 热点 属性特征 城市设施
引文格式:康磊, 刘海砚, 程维应, 等. 顾及属性特征的城市设施热点识别方法[J]. 测绘通报,2022(1):8-14. DOI: 10.13474/j.cnki.11-2246.2022.0002.
摘要
摘要:研究城市设施的热点分布对把握当前城市形态具有重要意义。传统的设施热点识别方法容易忽略设施的特征尺度且多以区域识别为主,缺少精准化提取设施热点的方法体系。针对上述问题,本文提出了一种顾及属性特征的设施热点识别方法,并以北京市住宅设施为例进行了试验分析。首先将设施的属性值作为权重,进行加权核密度估计生成密度值表面,利用极值点探测模型提取极值点;然后采用Getis-OrdGi*统计进行空间自相关分析,生成具有显著统计学意义的热点区域,筛选极值点得到热点。结果表明,该方法能够准确有效地识别设施热点并进行合理的等级划分,为城市设施空间布局研究提供多样化视角。
正文
城市设施服务于城市的经济活动和社会活动,是城市发展的先行基础条件,决定了城市的发展潜力。受人类活动的影响,城市设施往往在局部地理空间下呈现聚集特征,通常将这种聚集称之为热点[1-2]。但从广义上看,热点并不完全等同于数量的聚集,其属性特征也应当作为热点形成的重要考量。现有的相关研究容易忽略同类别设施的特征尺度,据此识别的热点仅具有空间特征,分析应用不够深入。与融入属性特征识别出的设施热点进行对比分析,能够为探索城市空间的设施格局和未来规划提供更加广阔的视角。
从方法上看,目前关于城市设施热点的识别多数是对热点区域的探测,常用的方法有3种:一是通过空间聚类的方法提取聚集模式、剔除噪声点后,生成边界作为热点区域[3-5];二是通过核密度估计的方法得出大致的热点区域[6-8],直观地分析热点区域的分布;三是划分空间单元后利用划分单元的属性值进行空间自相关分析[9-12],定量化地研究样本分布的空间聚集特征和热点区域。
设施热点区域分布一定程度上反映了城市的空间形态,但是对于更加细致的分析需求,需要提取设施热点的精准位置并进行量化赋值,体现热点的大小层次。相关研究中,文献[13]提出了一种密度场热点探测模型,以获取确切的热点峰值,为深入分析城市设施的空间分布结构和规模等级结构提供了有效的方法借鉴。然而,该模型缺少量化统计评价的干涉,得到的“热点”只能称之为极值点,并不是真正意义上的热点,密度值高于多少的极值点可以被判定为热点需要经过进一步地探讨。针对以上问题,本文提出一种顾及属性特征精准化提取城市设施热点的方法。
1 热点探测方法
具体步骤为:首先,基于包含属性值的城市设施数据进行加权核密度估计生成密度栅格;然后,用极值点探测模型生成极值点,同时创建与研究区域范围相等渔网与生成的密度栅格进行空间连接,将密度值作为格网的计数点,并利用Getis-Ord Gi*统计进行空间自相关分析,生成热点区域;最后,将落入热点区域内的极值点作为实际热点。技术路线如图 1所示。
图 1 技术路线
图选项
1.1 加权核密度估计
核密度估计是常用的点模式分析方法,其函数模型较好地表现了地理学第一定律的距离衰减效应,能够表达城市设施服务影响的连续性特征[14-16]。但常规的核密度估计中所有设施点在局部范围内具有相同的密度分布,无法体现设施影响强度的差异。加权核密度估计可以较好地解决这个问题。如图 2(a)显示的是模拟数据的常规核密度估计结果,相比而言,图 2(b)在属性值较大的区域表现出了更强的密度分布,反映了样本属性差异(白色数字)的影响。
图 2 核密度估计比较
图选项
加权核密度估计的公式如下
(1)
式中,D(s)为点s处的预测密度;r为搜索半径(即带宽);n为点s带宽范围内的样本点个数;ci为带宽范围内的具体样本点;dsci为点s与ci之间的距离;ω为权重系数,即样本点的属性信息。
带宽r的选择会对分析结果产生较大影响。带宽太小会导致密度估计值分布于设施点附近的较小范围内,设施对邻接区域的影响体现不明显,整体特征表达欠佳;带宽太大会导致生成的密度栅格过于平滑,概化程度高,不能很好地体现设施分布的局部差异。
在带宽的选取上,通常的做法是基于Silverman经验规则[17]带宽公式进行估算,能够防止稀疏数据集在密度估计过程中出现点周围的圆环现象。但在考虑权重的情况下,带宽与权重数值的大小成反比,当ω的平均值远大于1时,相对于不考虑权重(权重为1),计算得到的带宽会很小,导致密度估计值的分布会向中心聚焦。其现实意义为,权重越大(ω>1的情况下)的城市设施影响范围反而越小,与实际情况不符。因此,在该场景下使用Silverman经验规则计算带宽是不合适的,需要综合研究区域的尺度、样本数据的分布情况及城市设施的实际影响,人为设置合适的带宽。
1.2 基于加权核密度估计的极值点探测模型
(加权)核密度估计生成的密度表面是具有不同数值的栅格单元,类似于数字高程模型(digital elevation model,DEM),因此,可以借鉴通过DEM数据提取山顶的思路,进行密度表面的极值点探测。首先对密度栅格进行焦点统计搜索邻域范围内的密度最大值生成最大值表面;然后将其与原始密度栅格进行求减运算得到非负值表面,其中,值为0的像元即为极值点所在位置;最后使用重分类法将0值像元与非0值像元进行区分,提取0值像元转点后赋予核密度估计结果对应像元值,得到最终极值点。具体流程如图 3所示。
图 3 极值点探测模型
图选项
利用分级符号表示极值点的等级划分,极值点识别结果比较如图 4所示。可以看出,是否考虑属性特征对探测结果影响明显。图 4(a)中,基于常规核密度估计方法得到的极值点等级与样本点的空间分布密度呈正相关,图 4(b)中,使用属性值进行加权后的极值点呈现出不同的等级分布。
图 4 极值点提取结果比较
图选项
1.3 基于加权核密度估计的空间自相关分析
空间自相关分析是一种空间统计方法,可以定量地描述要素属性在空间上的关联关系,揭示空间变量聚集特征[18]。Getis-Ord Gi*统计是常用的空间自相关分析方法,用于反映样本属性在空间上的高值和低值的聚集程度,即“热点区域”和“冷点区域”。以核密度估计值连接的空间单元为基本要素进行Getis-Ord Gi*统计,能够识别出密度栅格中的高值聚集区域,进而从极值点中筛选出热点,回答“哪些极值点是热点”的问题。其计算公式为
(2)
式中,xj是要素j的属性值,本文中为格网单元对应的密度估计值;n为研究区域所划分网格单元的总数量;ωi,j为要素i、j的空间权重;
,表示所有划分单元的密度均值;
。
Gi*也称为z得分,具有显著的统计学意义。当z>0时,z得分越高,高值的聚集程度就越高,形成热点;当z< 0时,z得分越低,低值(冷点)的聚集程度就越高,形成冷点。与z得分对应的p值代表空间聚集的显著性水平,可以通过对z得分或p值选取满足置信度区间的区域作为热点或冷点,典型的置信度为90%、95%或99%,对应的z得分和p值见表 1。本文选取置信度95%,即z得分>1.96或p值小于 < 0.05的热点单元作为热点区域。
表 1 不同置信度下的z得分和p值
表选项
对图 2中的核密度估计结果进行Getis-Ord Gi*统计,识别出的热点区域如图 5所示。可以看出,图 5定量化地表达了设施分布密度的聚集程度,区分出了不同置信区间下的冷热点分布,图 4提取的7个极值点中,有5个位于热点区域内,是具有显著统计学意义的热点。
图 5 Getis-Ord Gi*统计结果比较
图选项
2 试验分析
为进一步探究本文方法的应用效果,以北京市的住宅设施为研究对象进行试验分析。对于城市住宅,房价是综合政治、经济、区位等各方面因素影响的最终价值体现,将其作为反映设施权重的属性特征值,数据来源为链家网获取的2020年12月北京市房价数据。设施点的数量共31775条,分布于北京市的16个行政区。
为清晰准确地反映设施的密度分布,将核密度估计的像元大小设置为50m×50m,同时将渔网设置为50×50的格网单元,使得各点位的密度值能够一对一映射到相同位置的格网单元,以便于进行热点区域的提取。在带宽的选取上,为了能够对区域尺度和样本点的离散程度有清晰的认识,首先在不考虑设施属性特征的情况下使用Silverman经验规则计算得到带宽估计值,然后以此为基础进行带宽的调整,经过多次测试,最终选择2500m作为理想带宽,该带宽下提取的热点既能体现设施分布的整体特征,又能表现不同区位的局部差异。
按照本文方法的实施步骤,试验从核密度估计与极值点提取、显著性热点区域提取及设施热点提取结果3个方面进行对比分析。
2.1 核密度估计与极值点提取结果对比
利用核密度估计和极值点探测模型,得到研究区域的密度分布和极值点,如图 6(a)和图 6(b)所示,分别表示不顾及属性特征(不加权)和顾及属性特征(加权)情况下的结果。两种方法得到的绝对密度值会有量级上的差别,可通过选择合理的符号化分类,将各自的密度区间进行合理分级,便于进行对比分析。自然间断点分级法可按照类内方差最小、类间方差最大的方式设定分类间隔,符合应用需求,因此本文选用该方法对核密度估计结果进行分类。图 6中,从全局上看,两种方法得到的热点区域分布相似性较强,均以五环以内的中心城区为主,向周边区域辐射,其中,顺义区与通州区的热点区域与核心城区的连接性相对较弱。从局部上看,图 6(a)在东城区、朝阳区和丰台区交界处生成范围性的高密度区域,通州区的2个热点区域与大兴区的1个热点区域与其密度相当;而图 6(b)在东城区和朝阳区交界处出现了竖条状的高密度连接带,其余各区形成的热点区域密度明显低于该竖条状连接带。
图 6 核密度估计与极值点提取结果
图选项
2.2 显著性热点区域提取结果对比
首先,将试验2.1生成的密度值连接到对应位置的格网单元,作为其输入字段进行Getis-Ord Gi*统计,得到具有统计学意义的冷热点格网;然后,选取p值小于0.05(或z得分大于1.96)的格网单元进行合并,得到住宅设施的热点区域分布,为更加清晰地对比两种方法的差异,以压盖关系的方式对结果进行显示,如图 7所示。可以发现,顾及属性特征后,北京市中心城区(五环以内)及向北延伸至昌平区的热点区域面积相对较大,特别是在海淀区识别出了大面积的新热点区域;而位于中心城区以外的其他地区热点区域面积相对较小,特别是在密云区和平谷区,相较于不顾及属性特征减少2个热点区域。
图 7 显著性热点区域
图选项
2.3 设施热点提取结果对比分析
通过试验2.1、2.2分别得到具有密度估计值的极值点和显著性热点区域,落入热点区域的极值点被视为最终的设施热点。使用自然间断点法将热点分为6级,如图 8所示。提取热点的差异主要体现在数量、位置和等级3个方面。
图 8 设施热点
图选项
(1) 热点数量变化。两种方法得到的极值点数量分别为131、132个,具有显著性统计学意义的热点数量对应为50、49个,总体数量差别不大。具体到各区,相比于图 8(a),图 8(b)在朝阳区、房山区、石景山区和东城区热点识别出了更多的热点,在大兴区、丰台区、密云区和平谷区的热点数量相对更少。新增和减少的热点反映了对应区位餐饮设施的整体质量与设施数量的相对关系,热点增加意味着位于新热点出现的区域设施的整体质量要优于数量特征;反之,热点减少意味着热点消失的区域设施数量特征优于整体质量。两种方法中,西城区的极值点数量和热点数量均为0,东城区识别的热点均位于与其他城区的交界位置。这说明无论是仅考虑位置分布还是顾及价值权重,西城区和东城区均不是住宅设施的热点聚集的区域,与首都功能核心区的特殊定位相吻合。
(2) 热点位置变化。主要体现在融入属性特征后部分设施热点发生了偏移。其中,中心城区的热点没有发生明显的位置变化,说明中心城区的住宅设施集中度较高且热点周边区域的房价较为均衡;偏移的热点多数位于海淀区北侧、石景山区西侧、房山区、大兴区、通州区、顺义区和昌平区等中心城区以外区域,说明在偏移区位的住宅设施分布比较分散且局部范围内房价差异明显。热点位置是否发生变化一定程度上体现了区域发展的成熟度及配套设施的完善程度,理想状态下两种方法识别出的热点应当保持空间上的一致性,因此,热点发生偏移的地区是下一步资源要素配置和基础设施建设关注的重点。
(3) 热点等级变化。热点的等级是一个相对划分,代表该热点密度值的相对大小。与图 8(a)相比,图 8(b)中原本位于东城区东侧与朝阳区交界处的二级热点和三级热点变为一级热点和二级热点,加上新增的1个一级热点,该交界处共形成2个一级热点和1个二级热点,是高等级设施热点最集中的区域;海淀区识别出的热点均有等级上的提高,由原来的1个四级热点、3个五级热点和2个六级热点变为3个三级热点、1个四级热点、1个五级热点和1个六级热点。参考北京区域统计年鉴2020[19]中的经济、人口等数据,顾及属性特征后的朝阳区和海淀区的热点等级划分更加符合区域的发展情况。此外,位于通州区的2个一级热点及其他中心城区以外区域的多数热点都在等级上有所降低,说明对应区位的住宅设施在数量上有一定规模和集中度,但是价值上与中心城区有一定差距。其中,通州区的设施热点变化体现了其作为规划的北京城市副中心承担的疏解中心城区功能人口的作用,以及当前配套设施和功能节点建设不够完善的现状。
综合以上试验,从全局上看,相比单纯采用极值点探测模型提取的极值点(如图 6所示),经过热点区域筛选出的热点(如图 8所示)的空间分布均符合北京城市总体规划(2016年—2035年)[20]欲构建的“一核一主一副、两轴多点一区”的城市空间结构(如图 9所示[20]),说明了本文热点识别方法体系的有效性。是否考虑属性特征造成了热点在数量、位置和等级上的局部差异,相比较而言,不进行加权识别出的热点主要反映设施在局部范围内的数量特征;进行加权识别出的热点兼顾了设施的数量特征和属性特征,为设施布局提供了更加深入的描述,丰富了分析视角。
图 9 北京市市域空间结构规划[20]
图选项
3 结语
鉴于当前基于核密度估计精准化提取热点方法缺少显著性评价且忽略设施差异的问题,本文提出了一种精准化提取城市设施热点的方法。首先利用城市设施点的属性进行加权核密度估计并提取极值点,顾及了设施的特征尺度;然后对密度估计结果进行空间自相关分析,以提取热点区域用于极值点的筛选,得到了具有显著统计学意义的热点;最后以北京市的住宅设施为例进行了试验分析。结果表明,本文方法的识别结果与城市当前发展、规划的空间结构保持较高的一致性,能够为优化设施布局和城市问题分析提供更加深入的信息服务。
作者简介
作者简介:康磊(1993-), 男, 硕士, 主要研究方向为地理信息系统技术与应用。
E-mail: xxgcdxkl@163.com
初审:杨瑞芳
复审:宋启凡
终审:金 君
往期推荐
资讯
○ 司南导航与北斗同行的十年:技术革故鼎新,应用水到渠成
○ 国家基础地理信息中心公开招聘2022年应届博士研究生
○ 中海达2022春招正式开启!全国三大类热招岗位等你!
○ 安徽理工大学空间信息与测绘工程学院研究生招生调剂预通知
会议
○ Geoinformatics 2022 暨CPGIS成立30周年年会(二号通知)
○ 会议通知 | 第三届IEEE地质、测绘与遥感国际学术会议
○ 关于召开大地测量与导航2022年综合学术年会的通知(第一轮)
○ 诚邀莅临丨“新测绘 新融合 新跨越”南方测绘2022用户大会
《测绘学报》
○ 测绘学报 | 杨高朝:基于抗差LM的视觉惯性里程计与伪卫星混合高精度室内定位
○ 测绘学报 | 刘万科:非完整约束的OD/SINS自适应组合导航方法
○ 测绘学报 | 李德仁:论万物互联时代的地球空间信息学
○ 测绘学报 | 闫凤池:顾及双程声径的常梯度声线跟踪水下定位算法
《测绘通报》
○《测绘通报》2021年第12期目录
○ 《测绘通报》2022年第1期目录
○ 地市级实景三维城市建设及应用
○ 图残差神经网络支持下的建筑物群组模式分类
《北京测绘》
○《北京测绘》2022年第1期摘要推荐
○《北京测绘》2021年第12期摘要推荐
○《北京测绘》2021年第11期摘要推荐
○《北京测绘》2021年第10期摘要推荐
《测绘科学技术学报》
○ 摘要 |《测绘科学技术学报》2021年第2期摘要推荐
○ 摘要 |《测绘科学技术学报》2021年第4期摘要推荐
○ 摘要 |《测绘科学技术学报》2021年第5期摘要推荐
○ 摘要 |《测绘科学技术学报》2021年第6期摘要推荐
《地球信息科学学报》
○ 《地球信息科学学报》2022年第1期佳文推介
○ 龚健雅院士:全球位置信息叠加协议与位置服务网技术研究进展与展望
○ 佳文推介 | 大数据城市通勤交通模型的构建与模拟应用
○ 专刊征稿:社会感知与地理大数据挖掘(征稿中)
《测绘工程》
○ 摘要 |《测绘工程》2021年第5期摘要推荐
○ 摘要 |《测绘工程》2021年第4期摘要推荐
○ 摘要 |《测绘工程》2021年第6期摘要推荐
○ 佳文推介 | 单目视觉技术在室内定位中的应用研究
《中国空间科学技术》
○ 火卫二地形地貌探测综述
○《中国空间科学技术》2022年第1期摘要
○《中国空间科学技术》2021年第6期摘要
○《中国空间科学技术》2021年第5期摘要推荐
《卫星应用》
《Journal of Geodesy and Geoinformation Science》
○《测绘学报(英文版)》专刊征稿 | 地图学与地球空间信息教育:理论与实践
○ 《测绘学报(英文版)》专刊征稿 | 用于三维地理信息的摄影测量和计算机视觉
○ Kexian WANG et al. | 《测绘学报(英文版)》(JGGS)精选论文
○ Li LIU et al. | 《测绘学报(英文版)》(JGGS)精选论文
《Satellite Navigation》
○ 徐元博士:面向有色测量噪声下UWB/INS组合行人导航的分布式卡尔曼滤波| SANA佳文速递
○ 杨飞博士:GNSS天顶对流层精化模型的构建与分析| SANA佳文速递
○ 姚铮教授:北斗PPP服务信号调制复用方案设计与质量评估| SANA佳文速递
○ 2022征文| SatNav“普适定位、室内导航与基于位置服务”专题
《自然资源遥感》
○ 《自然资源遥感》入驻“智绘科服”融媒体平台!
○ 《自然资源遥感》征稿:“海岸带空间资源及生态健康遥感监测”专栏
○ 摘要 |《自然资源遥感》2021年第3期摘要推荐
○ 摘要 |《自然资源遥感》2021年第4期摘要推荐
《Journal of Geovisualization and Spatial Analysis》
○《Journal of Geovisualization and Spatial Analysis》入驻“智绘科服”融媒体平台!
○ JGSA国际期刊2021年第5卷第2期论文摘要
○ 高被引论文推荐 | Journal of Geovisualization and Spatial Analysis