中国城市网络结构及空间关联性——来自“网络流”数据的分析

第42卷第2期2021年%月
财经理论与实践(双月刊)THETHEORYANDPRACTICEOFFINANCEANDECONOMICS
Vol.42No.2
Mar.2021
王耀中,黄选爱
(长沙理工大学经济与管理学院,湖南长沙410114)"
-经济管理•DOI:10.16339/jkihdxbcjb.2021.02.015
中国城市网络结构及空间关联性
—来自“网络流”数据的分析
摘要:基于中国城市之间的关联特征和溢出效应,将人力资本变量纳入引力模型,运用社会网络分析和机器学习方法并依据主要节点城市的有向数据,考量城市网络结构及其关联性#结果显示:新引力模型可
有效衡量样本城市的网络关联效应,金融状况、港口距离和高等教育资源丰裕度是决定城市引力流量重要原
因,政府干预对城市引力流作用不明显;城市空间分布呈现明显的四级分层特征,但从人力资本对城市引力
流影响看,作为中心城市的广州和深圳在网络拓扑中心的稳定性相对较弱#
关键词:社会网络分析%网络流%引力模型;城市结构
中图分类号:F127文献标识码:A文章编号1003-7217(2021)02-0112-07
—、弓I言
目前我国城市空间联系变得非常普遍,已经超越了单纯地理学意义上的“近邻”关系,并逐步呈现出多方向的网络结构形态[1,],究其原因,除了要素自由流动形成的关联效应外,还源于协调资源配置的区域政策旧。这种独特的城市网络发展态势不仅降低经典的空间均衡模型的解释力,而且加大了统计实证的困难。这主要体现在以下两个方面:一方面,为扭转沿海优先发展策略引发的空间发展格局扭曲,大西部开发、东北振兴、中部崛起等一系列区域协调发展政策相继出台;另一方面,随着市场化和城市化深入推进,地区之间资本和人口流动变得更加频繁,统计某时期流动人口在不同城市就
业、收入和社保等相关数据变得异常困难。2017年我国农村到城市务工的流动人口数量接近2.45亿人,他们来自全国不同地区,工作地点却主要集中在发达的沿海城市及一些中西部省会城市等近些年来,不同地方政府制定了更为严格的区域发展政策,例如北京和上海等超大城市减少住宅土地供应以限制人口规模,而其他的城市却大力吸引人口流入,上述现象让传统的计量模型解决内生性变得更加棘手。
本研究认为城市“网络流”是分析城市空间网络出发点,而城市引力则是城市网络流的核心,因此,本文一项重要工作就是验证城市引力模型分析中国城市空间网络的合理性,这里讨论城市网络结构所使用的引力模型涉及城市人均产出、人力资本、人口规模和两地高速公路距离等核心变量。传统空间计量方法分析地区经济活动的空间网络关系时,往往局限于经济地理学上的“相邻”地区,很少考虑城市“网络流”的大小和方向。事实上,中国东、中、西区域发展“相互关联”关系非常强,它们地理上并不相邻,但在经济活动互动性很强,除了落后地区企业向发达地区学习先进的公司治理结构外,还有很多来源于政府因素)56,例如官员异地交换任职。这些地区关联性使得传统空间计量方法得到的结论可能有偏误。
空间网络中有方向的关联数据也称为“网络流(network flow)"数据,Taylorp J(2010)也认为"关联数据”另一说法就是“网络流”⑺。“网络流”体现了城市关联网络的有向性,例如,长沙与湘西之间人口流动是双向的,但是从湘西流入到长沙的人口远远大于其相反方向;即便资本流动,两城市之间的流动状况也
不是完全对称的。“网络流”体现了城市之间实际发生的有方向的直接关联。地区交通联系支撑了物流变动,国家间贸易关系反映了资本流的存
"收稿日期:2020-11-05
基金项目:国家社会科学基金项目(18CJL032)
作者简介:王耀中(1953+),男,湖南益阳人,博士,长沙理工大学经济与管理学院教授,博士生导师,研究方向:现代服务业与城市发展.
2021年第2期(总第230期)王耀中,黄选爱:中国城市网络结构及空间关联性113
在。当然,人口流、资本流和物流等经济活动的空间变动可以使用引力模型构建关联矩阵。新引力模型是根据城市规模、人力资本与空间距离来体现的(城市规模越大,人力资本越高,引力就越大;而两地距离越大,引力就越小。引力模型主要以“网络流/作为基本分析元素,描述不同城市间互动程度和网络关系,并在统计过程中采用图论思想描述这种“关 联”「8*。之前运用网络分析方法研究了国际贸易、金融一体化的网络关系及其特征「79*。但是这些网络流研究很少讨论城市结构,更没有验证中国城市网络引力现象。
迄今,也有一些文献使用引力模型和社会网络方法分析区域发展和能源问题。例如,刘华军等(2015)
利用中国省际能源消费数据,并采用社会网络分析原理分析能源消费空间网络结构特征时发现,由于政府与市场的双重作用,中国各地区的空间关联关系呈现复杂的网络结构,且其网络稳定性逐步增强「1011*。目前使用“网络流”分析中国城市发展问题的研究也逐渐活跃起来,李敬等(2014)用网络方法讨论中国区域经济增长空间关联问题「2*,姚永玲(2020)利用社会网络分析法和关联矩阵讨论了我国的“大城市病”和“收缩城市”问题「12*,但是他们使用VAR Granger causality衡量空间溢出效应,这个方法与已有研究的思想很相似:1314](
为解决当前研究的相对不足,本文将从以下几个方面进行研究。一是采用社会网络分析(SNA)方法和机器学习的方法讨论了城市空间网络引力流结构及其决定因素。二是在原引力模型中加入了人力资本权重以扩展成新引力模型(gravity models),利用产生的有向关联数据(Relation Data),经由泊松似然估计建模,讨论39个样本城市的网络引力流规律和区域经济发展趋势。三是在甄别影响城市引力流量的多种因素中,使用了机器学习的两种经典模型一岭回归和lasso估计,以数据驱动的算法来解决多重共线性和内生问题。
二、引力流数据与建模过程
(一'方法与数据
城市网络流来源于中国39个不同区位层级的典型城市①,通过这39个网络节点就会产生39X38维有向
数据,可大概代表整个城市空间网络变动基本态势。传统引力模型有关理论认为,城市引力由各城市经济发展水平(人均GDP)、人口规模数和城市距离确定。考虑到我国存在特殊的区域协调政策、土地制度和人口流动现象,在原传统引力模型中加入了人力资本变量,因为人力资本越高的地区,创业创新越活跃,吸引大量人流、物流和资本流,形成集聚经济,提高地区生产效率,并依此累积循环。所以城市i到城市%引力流表示为:
其中,f j表示城市i到城市%人流、物流和资本流等经济活动的空间流动状况及联系程度,f表示城市%到城市i人流、物流和资本流等经济活动的空间流动状况及联系程度,这意味着城市之间经济外溢具有方向性,图1展示了f v引力流分布情形(式(1)P i、P%分别代表城市i、j的人口数量;m”、M分别代表P i、P%的权重,考虑两个城市之间的劳动人口创业创新能力的差异,本文将城市人力资本(Human capital)加入模型中o/、V%分别代表城市i和城市%的经济发展水平,用城市人均GDP 表示d代表城市i与城市%之间的地理距离,以城 市之间高速公路距离DistRd(km)衡量(数据来源于百度地图),Eric和Gdbor(2014)认为道路长度能影响区域之间经济活动联系,该距离能一定程度上说明不同地区经济溢出情况以及要素流动成本,这与刘华军等(2015)使用引力模型来识别空间溢出关系类似)510*。
注:图1量化结果显示城市之间引力流有明显的右偏态特征,平均值受极大值影响较大。
图1城市之间引力流
不同地区经济发展速度和城市生产效率提升,与投资水平、金融发展、地理区位以及政府干预均存在很强的关联性,这里将影响地区引力流的具体指标和选取方法列在表1中
114
财经理论与实践(双月刊)
2021 年第2 期
表1变量选取及说明
变量名称
说明
板块区域
按照年鉴划分为四大区域,东部地区城市设为4,东北城市设为3,中部地区城市设为2,西部地区城市设为1
这里基于可利用港口的便利性来衡量,港口城市设为
港口距离
4,沿海省份的其他非港口城市设为3,中部和东北地区 城市设为2,其他城市设为12012 年
人均GDP 地区经济发展禀赋
信贷增速
一定时期内贷款规模增长的平均值衡量金融状况 用劳动力平均接受教育年数作为替代,其计算公式为:人
力资本(HmalCt )值 =文盲、半文盲的就业人口比重X1.
人力资本
5 +接受小学教育的就业人口比重X7. 5 +接受初中教育
的人口比重X10.5 +接受高中教育的人口比重X13.5 + 接受大专及以上的就业人口比重X17
货运量用一定时期内公路货运量的平均值衡量,该指标一定程
度上反应了城市的运输条件
固定资产投资
用一定时期内全社会固定资产投资总额平均值表示
建设用地反映了政府对要素流动、企业选择和产业扩张产生的影
面积增速响,这里用平均增速衡量
用一定时间段内城市建设用地面积变异系数衡量,例如
建设用地面积
2003〜2011年某城市建设用地面积数量的标准差除以变异系数
其平均值,若这种相对波动较强,意味政府干预的力度
较大
财政收支比反映政府对地区引力流的影响程度
城市规模
用一定时期段内市辖区人口的平均值来衡量
结果如表2所示。
(二)城市网络流及其网络结构特征
在很多网络流的建模和预测中,使用了流
(flow )数据定量分析网络的结构和相关优化算法。
这里记G  = [,E )表示一个网络图,由于流(flow )
从起始点到终点具有方向性,所以G 是一个有向 图)6* ,图的G 边称为链路(link ),网络流类似origin
— destination 矩阵。本文所关注的是某城市作为节
点i 到另一城市节点j 的城市网络引力流f % ,此时
F  =
*称为引力流量矩阵(traffic  matrix )。本文
利用引力模型的式(1)的计算方式和相关观测数据,
建立F= [f ]矩阵,进而建立模型,共有39个城市 节点,即有39X38 = 1482个城市网络流量数据。
由于城市网络引力流f 是由式(1)求出的,而
引力模型的验证过程中,需要将引力流数据做如下 处理,即将每个九乘以5后除以F  = [f *中的最 小值,将数据转化为伪计数,记做Flowcnt ,其目的
是将引力流变为计数形式,产生泊松分布,以方便建
立均值函数和引力模型统计推断。当节点表示城市
时,这些Flowcnt 计数视为城市网络图有向边的权 重,利用R 软件igraph 函数生成可视化图2。
通过复杂的技术计算,将重要指标测算和统计
注:除标有特殊注明年份外,表2中变量值是2012 — 2018年的平均值,目的是获得一段时间的普遍规律,避免异常年份的波动.1.89E-07表2
变量描述性统计
国民党王牌军覆灭记变量
样本数均值标准差
中位数
最小值最大值
人均GDP 增长速度1482  1.071
0.041
1.0810.942  1.149人均 GDP  平均值(元)
148253394.482
34051.432
39606.666
12866.167
153035.406
四大板块1482  2.461
1.278214港口距离分类
1482  2.282  1.0362
14
2012年人均GDP (元)
148239052.089
24701.720
31121
8877
110420.74
辖区人口(万人)
1482290.886309.635
150.19640.173
1395.69
信贷平均增速1482  1.1050.025  1.103
1.053  1.181
交通货运量(万吨)
148215694.51213203.855114822682
66040固定资产投资(万元)148226321151.560
22829894.8216095505
2720671
80123050
建设用地面积增速
1482  1.1310.295
1.047
0.802
2.511建设用地面积变异系数
1482  1.285  5.573
0.1001
0.01135.234
财政收支比1482  2.581
1.481
1.978
0.952
6.94
两地距离(km )
14821395.715713.2011323.5713993
2018年城市人均GDP
148274553.282
39718.901
6372523399
184068人力资本
14829.2770.817
9.307
8.018
12.501
f i
1482
马林科夫261.1461559.47233.748  1.89E —0730229.95
表示为1.89 * 10 7 ;基础数据来源于《中国统计年鉴》《中国城市统计年鉴》和wind 数据库。
2021年第2期(总第230期)
王耀中,黄选爱:中国城市网络结构及空间关联性
115
Network  gravity  flow  of  39 typical  cities  in  China
图3将人力资本差距作为引力模型的权重的网络流分布
注:节点圆形面积表示引力流总量,引力流出部分用白表示, 深表示引力流入,链路的宽度反映起点到终点的引力流。
南北乱世情图2城市引力网络图
图2展示了利用引力模型和引力流数据得到的 网络图,中国城市呈现明显的四级结构,全国性中心
城市、区域性中心城市、区域性地理“中介”城市及边 缘城市。北京、上海、深圳、广州无疑是中国城市网
络引力最大的城市,而且处于网络最中心位置;杭 州、武汉、长沙、郑州、西安是区域性网络中心位置;
开封、荷泽、渭南、萍乡、衡阳、黄石是区域性地理“中
介”城市;四平、阜新、齐齐哈尔、海东,昭通、钦州是 边缘城市(
将人力资本差距作为权重的引力流网络图如图
3所示,结果显示,产生超强网络超级中心城市为北
京、上海,而其他城市网络地位不明显。尽管关于城
市人力资本统计和度量不完备,但上述结果仍部分 地显示人力资本对城市网络引力的重要作用(
综上,构建的城市网络引力模型f %是可行的,
接下来需要进一步讨论城市区位、投融资状况以及 政府干预等具体解释变量与城市网络引力流的
关系。
(三)对城市引力流影响因素的估计
为了提高模型的准确度,需要尽可能全面地考 虑解释变量,比如将区位因素、金融投资状况、人力 资本水平和政府干预等因素都囊括进来,但严重共
性问题随之而来,对此使用了机器学习的两种经典
严格自律
模型一岭回归和lasso 估计进行处理。首先,将 信贷增速、人力资本、货运量、固定资产投资和财政
收支比等13个解释变量纳入回归式(2)进行拟合。
Y  = 00 +01X ⑴ + …+ 0P X p  +0* 乙 + % (2)
采用机器学习算法将估计系数往零方向进行压 缩,即采用正则化方法排除部分与模型无关的变量(
在最小二乘回归RSS 基础上,岭回归增加了增加压 缩惩罚项入'#,其中P  & 13,通过下式最小化获
% = 1
得岭回归系数:
n
p  P
(3 )
lasso 估计增加压缩惩罚项|#丨,并通过
% = 1
式(4)最小化其估计系数:
n
p  P
(4)
通过将式(3)(4)最小化得到回归系数估计值,
使用十折交叉验证法来获得调节参数!值(fold 参 数设置交叉验证为10)o 对!值进行岭回归模型拟
合和lasso 估计,结果如表3所示。
表3结果显示,变量中人均GDP 增长速度、港
口距离和信贷平均增速在不同的估计情形下,其系
数较大且趋势一致。这意味着地区生产效率、地理 区位和金融情况影响了城市引力流量动向,高等教
育资源和交通的便捷度(用交通货运量表示)也会部
分地增加城市引力流。此外,财政收支比的负系数 表明长期依靠政策支持或者财政转移的地区,并不
能产生更强的经济活力,同时建设用地面积增速系 数也为负,
说明中央政府对落后地区土地政策的照
116财经理论与实践(双月刊)2021年第2期
顾,并没有产生很强的实际性经济效果(
表3基于机器学习方法的回归结果
指标变量
岭回归系数asso系数
(1)2)3)⑴2)
Intercept—1951.108—2369.057—1720.476—511.564—509.428人均GDP增长速度414.604512.262  5.662
人均GDP平均值0.0030.0030.0070.007四大板块7.04310.781  3.8410.0000.000港口距离分类18.95822.18323.2110.4720.504
2012人均GDP0.0040.0060.0040.0000.000辖区人口0.0250.0230.0300.0000.000
信贷平均增速1154.3511445.8501345.183319.340322.671高等教育资源0.1380.1760.1360.0020.002
竹镂舟蛾交通货运量0.0040.0040.0040.0040.004
固定资产投资0.0000.0000.0000.0000.000建设用地面积增速—4.047—5.057—0.676—2.262—2.085
建设用地面积变异系数  1.002  1.577  1.1630.0000.000财政收支比—13.930—12.176—11.897—0.152—0.136 A263.293215.569263.29313.10413.104
MSE3437962.0003439113.0003438097.0003498173.0003498170.000注:表中空白表示不将该变量纳人模型的情形(MSE是测试的的均方误差,高等教育资源用2012-2018年城市普通高校在校人数/城市年末总人口的平均值衡量(
(四)
城市引力流的稳健性检验
为进一步检验城市网络引力流模型,借用Eric 和Gdbor(2014)对引力模型的界定)5*,将城市网络引力流九计数转化为计数形式f;,f*具有独立的泊松分布,且均值函数形式满足
Eff;)=m I(i)m J(j)m S(c;)(5) m、)j和)s分别是起点i、终点j和向量c;的正函数,分别称之为起点函数,终点函数及制约(deterrence)函数。根据极大似然估计对引力模型统计推断思路,将中国城市网络引力模型修正为:E(f:)=)#i*)#i,)#(c;)(6)
此时引力模型中选择的起点函数和终点函数变为
m I(i)={p Ii)a,m Z(i)=(j*)#(7)
分离函数为
)s(c:)=(c)+(8)对式(6)进行对数化处理,便产生了有向引力流的泊松似然估计值。根据上文机器学习的城市引力流量的回归结果,逐步将人均GDP增速(X1)、港口距离(X2)、信贷平均增速(X3)、财政收支比(X4)、高等教育资源(X5)和交通货运量(X6)等解释变量加入如下泊松似然估计模型中:
模型1:
logi0(f i)='1logl0(X1)+'2logi0(X z)+
a>3l o gi0(X3)+'4l o g10(X4)+4i(9)
模型2:
l o gi0(f i)='i logi0(X1)+'2log"(X z&+
'3l Og10(X3)+'4l o g10(X4)+'5l o g10(X5)+
4(10)模型3:
og10f i j*)='1og10X1)+'2og10X2)+
徐阶'3og10X3)+'4og10X4)+'5og10X5)+
'l l o g10(X6)+(11)极大似然估计使用了牛顿迭代算法以获得参数渐进性正态性,将模型结果展示见表4。
模型2、模型2和模型3结果显示,独立泊松分布似然估计讨论引力流量与机器学习算法的回归结果系数正负方向基本一致,说明这39个城市样本数据中使用引力f j测算城市网络流量是合理的,唯一的差别是交通运输条件(以交通货运量衡量)系数结果显示为0,但经过数据标准化处理后,系数变为0.221。另一项重要发现是,经过标准处理后,高等教育资源(高校学生在城市人口中占比)系数变得很大,对城市引力产生巨大推动作用,这间接说明了人力资本存量相对较大的地区会增加其城市引力流。金融投资状况(信贷平均增速)和城市区位(港口距离)是影响城市引力流向的指向标,长期依赖财政转移支付的落后地区城市引力流入量并不高。

本文发布于:2024-09-21 16:46:58,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/152222.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:城市   引力   网络   模型   空间   地区
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议