基于D-optimal试验设计的公共交通出行logit模型

李信;杨桥东;曾大

【摘要】A traffic corridor between Chengdu and Longquan district is selected to analyze the public transport travel behavior.Assuming that the subway is opened in the traffic corridor,the D-optimal design is adopted in the stated preference questionnaires.Then,such utility variables as time,cost,sex,age and income are selected to construct the multinomial Logit (MNL)model and the stated preference data are used to calibrate the Logit model to analyze peoples′public transport behavior.Finally,the sharing rate of main traffic modes is forecast.As a result,the analysis shows that the subway will undertake the main part of passenger flow in the traffic corridor.%以成都到龙泉片区的交通通道为研究对象，假设通道开通地铁的情况下，采用D-optimal试验设计意愿调查问卷，选择费用、时间等变量以及个人属性作为效用变量，建立公共交通出行的多项logit模型，结合意愿调查数据对模型进行求解，分析通道中公共交通出行选择行为，并预测成都到龙泉片区主要交通方式的客流分担率。分析表明，地铁将承担通道中大部分的客流。

【期刊名称】《山东交通学院学报》

水银肥肠

【年(卷),期】2014(000)001

【总页数】6页(P33-38)

【关键词】公共交通出行;D-optimal试验设计;意愿调查;多项logit模型

【作者】李信;杨桥东;曾大

【作者单位】西南交通大学交通运输与物流学院，四川成都 610031;西南交通大学交通运输与物流学院，四川成都 610031;西南交通大学交通运输与物流学院，四川成都 610031

【正文语种】中文

【中图分类】U491

诺和灵

离散选择模型是描述人们选择行为的模型，广泛应用于具有选择行为的社会各个方面，在

交通工程界的应用主要有需求量预测、政策评价、交通服务效益评价等。离散选择模型是基于效用函数最大化的假说，以Logit模型应用最为广泛，假设效用函数的概率项服从二重指数分布。Logit模型中需要的数据主要采用意愿调查(Stated Preference，SP)得到，意愿调查获取假设情景下出行者的偏好或者选择结果[1-2]。意愿调查的问卷设计方法有多种，应用比较多的是正交设计法，但本文采用一种新的试验设计方法——D-optimal试验设计法进行问卷设计，该方法的本质是使模型的渐进协方差矩阵的行列式最小，本质是使模型参数的标准误差最小，从而得到更可靠的参数估计结果，进而能够更精确的分析出行者的出行偏好。

1.1 D-optimal试验设计原理

D-optimal试验设计的目的是使模型渐进协方差矩阵的行列式Derror最小，则模型参数估计的标准差也就越小，参数估计的精度就越高，确保所选属性水平的组合方案能够最大程度体现受调查者出行选择时的偏好信息最大化[3]。

多项Logit(MNL)模型的对数似然函数L为幼儿舞台服装

式中 yni为列矩阵，选择枝i在选择情景中被回答者n选择时，yni值为1，反之为0；Pni 为选择模型中选择枝i被出行者n选择的概率；I为选择枝总数；N为出行者总数。

定义的选择模型考虑一个特殊的选择数据集，使式(1)最大化，得到参数的最大似然估计量。岭南空间

渐进协方差矩阵Ω可以计算为Logit模型的对数似然函数L的海赛矩阵逆矩阵的负数[4-6]。海赛矩阵H中的元素计算式为

式中 Xikn为选择枝i中属性k的值，该值不随出行者n改变；βik为选择枝i中属性k的系数；K为试验设计中需要标定的一般参数的总数量。

1.2 D-optimal试验设计

1)定义选择枝集合、选择枝属性以及属性水平

假设成都地铁2#线东沿线开通，成都到龙泉片区交通出行的选择枝集合为：大巴、公交车、出租车、私家车、地铁。利用SP调查问卷采集出行者从成都到龙泉片区的选择偏好的

数据。选择枝属性定义时，应选能够有效反应选择枝特性且不具有相关性的属性。在定义选择枝属性水平时，每个属性的水平个数不需要相等，属性水平定义越多，在效用空间中能够得到的信息量越大，但属性水平的个数会影响试验组合个数，因此，应适当选择[7]。选择枝属性水平的选取应结合实际情况，适当增加和减少相应的比例，结合从成都到龙泉片区各种交通方式的实际出行时间，根据两地距离和地铁的运行速度计算出车内时间，最后确定选择枝的属性及属性水平定义如表1所示。

2)计算参数的预先值

D-optimal试验设计法需要先计算参数的预先值。调查问卷采用正交设计，采集192组观测结果，利用采集的数据对MNL模型进行参数估计，参数估计结果为属性参数的预先值，从而得到5个选择枝中属性参数的预先值，如表2所示。

3)设计试验组合

根据表1定义的选择枝属性以及属性水平，利用全因子设计法可以有648个试验组合，把这648个试验组合作为候选试验组合。本文使 D-optimal试验设计的试验组合数为32个。根据

pitstop

D-optimal试验设计的步骤，利用Matlab软件编程，从具有648个组合的候选矩阵中任意挑选32个试验组合，计算Derror，重复迭代，得出使Derror最小的32个试验组合，该Derror为0.065。

同样，为了减少被调查者的调查情景数，得到更可靠的调查数据，把32个组合随机分成8块，由8个被调查者来完成，每个被调查者完成4个组合情景，再加上个人属性等问题的选择，构成完整的问卷。试验组合示例如表3所示。

2.1 模型建立

Logit模型是基于随机效用最大化理论的假设。根据效用最大化理论，出行者总是选择具有最大出行效用的出行方式，出行者n选择第i种出行方式的概率Pn(i)为

式中 Uni为出行方式i对于出行者n的效用；Unj为出行方式j对于出行者n的效用；Cn为选择枝集合。

效用Uni、Unj与出行方式的属性和出行者本身属性相关。随机效用理论认为效用是一个随机变量，并将效用函数U分为可以观测的影响因素所构成的固定项(V)和不可观测的影响因

素所构成的随机项(ε)两大部分，并假设它们呈线性关系。因此交通方式i对出行者n的效用函数可以表示为

式中 α为选择枝i的常数项；βk为每个选择枝的效用中属性k的权重，即选择枝属性的参数值；λm为每个选择枝的效用中出行者属性m的权重，即出行者属性的参数值；Sinm为出行者n属性m的值。

当εni服从相互独立的Gumbel分布时，可以得出Multinomial logit(MNL)模型的一般式，logit模型中出行者n选择第i种出行方式的概率[8]为

2.2 数据分析

基于D-optimal试验设计法的一份问卷包括32个选择情景，每个被调查者完成4个选择情景。在实际调查中不仅采集被调查者的年龄、收入、性别等个人信息，而且被调查者必须回答在不同的费用与出行时间组合情况下首选的交通方式。每份问卷包含多个完全独立的情景，被调查者需要对其中调查内容做出回答。此次，调查对象为1 344人，男性占50.2%。样本中拥有私家车的出行者占41%，样本平均年龄为32.8岁，年龄的分布如图1如

示，其中男性和女性的平均年龄差距比较小，总体平均年龄分别是33.4岁和32.2岁。样本总体月平均收入为3 788元，与成都市居民的月平均收入相差不大，样本的收入分布比例如图2所示。

MNL模型效用参数的标定通过软件NLOGIT 3.0实现。NLOGIT软件可以实现多项式选择数据的估测、模拟和分析，已经成为估计和模拟多项离散选择模型的首要软件。把调查的数据样本数量1 344输入标定软件，NLOGIT软件利用最大似然估计法得到模型参数的标定结果，如表4所示。由表4可得，似然函数值为1 004.118，拟含优度为0.37。

一般离散选择模型的拟合优度为0.2～0.4时，代表模型的拟合度较好，所建模型的拟合优度为0.37，模型拟合度较好，说明所建模型正确。由表4可知，广义变量“费用”、“到站时间”、“候车时间”、“车内时间”以及“下车到目的地时间”的参数值均为负值，表示费用越高，选择该种交通方式的概率越小，出行时间越长，选择该种交通方式的概率越小，与实际相符。

通过t检验值的绝对值判断该参数值所对应的属性是否能够显著影响出行者的选择行为。通常，在5%置信度区间下，如果t检验的绝对值>1.96，则认为该属性能够显著影响出行者的

选择行为，反之则认为该属性对出行者的选择行为不会造成显著影响。根据模型结果，变量“费用”、“到站时间”、“车内时间”t检验的绝对值均>1.96，表明这3个属性对出行者的选择行为具有显著影响。

出行者的个人属性也作为解释变量进入模型，由表4可知，选择枝大巴、公交车和地铁对应变量“收入”的参数值均为负数，说明收入越高，选择这几种交通方式的概率越小。出租车对应变量“收入”的参数值为正数，表明收入越高，选择出租车的概率就会越大。“是否拥有私家车”对私家车的使用有着显著地影响，拥有私家车的出行者在出行上非常依赖于私家车。

将表4的模型标定参数值代入式(2)可以得出5种出行方式对出行者的效用。

t5004

如：一年龄28岁的男性出行者，月收入5 600元，无私家车，针对表3中的第4种组合的出行方式，分别计算选择5种出行方式的概率。

当出行者性别为男时，属性值为1；性别为女时，属性值为0；拥有私家车时，属性值为1，否则为0；年龄为25～30岁时，属性值为3；收入为4 000～6 000元时，属性值为3。将表4中相应的数据代入式(2)，计算大巴对该出行者的效用为

V1=3.328-0.028 9×10-0.108 9×20-0.020 9×15-0.034 2×40-0.031 7×15+0.351 6×1+0.036 9×3-0.292 6×3=-1.713 0.

本文发布于:2024-09-23 09:23:18，感谢您对本站的认可！

本文链接：https://www.17tex.com/xueshu/633851.html

上一篇：H-矩阵最小奇异值的一个下界

下一篇：计算机控制技术(第二版)课后习题答案(王建华主编)