驾驶员命令预测的制作方法



1.本公开涉及用于驾驶员命令预测的系统和方法。


背景技术:



2.在开发用于车辆运动控制的模型预测控制器时,假设驾驶员输入命令在有限范围内保持不变,在有限范围内预测车辆的状态。该假设可能不准确,因为驾驶员有时会对动态道路状况做出反应。因此,这种假设会导致次优的预测控制动作。
3.所期望的是一种用于驾驶员命令预测的技术。


技术实现要素:



4.本文提供了一种驾驶员命令预测器。驾驶员命令预测器包括控制器、多个传感器和命令预测单元。控制器被配置成响应于多个实际驾驶员命令和多个未来驾驶员命令来命令调整车辆相对于道路的一个或多个运动矢量。在当前时间处接收多个实际驾驶员命令。在多个更新时间处接收多个未来驾驶员命令。所述多个更新时间的范围从当前时间到未来时间。所述多个传感器被配置成响应于如所命令的一个或多个运动矢量生成确定车辆的多个实际状态的多个传感器数据。命令预测单元被配置成响应于驾驶员模型在多个更新时间处生成所述多个未来驾驶员命令。驾驶员模型对所述多个实际驾驶员命令和所述多个实际状态进行操作,以在多个更新时间处预测所述多个未来驾驶员命令。
5.在一个或多个实施例中,驾驶员命令预测器包括被配置成生成道路信息的一个或多个信息装置。驾驶员模型对道路信息进行操作,以在多个更新时间处生成多个未来驾驶员命令。
6.在驾驶员命令预测器的一个或多个实施例中,驾驶员模型是深度学习模型。
7.在驾驶员命令预测器的一个或多个实施例中,深度学习模型被配置成基于所述多个实际驾驶员命令和多个车辆动态特性生成多个期望的车辆状态。
8.在驾驶员命令预测器的一个或多个实施例中,命令预测单元生成多个未来驾驶员命令,以使所述多个期望状态符合所述多个实际状态。
9.在驾驶员命令预测器的一个或多个实施例中,命令预测单元被配置成通过对所述多个未来驾驶员命令与所述多个实际驾驶员命令的比较来生成多个结果,并基于所述多个结果更新驾驶员模型。
10.在驾驶员命令预测器的一个或多个实施例中,控制器将所述多个实际驾驶员命令视为在当前时间和未来时间之间的多个常数。
11.在驾驶员命令预测器的一个或多个实施例中,控制器包括驾驶员命令解释器和模型预测控制器,驾驶员命令解释器被配置成响应于所述多个实际驾驶员命令和多个未来驾驶员命令来生成多个中间命令,模型预测控制器响应于所述多个中间命令和所述多个未来驾驶员命令来命令在多个更新时间处调整车辆的一个或多个运动矢量。
12.在驾驶员命令预测器的一个或多个实施例中,未来时间在当前时间之后100毫秒
至500毫秒的范围内。
13.本文提供了一种用于驾驶员命令预测的方法。该方法包括响应于多个实际驾驶员命令和多个未来驾驶员命令,命令调整车辆相对于道路的一个或多个运动矢量。电路在当前时间处接收多个实际驾驶员命令。该方法还包括响应于如所命令的一个或多个运动矢量生成确定车辆的多个实际状态的多个传感器数据,以及响应于驾驶员模型在多个更新时间处生成多个未来驾驶员命令。所述多个更新时间的范围从当前时间到未来时间。驾驶员模型对多个实际驾驶员命令和所述多个实际状态进行操作,以在多个更新时间处预测所述多个未来驾驶员命令。
14.在一个或多个实施例中,该方法包括生成道路信息。驾驶员模型对道路信息进行操作,以在多个更新时间处生成多个未来驾驶员命令。
15.在该方法的一个或多个实施例中,驾驶员模型是深度学习模型。
16.在该方法的一个或多个实施例中,深度学习模型被配置成基于所述多个实际驾驶员命令和多个车辆动态特性生成多个期望的车辆状态。
17.在该方法的一个或多个实施例中,生成多个未来驾驶员命令以使所述多个期望状态符合所述多个实际状态。
18.在一个或多个实施例中,该方法包括通过对所述多个未来驾驶员命令与所述多个实际驾驶员命令的比较生成多个结果,并基于所述多个结果更新驾驶员模型。
19.在该方法的一个或多个实施例中,所述多个实际驾驶员命令被视为当前时间和未来时间之间的多个常数。
20.本文提供了一种车辆。该车辆包括多个驾驶员控制器和驾驶员命令预测器。所述多个驾驶员控制器被配置成生成多个实际驾驶员命令。驾驶员命令预测器被配置成响应于所述多个实际驾驶员命令和多个未来驾驶员命令来命令调整车辆相对于道路的一个或多个运动矢量。在当前时间处接收多个实际驾驶员命令。驾驶员命令预测器还被配置成响应于如所命令的一个或多个运动矢量生成确定车辆的多个实际状态的多个传感器数据,并响应于驾驶员模型在多个更新时间处生成多个未来驾驶员命令。所述多个更新时间的范围从当前时间到未来时间。驾驶员模型对所述多个实际驾驶员命令和所述多个实际状态进行操作,以在多个更新时间处预测所述多个未来驾驶员命令。
21.在车辆的一个或多个实施例中,驾驶员命令预测器包括被配置成生成道路信息的一个或多个信息装置,其中,驾驶员模型对道路信息进行操作以在多个更新时间处生成多个未来驾驶员命令。
22.在车辆的一个或多个实施例中,驾驶员模型是深度学习模型,并且深度学习模型被配置成基于所述多个实际驾驶员命令和多个车辆动态特性生成多个期望的车辆状态。
23.在车辆的一个或多个实施例中,驾驶员命令预测器生成多个未来驾驶员命令,以使所述多个期望状态符合多个实际状态。
24.本发明提供了以下技术方案:1. 一种驾驶员命令预测器,包括:控制器,其被配置成响应于多个实际驾驶员命令和多个未来驾驶员命令来命令调整车辆相对于道路的一个或多个运动矢量,其中,所述多个实际驾驶员命令是在当前时间处接收的,所述多个未来驾驶员命令是在多个更新时间处接收的,并且所述多个更新时间
的范围是从当前时间到未来时间;多个传感器,其被配置成响应于如所命令的一个或多个运动矢量生成确定车辆的多个实际状态的多个传感器数据;和命令预测单元,其被配置成响应于驾驶员模型在多个更新时间处生成所述多个未来驾驶员命令,其中,所述驾驶员模型对所述多个实际驾驶员命令和所述多个实际状态进行操作,以预测所述多个更新时间处的多个未来驾驶员命令。
25.根据技术方案1所述的驾驶员命令预测器,进一步包括:一个或多个信息装置,其被配置成生成道路信息,其中,所述驾驶员模型对所述道路信息进行操作,以在所述多个更新时间处生成所述多个未来驾驶员命令。
26.根据技术方案1所述的驾驶员命令预测器,其中,所述驾驶员模型是深度学习模型。
27.根据技术方案3所述的驾驶员命令预测器,其中,所述深度学习模型被配置成基于所述多个实际驾驶员命令和多个车辆动态特性生成多个期望的车辆状态。
28.根据技术方案4所述的驾驶员命令预测器,其中,所述命令预测单元生成多个未来驾驶员命令,以使所述多个期望状态符合所述多个实际状态。
29.根据技术方案1所述的驾驶员命令预测器,其中,所述命令预测单元还被配置成:通过对所述多个未来驾驶员命令与所述多个实际驾驶员命令的比较生成多个结果;以及基于所述多个结果更新所述驾驶员模型。
30.根据技术方案1所述的驾驶员命令预测器,其中,所述控制器将所述多个实际驾驶员命令视为当前时间和未来时间之间的多个常数。
31.根据技术方案1所述的驾驶员命令预测器,其中,所述控制器包括:驾驶员命令解释器,其配置成响应于所述多个实际驾驶员命令和所述多个未来驾驶员命令生成多个中间命令;和模型预测控制器,其响应于所述多个中间命令和所述多个未来驾驶员命令,命令在所述多个更新时间处调整所述车辆的所述一个或多个运动矢量。
32.根据技术方案1所述的驾驶员命令预测器,其中,所述未来时间在当前时间之后100毫秒至500毫秒的范围内。
33.一种用于驾驶员命令预测的方法,包括:响应于多个实际驾驶员命令和多个未来驾驶员命令,命令调整车辆相对于道路的一个或多个运动矢量,其中,所述多个实际驾驶员命令由电路在当前时间处接收;响应于如所命令的一个或多个运动矢量,生成确定所述车辆的多个实际状态的多个传感器数据;以及响应于驾驶员模型在多个更新时间处生成所述多个未来驾驶员命令,其中,所述多个更新时间的范围从当前时间到未来时间,并且所述驾驶员模型对所述多个实际驾驶员命令和所述多个实际状态进行操作以预测所述多个更新时间处的所述多个未来驾驶员命令。
34.根据技术方案10所述的方法,进一步包括:生成道路信息,其中,所述驾驶员模型对所述道路信息进行操作,以在所述多个更
新时间处生成所述多个未来驾驶员命令。
35.根据技术方案10所述的方法,其中,所述驾驶员模型是深度学习模型。
36.根据技术方案12所述的方法,其中,所述深度学习模型被配置成基于所述多个实际驾驶员命令和多个车辆动态特性生成多个期望的车辆状态。
37.根据技术方案13所述的方法,其中,生成所述多个未来驾驶员命令,以使所述多个期望状态符合所述多个实际状态。
38.根据技术方案10所述的方法,进一步包括:通过对所述多个未来驾驶员命令与所述多个实际驾驶员命令的比较生成多个结果;和基于所述多个结果更新所述驾驶员模型。
39.根据技术方案10所述的方法,其中,所述多个实际驾驶员命令被视为所述当前时间和所述未来时间之间的多个常数。
40.一种车辆,包括:多个驾驶员控制器,其被配置成生成多个实际驾驶员命令;和驾驶员命令预测器,其被配置成:响应于所述多个实际驾驶员命令和多个未来驾驶员命令,命令调整所述车辆相对于道路的一个或多个运动矢量,其中,所述多个实际驾驶员命令是在当前时间处接收的;响应于如所命令的所述一个或多个运动矢量,生成确定所述车辆的多个实际状态的多个传感器数据;以及响应于驾驶员模型在多个更新时间处生成所述多个未来驾驶员命令,其中,所述多个更新时间的范围从当前时间到未来时间,并且,所述驾驶员模型对所述多个实际驾驶员命令和所述多个实际状态进行操作以预测所述多个更新时间处的所述多个未来驾驶员命令。
41.根据技术方案17所述的车辆,其中,所述驾驶员命令预测器还包括:一个或多个信息装置,其被配置成生成道路信息,其中,所述驾驶员模型对所述道路信息进行操作,以在所述多个更新时间处生成所述多个未来驾驶员命令。
42.根据技术方案18所述的车辆,其中:所述驾驶员模型是深度学习模型;并且所述深度学习模型被配置成基于所述多个实际驾驶员命令和多个车辆动态特性生成多个期望的车辆状态。
43.根据技术方案19所述的车辆,其中,所述驾驶员命令预测器生成所述多个未来驾驶员命令,以使所述多个期望状态符合所述多个实际状态。
44.当结合附图时,从以下对实施本公开的最佳模式的详细描述中,本公开的上述特征和优点以及其他特征和优点将变得显而易见。
附图说明
45.图1是图示根据一个或多个示例性实施例的车辆背景的示意图。
46.图2是根据一个或多个示例性实施例的驾驶员命令预测器的示意图。
47.图3是根据一个或多个示例性实施例的示例驾驶员命令的示意图。
48.图4是根据一个或多个示例性实施例的有限范围内的示例驾驶员命令的曲线图。
49.图5是根据一个或多个示例性实施例的用于驾驶员命令预测的方法的流程图。
50.图6是根据一个或多个示例性实施例的驾驶员模型训练方法的流程图。
51.图7是根据一个或多个示例性实施例的用于驾驶员模型的学习技术的流程图图8是根据一个或多个示例性实施例的驾驶命令预测方法的流程图。
52.图9是根据一个或多个示例性实施例的期望状态计算方法的流程图。
53.图10是根据一个或多个示例性实施例的驾驶员模型适应方法的流程图。
54.图11是根据一个或多个示例性实施例的用于预测驾驶员命令的方法的流程图。
55.图12是根据一个或多个示例性实施例的短期方向盘命令的曲线图。
具体实施方式
56.本公开的实施例总体上提供了用于预测短期驾驶员命令以增强车辆预测控制的结构和/或技术。该结构和技术在预测范围内的多个采样时间的每一个期间预测驾驶员短期命令。预测可以基于当前车辆状态、先前车辆状态、驾驶员命令、道路信息和/或车辆上可用的传感信息。传感信息通常包括视觉信息、地图信息、雷达信息等。预测的驾驶员命令随后用于计算车辆运动预测控制的增强。车辆运动预测控制被重新制定以结合预测的驾驶员命令来实现期望的矢量运动,特别是横向运动和横摆运动,以支持车辆的最大横向抓地力。
57.参考图1,根据一个或多个示例性实施例图示了说明车辆80的背景的示意图。车辆80在道路82上移动。车辆80包括多个驾驶员控制器86、运动致动器88和驾驶员命令预测器100。车辆80可被驾驶员84占用。驾驶员84安置在车辆80的车厢中。
58.实际驾驶员命令信号102可以由驾驶员84使用驾驶员控制器86生成。实际驾驶员命令信号102由驾驶员命令预测器100接收。实际驾驶员命令信号102至少包括转向分量、加速分量、制动分量和档位选择分量。预测运动命令信号104由驾驶员命令预测器100生成,并被传递到运动致动器88。预测运动命令信号104至少向运动致动器88传送转向命令、加速命令、制动命令和档位选择命令。
59.车辆80实施为汽车(或轿车)。在各种实施例中,车辆80可以包括但不限于客车、卡车、自主车辆、气体动力车辆、电动车辆、混合动力车辆和/或摩托车。可以实施其他类型的车辆80来满足特定应用的设计标准。
60.车辆80具有车辆动态特性90。车辆动态特性90包括加速特性90a、制动特性90b和转向特性90c。车辆80相对于道路82的运动可以被描述为一个或多个运动矢量92。运动矢量92包括纵向矢量92a、横向矢量92b和横摆矢量92c。
61.驾驶员84是车辆80的使用者。驾驶员84手动控制车辆80中的各种功能。在各种实施例中,驾驶员84可以通过向驾驶员控制器86中输入手动命令来控制转向、加速、制动和档位选择。
62.驾驶员控制器86实施安装在车辆80内部并由驾驶员84使用的多个装置。驾驶员控制器86可操作以向驾驶员84提供输入传感器和输出指示器。驾驶员控制器86可以包括方向盘、加速器踏板、制动踏板、换档选择、速度计、档位选择指示器、罗盘航向等。可以实施其他驾驶员控制器86来满足特定应用的设计标准。
63.运动致动器88实施多个机电装置。运动致动器88可操作以响应于预测运动命令信
号104而引起车辆80的运动和取向(或方向)的变化。
64.驾驶员命令预测器100实施自适应预测控制器。驾驶员命令预测器100可操作来在有限的预测/控制时间范围内命令改变车辆80的运动。有限范围可以在大约几十毫秒(ms)(例如,100 ms)到几百毫秒(例如,500 ms)的范围内。在各种实施例中,有限范围可以是250 ms。可以实施其他持续时间来满足特定应用的设计标准。
65.驾驶员命令预测器100响应于实际驾驶员命令信号102和多个未来驾驶员命令,命令运动致动器88调整车辆80相对于道路82的一个或多个运动矢量92。实际驾驶员命令在当前时间处在实际驾驶员命令信号102中被接收。响应于驾驶员模型,在多个更新时间处在驾驶员命令预测器100内部生成未来驾驶员命令。驾驶员命令预测器100还响应于如所命令的一个或多个运动矢量92生成确定车辆80的多个实际状态的传感器数据。更新时间在当前时间和未来时间之间。驾驶员模型对车辆80的实际驾驶员命令和实际状态进行操作,以预测在更新时间处的未来驾驶员命令。
66.参考图2,根据一个或多个示例性实施例示出了驾驶员命令预测器100的示例实施方式的示意图。驾驶员命令预测器100通常包括控制器110、多个传感器112、命令预测单元114、存储器116和一个或多个信息装置118。控制器110包括驾驶员命令解释器120和模型预测控制器122。命令预测单元114包括驾驶员模型124。存储器11可操作性以于存储多个车辆状态126。
67.车辆80的运动矢量92由传感器112感测。命令预测单元114和驾驶员命令解释器120从驾驶员控制器86接收实际驾驶员命令信号102。预测运动命令信号104由模型预测控制器122生成并呈现给运动致动器88。
68.车辆状态信号130由存储器116生成,并呈现给命令预测单元114和模型预测控制器122。车辆状态信号130携载车辆状态126(当前状态和过去状态)。道路信息信号132由信息装置118生成,并由命令预测单元114接收。道路信息信号132传送由信息装置118收集的关于道路82和车辆80周围环境的信息。该环境可以包括其他车辆、障碍物、天气、行人等。
69.未来驾驶员命令信号134由命令预测单元114生成,并呈现给控制器110中的驾驶员命令解释器120和模型预测控制器122。未来驾驶员命令信号134将预测的未来驾驶员命令传递给控制器110。中间命令信号136由驾驶员命令解释器120生成,并呈现给模型预测控制器122。中间命令信号136携载在有限范围内保持恒定的采样驾驶员命令。传感器信号138由传感器112生成,并由存储器116接收。传感器信号138携载由传感器112产生的传感器数据。
70.控制器110实施预测电路。控制器110可操作来预测稍微到未来的驾驶员命令(例如,100毫秒至500毫秒),并利用预测来引起运动致动器88的改变。向运动致动器88请求的改变引起考虑了车辆动态特性90的车辆80的运动矢量92的改变。
71.传感器112实施多个机电传感器。传感器112可操作以将车辆80的物理运动的变化转换成传感器信号138内的传感器数据。传感器数据被处理并作为车辆状态126存储在存储器116中。传感器112可以包括但不限于加速度传感器和内部运动传感器。
72.命令预测单元114实施短期预测技术。命令预测单元114利用车辆状态126、实际驾驶员命令和道路信息(过去和当前)来预测有限范围内的未来驾驶员命令。预测的驾驶员命令在未来驾驶员命令信号134中呈现给控制器110。
73.存储器116实施数据存储装置。存储器116可操作以存储从传感器数据导出的车辆状态126,并在车辆状态信号130中呈现车辆状态126。在各种实施例中,存储器116可以包括非易失性存储器和/或易失性存储器。
74.驾驶员命令解释器120依赖于车辆状态126、当前驾驶员命令和未来驾驶员命令来确定车辆80在预测/控制范围内的横向运动和横摆运动。通过考虑未来预测的驾驶员命令,驾驶员命令解释器120为预测/控制范围计算更精确的横向运动和横摆运动控制。驾驶员命令解释器120可以假设当前驾驶员命令在预测/控制范围内保持恒定(例如,不变)。
75.模型预测控制器122可操作以基于未来驾驶员命令信号134、中间命令信号136和车辆状态126生成预测运动命令信号104。未来预测驾驶员命令的结合使得模型预测控制器122能够准确地控制车辆80的运动,因为考虑了驾驶员命令变化。
76.驾驶员模型124实施深度学习模型。驾驶员模型124对驾驶员84的估计行为进行建模。在各种实施例中,驾驶员模型124是神经网络模型。在其他实施例中,驾驶员模型124是递归模型。
77.参考图3,示出了根据一个或多个示例性实施例的示例驾驶员命令的示意图。驾驶员命令可以包括实际驾驶员命令和预测的驾驶员命令的序列。驾驶员命令至少包括未来转向命令序列160、制动命令序列162和加速命令序列164。
78.实际驾驶员命令可由驾驶员控制器86生成,并以实际驾驶员命令信号102传递到控制器110和命令预测单元114。实际驾驶员命令可至少包括在当前时间k处接收的当前转向命令δk、当前制动命令βk和当前加速度命令αk。可实施其他当前驾驶员命令以满足特定应用的设计标准。
79.预测的驾驶员命令可由命令预测单元114生成,并以未来驾驶员命令信号134呈现给控制器110。预测的驾驶员命令可包括至少在更新时间k、k+1、

、k+p处的未来转向命令序列δ
k+1
至δ
k+p
、未来加速度命令序列α
k+1
至α
k+p
以及未来制动命令序列β
k+1
至β
k+p
。有限范围的范围可从当前时间k到未来时间k+p。通过利用电流命令δk、βk和αk两者,控制器110提供增强的控制性能。可以实施其他预测的驾驶员命令来满足特定应用的设计标准。
80.参考图4,示出了根据一个或多个示例性实施例的示例有限范围的曲线图170。曲线图170包括第一轴线172和第二轴线174。第一轴线172以跨越从当前时间k到未来时间k+p的预测周期176的时间单位图示。第二轴线174图示了各种信号的幅度。
81.曲线180是恒定曲线,其图示了在没有命令预测单元114的情况下驾驶员命令预测器100确定驾驶员84想要发生的情况。曲线180图示了来自驾驶员84的假定恒定命令输入。
82.曲线182是参考曲线,其图示了驾驶员命令预测器100在考虑命令预测单元114时确定驾驶员84想要发生的情况。曲线184图示了驾驶员命令预测器100的预测输出。曲线186图示了基于曲线184中的预测输出的车辆80的实际响应。
83.曲线190是实际驾驶员命令序列的示例。曲线192示出了将当前驾驶员命令视为常数。曲线194图示了由命令预测单元114生成的预测驾驶员命令。曲线196图示了由命令预测单元114生成并被控制器110利用的预测控制输入。
84.在将实际驾驶员命令视为常数(常数曲线180)的情况下,第一误差200可存在于曲线180和实际输出曲线186之间。在包括命令预测单元114来估计在到未来的几个时间点处的驾驶员命令的情况下,在预测输出曲线184和实际输出曲线186之间可存在第二误差202。
在该示例中,预测和利用未来驾驶员命令导致与第一误差200相比更小的第二误差202。
85.参考图5,根据一个或多个示例性实施例示出了用于驾驶员命令预测的方法210的示例实施方式的流程图。方法(或过程)210由驾驶员命令预测器100和非车载计算机实施。如图所示,方法210包括步骤212至224,利用实时反馈路径226和更新反馈路径228。步骤的序列作为代表性示例示出。可以实施其他步骤顺序来满足特定应用的标准。
86.车辆80可以被认为是一个系统,该系统根据固有动力学和驾驶员命令进行响应。辅助驾驶员84的运动致动器88增强了车辆操纵性能。车辆运动控制受限于运动致动器88和轮胎的能力。
87.模型预测控制器122在多个操作点处提供实时、最优、受约束的解决方案。驾驶员模型124帮助预见驾驶员转向和踏板命令,并允许时变输入估计在预测/控制范围内建模。当驾驶员命令预测器100实施反馈控制技术时,驾驶员预测输入也可用于使用控制车辆动力学方程来重新计算状态变量。此外,提供了与计算的驾驶员意图进一步一致的精确的操纵预测。
88.在方法210中,可以在步骤212中执行组建活动,以收集用于训练驾驶员模型124的数据。组建活动可以在车辆80外部且离线地执行。在步骤214中训练驾驶员模型124。该训练通常涉及深度学习模型,该模型基于使用实际驾驶员控制器的驾驶员84的行为来调谐。
89.在车辆80处于运动的情况下,在步骤216中由传感器112测量传感器数据以确定车辆状态126。在步骤218中,由驾驶员命令预测器100执行驾驶员短期命令预测。预测是在预测范围内实时确定的。在步骤220中,基于驾驶员预测命令执行期望的状态计算。
90.在步骤222中执行预测运动控制计算。计算的目标是最小化车辆80的实际状态和车辆80的期望状态之间的误差。所得到的误差可以沿着实时反馈路径226反馈到传感器测量步骤216。可以在步骤224中执行驾驶员模型124的适应和细化。细化的驾驶员模型124可在步骤218中使用,以改进每个更新反馈路径228的驾驶员命令预测。
91.参考图6,示出了根据一个或多个示例性实施例的驾驶员模型训练步骤214的示例实施方式的流程图。如图所示,步骤214包括步骤242至250。步骤的序列作为代表性示例示出。可以实施其他步骤顺序来满足特定应用的标准。
92.在步骤242中,可以执行数据收集以收集与驾驶员84的行为相关的数据。在步骤244中,可以在合适的时间范围内收集数据,以生成大数据集。数据可包括但不限于车辆状态126、实际驾驶员命令信号102和道路信息信号132。在步骤246中,训练和微调驾驶员模型124。训练包括步骤248中的预处理和步骤250中的微调。
93.用于预处理步骤248的数据可以经由在步骤244中收集的数据集252来提供。预处理步骤248包括特征生成、缺失数据处理、异常数据处理等。预处理步骤248生成用于微调驾驶员模型124的处理数据254。在步骤250中,使用处理后的数据254更新驾驶员模型124。可以执行微调的一次或多次迭代256。所得到的微调驾驶员模型124在最终迭代256已经完成之后准备在车辆80中使用。
94.参考图7,示出了根据一个或多个示例性实施例的用于驾驶员模型124的学习技术270的示例实施方式的流程图。在该示例中,学习技术270通常从信息装置118(例如,摄像机118a、激光雷达118b和其他装置118c)接收数据。其他装置可以包括地图装置、惯性测量单元、电子动力转向扭矩传感器、车轮传感器、方向盘传感器、悬架高度传感器、全球定位系
统、油门传感器、制动踏板传感器、雷达、加速度计和/或从各种传感器获得的其他估计信号。
95.学习技术270可以对从摄像机118a和激光雷达118b接收的空间数据执行一个或多个卷积272。微调步骤250可用于卷积数据和从其他装置118c接收的数据,以建立循环和完全连接的驾驶员模型124。
96.参考图8,根据一个或多个示例性实施例示出了驾驶命令预测步骤218的示例实施方式的流程图。步骤218包括步骤280和282。
97.在步骤280中,测量来自驾驶员控制器86、传感器112和信息装置118的数据。在该示例中,数据包括实际驾驶员命令102、道路信息132和传感器数据。传感器数据确定车辆状态126。
98.执行预处理步骤248以确定特征、处理缺失的传感器数据点、处理异常数据等。经处理的数据254随后被呈现给命令预测单元114。在步骤282中,命令预测单元114中的驾驶员模型124生成预测的驾驶员命令结果284。预测的驾驶员命令结果284包括未来转向命令(例如,曲线290)、未来油门命令(例如,曲线292)、未来制动命令(例如,曲线294)、未来档位命令(例如,曲线296)等。预测的驾驶员命令结果284可实时跨越预测周期176(例如,k到k+p)。
99.参考图9,根据一个或多个示例性实施例示出了期望状态计算步骤220的示例实施方式的流程图。如图所示,步骤220包括步骤300至步骤314。步骤的序列作为代表性示例示出。可以实施其他步骤顺序来满足特定应用的标准。
100.在步骤300中,计算期望的加速器踏板和制动踏板位置的预测。在步骤302中,计算车辆80的每个拐角处(例如,每个轮胎处)的驱动扭矩、制动扭矩和车轮速度的估计值。在步骤304中,预测滑移率。在步骤306中预测组合的滑移纵向力。
101.在步骤308中,计算转向预测。在步骤310中预测滑移角(例如,车辆的状态)。在步骤312中,计算轮胎上的组合滑移横向力。在各种实施例中,步骤308至312可以与步骤300至306并行执行。在其他实施例中,步骤300至312可以顺序地执行。在步骤314中,可以基于车身动力学控制方程来预测期望的车辆横向运动和期望的车辆纵向运动。为了提供更精确的控制动作,可以在预测范围内考虑驾驶员命令变化的影响。如果驾驶员命令改变,则至少基于预测的转向、油门和制动输入重新计算期望的车辆状态。
102.期望的状态计算基于驾驶员预测的命令。预测的车轮速度(iw)可以根据方程1确定如下:
ꢀꢀ
方程(1)其中,ω是车轮转速,t是拐角(车轮)处的扭矩,r
eff
是轮胎的有效半径,并且f
x
是车轮的纵向力。
103.拐角滑移率(
ĸ
)由方程2定义如下: 方程(2)其中,υ
x
是向前的速度,并且re是轮胎的有效半径。
104.横向滑移角(α)可由方程3定义如下:
ꢀꢀ
方程(3)其中υy是横向速度。
105.根据方程4和5计算轮胎/道路接地面平面力,如下所示:方程(4)方程(5)。
106.车身动力学控制方程6-8提供如下:方程(6)方程(7)
ꢀꢀ
方程(8)其中,gz是绕z轴的力矩,lf是前轮轴到重心的距离,lr是后轮轴到重心的距离,lw是轮轨距,并且δ是前轮轴的车轮角度。
107.期望的车辆纵向和横向状态由方程9-11定义如下:
ꢀꢀꢀꢀ
方程(9)
ꢀꢀꢀꢀ
方程(10)
ꢀꢀꢀꢀꢀꢀ
方程(11)其中r是横摆速率,并且iz是惯性矩。
108.对于预测运动控制,可以设定目标以最小化实际状态和期望状态之间的误差。因此,可以在有限时间范围内定义以下二次成本函数j
mpc
,以便根据方程12实现期望的
车辆运动如下:
ꢀꢀ
方程(12)根据方程13-16:方程(13)方程(14)方程(15)方程(16)其中,j是成本函数,u是控制动作(或称为控制努力),y表示车辆模型的输出,x表示车辆模型的状态,并且a、b和w是车辆模型的状态空间表示的矩阵。
109.在驾驶员命令预测器100中,在预测范围内更新期望的车辆运动。
110.参考图10,根据一个或多个示例性实施例示出了驾驶员模型适应步骤224的示例实施方式的流程图。步骤224包括步骤320至324,它们由预测驾驶员命令326、状态328和奖励330链接。
111.在步骤224中,对预测驾驶员命令信号104和实际驾驶员命令信号102进行比较。如果驾驶员84的反应与预测的不同(例如,超过对应的阈值),则可以实时初始化强化学习(rl)机制以适应和改进驾驶员模型124。强化学习机制学习驾驶员84的行为,并为每个车辆80/驾驶员84定制驾驶员模型124,用于看不见的行为。可以丢弃异常/不良驾驶行为。
112.在步骤320中充当代理的驾驶员模型124生成预测的驾驶员命令326。在步骤322中,将预测的驾驶员命令326与实际驾驶员命令进行比较,以确定状态328。在步骤324中,预测误差作为预测的驾驶员命令326和实际驾驶员命令之间的差异而生成。预测误差在奖励330中返回到步骤320。步骤320随后基于状态328和奖励330调整驾驶员模型124。
113.参考图11,根据一个或多个示例性实施例示出了用于预测驾驶员命令的方法340的示例实施方式的流程图。方法(或过程)340在驾驶员命令预测器100中实施。如图所示,方法340包括步骤342至354。步骤的序列作为代表性示例示出。可以实施其他步骤顺序来满足特定应用的标准。
114.步骤342包括响应于实际驾驶员命令信号102和未来驾驶员命令信号134,命令相对于道路82调整车辆80的一个或多个运动矢量92。控制器110在当前时间k处接收实际驾驶员命令。控制器110在更新时间k到k+p处接收未来驾驶员命令。更新时间范围从当前时间k到未来时间k+p。
115.步骤344响应于如所命令的运动矢量92生成确定车辆状态126的传感器数据。在步骤346中生成道路信息。在步骤348中,驾驶员模型124对实际驾驶员命令、车辆状态126和道路信息进行操作,以在每个更新时间k至k+p处生成未来驾驶员命令。
116.步骤350包括基于实际驾驶员命令和车辆动态特性90生成车辆80的期望状态。
生成未来驾驶员命令以使期望状态符合实际状态。在步骤352中,通过将未来驾驶员命令与实际驾驶员命令进行比较来生成结果。在步骤354中基于在步骤352中生成的结果更新驾驶员模型124。随后重复方法340以保持车辆80的预期运动。
117.参考图12,根据一个或多个示例性实施例示出了短期方向盘命令预测的曲线图360。曲线图360包括第一轴线362和第二轴线364。第一轴线362以秒为单位图示了时间。第二轴线364以度为单位图示了方向盘角度。
118.曲线图360图示了驾驶场景,其中车辆80以可变速度目标行驶通过弯曲的道路82。曲线366示出了由驾驶员84控制的实际方向盘角度指令。曲线368图示了如由驾驶员命令预测器100计算的预测方向盘角度命令。驾驶场景的结果示出了方向盘角度的预测值(曲线368)在小于2度的范围内近似匹配实际值(曲线366)。
119.在极限处理中(例如,高度动态机动、湿滑路面等),驾驶员命令预测器100通过利用前轮轴和后轮轴中的大部分轮胎能力来支持车辆80达到最大横向抓地力。为此,可以使用驾驶员转向命令和制动/油门命令在每个采样时间处计算期望的横向加速度。驾驶员命令预测器100根据当前车辆状态和先前车辆状态、实际驾驶员命令、道路信息和关于目标车辆80的可用感测信息,在预测范围内并且在每个采样时间期间预测驾驶员短期命令。使用预测的驾驶员命令,驾驶员命令预测器100计算控制调整以实现驾驶员84要求的加速度,以及特别是横向加速度,以这种方式,车辆80达到最大横向抓地力,同时保持车辆稳定性并降低在严重极限处理驾驶场景下的频繁反向转向。
120.在各种实施例中,驾驶员命令预测器100提供短期驾驶员命令的预测,用于增强车辆预测运动控制。驾驶员命令预测器100包括控制器110,控制器110响应于实际驾驶员命令和未来驾驶员命令来命令车辆80相对于道路82的运动矢量92的调整。驾驶员命令是在当前时间处接收的。在范围从当前时间到未来时间的多个更新时间处接收未来驾驶员命令。未来驾驶员命令用于计算自动车辆运动预测控制的增强,其提供比假定的恒定驾驶员决策更现实的导航控制。传感器112响应于运动矢量92生成确定车辆80的多个实际状态的传感器数据。预测单元114被配置成响应于驾驶员模型124在更新时间处生成未来驾驶员命令。驾驶员模型124对实际驾驶员命令和实际状态进行操作,以预测在更新时间处的未来驾驶员命令。车辆运动预测控制被自动重新制定,以结合预测的驾驶员命令来实现期望的横向运动和横摆运动,以支持车辆的最大横向抓地力。
121.包括所附权利要求书在内的本说明书中的所有参数数值(例如,数量或条件)应理解为在所有情况下由术语“大约”修饰,无论“大约”是否实际出现在数值之前。“大约”指示所述数值允许一些轻微的不精确(该值接近精确;大约或合理地接近该值;差不多)。如果“大约”所提供的不精确性在本领域中不能理解为普通含义,那么如本文所用的“大约”至少指示测量和使用这些参数的普通方法可能产生的变化。另外,范围的公开包括整个范围内所有值和进一步划分的范围的公开。范围内的每个值和范围的端点都作为单独的实施例公开。
122.虽然已经详细描述了实施本公开的最佳模式,但是熟悉本公开相关领域的技术人员将会认识到在所附权利要求的范围内用于实施本公开的各种替代设计和实施例。

技术特征:


1.一种驾驶员命令预测器,包括:控制器,其被配置成响应于多个实际驾驶员命令和多个未来驾驶员命令来命令调整车辆相对于道路的一个或多个运动矢量,其中,所述多个实际驾驶员命令是在当前时间处接收的,所述多个未来驾驶员命令是在多个更新时间处接收的,并且所述多个更新时间的范围是从当前时间到未来时间;多个传感器,其被配置成响应于如所命令的一个或多个运动矢量生成确定车辆的多个实际状态的多个传感器数据;和命令预测单元,其被配置成响应于驾驶员模型在多个更新时间处生成所述多个未来驾驶员命令,其中,所述驾驶员模型对所述多个实际驾驶员命令和所述多个实际状态进行操作,以预测所述多个更新时间处的多个未来驾驶员命令。2.根据权利要求1所述的驾驶员命令预测器,进一步包括:一个或多个信息装置,其被配置成生成道路信息,其中,所述驾驶员模型对所述道路信息进行操作,以在所述多个更新时间处生成所述多个未来驾驶员命令。3.根据权利要求1所述的驾驶员命令预测器,其中,所述驾驶员模型是深度学习模型。4.根据权利要求3所述的驾驶员命令预测器,其中,所述深度学习模型被配置成基于所述多个实际驾驶员命令和多个车辆动态特性生成多个期望的车辆状态。5.根据权利要求4所述的驾驶员命令预测器,其中,所述命令预测单元生成多个未来驾驶员命令,以使所述多个期望状态符合所述多个实际状态。6.根据权利要求1所述的驾驶员命令预测器,其中,所述命令预测单元还被配置成:通过对所述多个未来驾驶员命令与所述多个实际驾驶员命令的比较生成多个结果;以及基于所述多个结果更新所述驾驶员模型。7.根据权利要求1所述的驾驶员命令预测器,其中,所述控制器将所述多个实际驾驶员命令视为当前时间和未来时间之间的多个常数。8.根据权利要求1所述的驾驶员命令预测器,其中,所述控制器包括:驾驶员命令解释器,其配置成响应于所述多个实际驾驶员命令和所述多个未来驾驶员命令生成多个中间命令;和模型预测控制器,其响应于所述多个中间命令和所述多个未来驾驶员命令,命令在所述多个更新时间处调整所述车辆的所述一个或多个运动矢量。9.根据权利要求1所述的驾驶员命令预测器,其中,所述未来时间在当前时间之后100毫秒至500毫秒的范围内。10.一种用于驾驶员命令预测的方法,包括:响应于多个实际驾驶员命令和多个未来驾驶员命令,命令调整车辆相对于道路的一个或多个运动矢量,其中,所述多个实际驾驶员命令由电路在当前时间处接收;响应于如所命令的一个或多个运动矢量,生成确定所述车辆的多个实际状态的多个传感器数据;以及响应于驾驶员模型在多个更新时间处生成所述多个未来驾驶员命令,其中,所述多个更新时间的范围从当前时间到未来时间,并且所述驾驶员模型对所述多个实际驾驶员命令和所述多个实际状态进行操作以预测所述多个更新时间处的所述多个未来驾驶员命令。

技术总结


一种驾驶员命令预测器包括控制器、多个传感器和命令预测单元。控制器被配置成响应于多个实际驾驶员命令和多个未来驾驶员命令来命令调整车辆相对于道路的多个运动矢量。在当前时间处接收实际驾驶员命令。在多个更新时间处接收未来驾驶员命令。更新时间的范围从当前时间到未来时间。传感器被配置成响应于如所命令的运动矢量生成确定车辆的多个实际状态的传感器数据。命令预测单元被配置成响应于驾驶员模型在更新时间处生成未来驾驶员命令。驾驶员模型对实际驾驶员命令和实际状态进行操作,以预测在更新时间处的未来驾驶员命令。预测在更新时间处的未来驾驶员命令。预测在更新时间处的未来驾驶员命令。


技术研发人员:

E

受保护的技术使用者:

通用汽车环球科技运作有限责任公司

技术研发日:

2022.05.27

技术公布日:

2023/2/20

本文发布于:2024-09-23 16:25:03,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/55395.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:多个   驾驶员   命令   所述
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议