用于训练用于机动车的控制器的至少一个算法的方法、计算机程序产品以及机动车与流程



1.在本文中描述一种用于训练用于机动车的控制器的至少一个算法的方法、一种计算机程序产品以及一种机动车。


背景技术:



2.开篇所提及类型的用于训练用于机动车的控制器的至少一个算法的方法、计算机程序产品以及机动车在现有技术中是已知的。在过去几年中,第一部分自动化驾驶的机动车(相当于根据sae j3016的sae等级2)已经达到成批生产的水平(serienreife)。自动化驾驶(相当于根据sae j3016的sae等级》=3)或自主驾驶(相当于根据sae j3016的sae等级4/5)机动车必须基于各种预先规定(例如驾驶目的地和常见交通规则的遵守)以最大的安全性独立地对未知的交通状况做出反应。因为交通现实由于其他交通参与者、尤其是人类交通参与者的行为的不可预测性而是高度复杂的,所以以常规的方法且基于由人类所制定的规则对机动车的相应的控制器进行编程被视为几乎不可能。
3.为了借助计算机解决复杂的问题,此外已知借助机器学习方法或者人工智能算法来开发或者通过自学习神经网络来开发。一方面,这样的算法能够比传统算法更适度地对复杂的交通状况做出反应。另一方面,借助于人工智能,原则上能够在开发过程期间和在日常生活中通过持续的学习进一步开发算法并且持续地改善所述算法。替代地,可以在开发过程中的训练阶段终止并在通过制造商进行验证之后冻结算法的状态。
4.另外存在如下状况:在所述状况中,当本车辆自身举止并非完全遵守规则时,例如当本车辆驶过实线以避让障碍物时,只要这能够无危险地实现,例如当不存在对向交通时,则可以改善交通流并且必要时甚至可以降低事故风险。在这样的状况中自主驾驶的机动车的制动可能导致在后方行驶的未做准备的人类驾驶员由于交通流的突然中断而引起追尾事故。
5.由us 2019/0318267 a1已知用于在用于运行自主车辆的模拟平台上训练机器学习模型的系统和方法。在行驶期间,由人类驾驶员来收集针对多个驾驶场景的驾驶统计数据和环境数据,以便模型持续地学习驾驶员的驾驶风格和偏好。


技术实现要素:



6.任务因此在于,以如下方式扩展开篇所提及类型的用于训练用于机动车的控制器的至少一个算法的方法、计算机程序产品以及机动车,使得自主驾驶的机动车可以更好地匹配于交通流。
7.该任务通过根据权利要求1的用于训练用于机动车的控制器的至少一个算法的方法、根据并列的权利要求14的计算机程序产品以及根据并列的权利要求15的机动车来解决。延伸构型和扩展方案是从属权利要求的主题。
8.以下描述一种用于训练用于机动车的控制器的至少一个算法的方法,其中,该控
制器设置用于,在使用所述至少一个算法的情况下基于输入数据通过干预机动车的机组实现自动化的或自主的驾驶功能,其中,通过自学习神经网络训练该算法,该方法包括以下步骤:
9.a)提供用于该自动化的或自主的驾驶功能的计算机程序产品模块,其中,该计算机程序产品模块包含待训练的算法和自学习神经网络,
10.b)提供具有模拟参数的模拟环境,其中,该模拟环境包含真实存在的使用区域的地图数据、该机动车,其中,通过规则集确定该机动车的行为,
11.c)提供针对所述机动车的任务,
12.d)提供真实存在的使用区域的实时交通数据以及重新调整模拟环境中的交通状况;
13.e)根据实时交通数据确定用于该任务的驾驶持续时间;
14.f)在该模拟环境中执行对该任务的模拟并且确定用于完成该任务的模拟驾驶持续时间;
15.g)将该模拟驾驶持续时间与所述驾驶持续时间进行比较,其中,
16.(i)当模拟驾驶持续时间以长于预给定的时间间距的方式持续得比驾驶持续时间长时,修改所述至少一个算法和/或所述至少一个规则集并且重复所述任务,或者
17.(ii)当模拟驾驶持续时间以不长于预给定的时间间距的方式持续得比驾驶持续时间长时,将所述任务分类为成功。
18.根据实时交通数据确定用于预给定的任务的驾驶持续时间并且将该驾驶持续时间与用于通过由所述算法控制的机动车在模拟环境中完成该任务的持续时间进行比较,由此能够将模拟的机动车的驾驶持续时间与真实的驾驶持续时间进行比较。如果在此表明模拟的机动车比真实的机动车需要长得多的时间,则这使得推断出自主驾驶的机动车的过于防御性的驾驶行为。如此,因此可以根据该指标在如下方面训练该算法:较低防御性地驾驶,以便匹配于人类驾驶员的驾驶行为。只有当模拟的机动车在根据实时交通数据的驾驶持续时间周围的预给定的范围内接近时,该算法才可以被视为不过于防御性地驾驶。
19.在第一延伸构型中可以设置,当步骤g)(i)实现时,选择另外的任务并且针对所述另外的任务重复所述方法。
20.通过针对另外的任务来训练该算法,可以实现,该算法不过于针对一个任务专门化。
21.在另一延伸构型中可以设置,将确定的交通参与者的驾驶数据和路线选择为实时交通数据,其中,根据所述交通参与者的路线上的地点选择任务。
22.实时交通数据可以包含关于交通流的统计数据,但是也可以包含特定的交通参与者的驾驶数据。统计数据可以例如是如下数据:所述数据可以由路线计算算法根据环境参数包含例如容许的最高速度、交通信号灯设施和交通流量。特定的交通参与者的驾驶数据允许与个体化的驾驶性能进行比较。不同驾驶员具有不同的驾驶风格,有些驾驶员驾驶得较防御性,有些驾驶员驾驶得防御性较低。此外,这些特定的交通参与者可能行驶从起始点到目标点的个体化的路线。这些路线可以是用于相应的任务的选择的基础,并且可以根据个体化的路线来确定起始点和目标点以及中间目的地。起始点和目标点以及中间目的地可以是沿着相应的路线的确定的表征性的点,例如交叉路口。
23.在另一延伸构型中可以设置,所述实时交通数据包含基础设施信息。
24.基础设施信息可以例如是关于交通信号灯切换、路障、车道引导和类似物的信息。这些信息的纳入提高模拟的真实程度,并且允许对用于该任务的驾驶持续时间进行评估。如此,例如可以取消如下驾驶持续时间的资格:在该驾驶持续时间的情况下,驾驶员只具有绿交通信号灯。
25.在另一延伸构型中可以设置,在重新调整模拟环境中的交通状况时,使用优化算法,以便将模拟环境与实时交通数据之间的偏差最小化。
26.通过使用优化算法,可以在模拟环境中产生特别现实的交通场景,该模拟环境特别好地重建实时交通数据,这改善驾驶持续时间与模拟驾驶持续时间的可比性。
27.在另一延伸构型中可以设置,通过改变模拟环境中的交通状况的参数使任务发生变化,并且针对经修改的任务执行所述方法。
28.通过改变交通状况的参数,能够避免该算法针对特定的交通状况和任务的过度专门化。
29.在另一延伸构型中可以设置,随机地执行对参数的改变。
30.通过随机化,也可以防止算法的过度专门化。
31.在另一延伸构型中可以设置,作为驾驶时间,使用交通参与者的用于根据实时交通数据执行任务的驾驶时间,或者,其中,借助模拟环境中的代理物(agent)求取该交通参与者的驾驶时间。
32.通过与个体化的驾驶员的比较,可以直接研究人类驾驶方式。
33.如果借助模拟环境中的代理物来求取驾驶时间,则可以将一个算法的效率与另一个算法的效率进行比较。
34.在另一延伸构型中可以设置,借助强化学习算法训练所述算法和/或所述至少一个规则集。
35.强化学习算法的使用允许通过奖励函数对算法进行改善。可以通过使模拟驾驶持续时间接近于驾驶持续时间来触发该奖励函数。
36.在另一延伸构型中可以设置,所述驾驶持续时间是由该任务的模拟的多次迭代的驾驶持续时间所确定的预期值。
37.通过根据任务的模拟的多次迭代来定义预期值,能够补偿实时交通数据的模拟与真实存在的使用区域中的状况之间的区别。
38.在另一延伸构型中可以设置,所述驾驶持续时间是由多个真实交通参与者的驾驶持续时间表示的预期值,所述多个真实交通参与者在使用区域中执行所述任务。
39.如果将预期值用于执行该任务,则来自真实交通环境的参考驾驶时间更接近平均驾驶时间,由此可以减小各个驾驶时间的统计学偏差和以不同程度防御性地或进攻性地驾驶的人类驾驶员的影响。
40.在另一延伸构型中可以设置,自学习神经网络以超出预给定的规则集极限的方式修改所述规则集。
41.相应的规则集极限例如是在确定的路段上的容许的最高速度或者在驶过变为红灯的交通信号灯时的允许持续时间、对驶过实线的允许等等。
42.通过以超出预给定的规则集极限的方式修改所述规则集,可以实现现实的驾驶行
为。如此,例如能够设定55km/h或者60km/h的容许的最高速度,而不是50km/h的最高速度,从而能够在交通中更好地一起流动。
43.当在违反规则停泊的机动车封锁车道的情况下驶过实线时,只要由此不产生对于对向交通的危险,也可以改善交通流并且可以实现自主驾驶功能的现实的驾驶行为。
44.在另一延伸构型中可以设置,在比较模拟驾驶持续时间和驾驶时间时考虑标准偏差。
45.任务通常可以定义为从起始点出发到达目标点。在此可能的是,可以行驶起始点与目标点之间的多个不同路线或者一个特定的路线。在不同路线的情况下,驾驶时间的可比性受到影响。如果该路线是固定预给定的,则可以提高模拟驾驶持续时间与驾驶持续时间的可比性。
46.在另一延伸构型中可以设置,任务是从至少一个起始点到至少一个目标点的路线的行驶。
47.第一独立主题涉及一种用于训练用于机动车的控制器的至少一个算法的设备,其中,该控制器设置用于,在使用所述至少一个算法的情况下基于输入数据通过干预机动车的机组实现自动化的或自主的驾驶功能,其中,自学习神经网络设置用于训练该算法,其中,该设备构造用于实施以下步骤:
48.a)提供用于该自动化的或自主的驾驶功能的计算机程序产品模块,其中,该计算机程序产品模块包含待训练的算法和自学习神经网络,
49.b)提供具有模拟参数的模拟环境,其中,该模拟环境包含真实存在的使用区域的地图数据、该机动车,其中,通过规则集确定该机动车的行为,
50.c)提供针对所述机动车的任务,
51.d)提供真实存在的使用区域的实时交通数据以及重新调整模拟环境中的交通状况;
52.e)根据实时交通数据确定用于该任务的驾驶持续时间;
53.f)在该模拟环境中执行对该任务的模拟并且确定用于完成该任务的模拟驾驶持续时间;
54.g)将该模拟驾驶持续时间与所述驾驶持续时间进行比较,其中,
55.(i)当模拟驾驶持续时间以长于预给定的时间间距的方式持续得比驾驶持续时间长时,修改所述至少一个算法和/或所述至少一个规则集并且重复所述任务,或者
56.(ii)当模拟驾驶持续时间以不长于预给定的时间间距的方式持续得比驾驶持续时间长时,将所述任务分类为成功。
57.在第一延伸构型中可以设置,当步骤g)(i)实现时,选择另外的任务并且针对所述另外的任务重复所述方法。
58.在另一延伸构型中可以设置,将确定的交通参与者的驾驶数据和路线选择为实时交通数据,其中,根据所述交通参与者的路线上的地点选择任务。
59.在另一延伸构型中可以设置,所述实时交通数据包含基础设施信息。
60.在另一延伸构型中可以设置,该设备构造用于,在重新调整模拟环境中的交通状况时使用优化算法,以便将模拟环境与实时交通数据之间的偏差最小化。
61.在另一延伸构型中可以设置,该设备设置用于,通过改变模拟环境中的交通状况
的参数使任务发生变化,并且针对经修改的任务执行所述方法。
62.在另一延伸构型中可以设置,该设备设置用于,随机地执行对参数的改变。
63.在另一延伸构型中可以设置,作为预期值,设置交通参与者的用于根据实时交通数据执行任务的驾驶时间,或者,其中,该设备设置用于,借助模拟环境中的代理物求取该交通参与者的驾驶时间。
64.在另一延伸构型中可以设置,该设备设置用于,借助强化学习算法训练所述算法和/或所述至少一个规则集。
65.在另一延伸构型中可以设置,所述驾驶持续时间是由该任务的模拟的多次迭代的驾驶持续时间所确定的预期值。
66.在另一延伸构型中可以设置,所述驾驶持续时间是由多个真实交通参与者的驾驶持续时间表示的预期值,所述多个真实交通参与者在使用区域中执行所述任务。
67.在另一延伸构型中可以设置,该设备设置用于,借助自学习神经网络以超出预给定的规则集极限的方式修改所述规则集。
68.在另一延伸构型中可以设置,该设备构造用于,在比较模拟驾驶持续时间和驾驶时间时考虑标准偏差。
69.在另一延伸构型中可以设置,任务是从至少一个起始点到至少一个目标点的路线的行驶。
70.另一独立主题涉及一种计算机程序产品,该计算机程序产品具有计算机可读的存储介质,在该计算机可读的存储介质上嵌入有指令,当由至少一个计算单元实施所述指令时,这些指令引起,所述至少一个计算单元设置用于实施上述类型的方法。
71.该方法可以在一个计算单元上或者在多个计算单元上分布地实施,从而在一个计算单元上实施确定的方法步骤并在至少一个另外的计算单元上实施其他方法步骤,其中,所计算的数据(如果需要的话)可以在计算单元之间进行传递。
72.另一独立主题涉及一种具有上述类型的计算机程序产品的机动车。
附图说明
73.其他特征和细节从以下描述中得出,在该描述中(必要时参考附图)详细描述至少一个实施例。所描述的和/或通过图形示出的特征单独地或以任何有意义的组合形成主题,必要时也独立于权利要求,并且尤其附加地还可以是一个或多个单独申请的主题。相同的、相似的和/或功能相同的部件设有相同的附图标记。在此示意性示出:
74.图1示出机动车的俯视图;
75.图2示出计算机程序产品模块;
76.图3示出带有交通流信息的真实存在的使用区域的道路地图;
77.图4示出带有任务的、图3中的道路地图,以及
78.图5示出训练方法的流程图。
具体实施方式
79.图1示出机动车2,该机动车设置用于自动化的或自主的驾驶。
80.机动车2具有控制器4,该控制器具有计算单元6和存储器8。在存储器8中存储有计
算机程序产品,在下文中结合图2至图4更深入地描述该计算机程序产品。
81.控制器4一方面与一系列环境传感器连接,所述环境传感器允许对机动车2的当前位姿以及相应的交通状况进行检测。所述环境传感器包括:在机动车2的前部处的环境传感器10、11,在机动车2的尾部处的环境传感器12、13,摄像机14以及gps模块16。环境传感器10至13能够包括例如雷达传感器、激光雷达传感器和/或超声波传感器。
82.此外,设置有用于检测机动车2的状态的传感器,尤其是车轮转数传感器16、加速度传感器18和踏板传感器20,这些传感器与控制器4连接。借助这些机动车传感机构能够可靠地检测机动车2的目前的状态。
83.在机动车2运行期间,计算单元6加载保存在存储器8中的计算机程序产品并且实施该计算机程序产品。基于算法和输入信号,计算单元6决定对机动车2的控制,计算单元6将通过干预分别与控制器4连接的转向装置22、马达控制装置24以及制动器26来实现该控制。
84.传感器10至20的数据连续地被缓存在存储器8中并在预给定的持续时间之后被去除,以便这些环境数据能够提供用于进一步的分析处理。
85.该算法已根据以下描述的方法进行训练。
86.图2示出具有计算机程序产品模块30的计算机程序产品28。
87.计算机程序产品模块30具有自学习神经网络32,该自学习神经网络训练算法34。自学习神经网络32根据强化学习方法进行学习,即神经网络32试图通过改变算法34来获得奖励,该奖励用于相应于一个或者多个指标或者尺度(maβstab)的改善的行为、即用于算法34的改善。替代地,也可以使用监控学习和非监控学习的已知的学习方法以及这些学习方法的组合。
88.算法34基本上可以由复杂(komplexer)滤波器组成,该滤波器具有由通常被本领域技术人员称为权重的值所构成的矩阵,这些值限定滤波器功能,该滤波器功能根据输入参量确定算法34的行为并生成用于控制机动车2的控制信号,所述输入参量在当前情况下通过环境传感器10至20记录。
89.计算机程序产品模块30能够不仅在机动车2中而且在机动车2之外使用。因此可以实现不仅在真实的环境中而且在模拟环境中训练计算机程序产品模块30。根据在此描述的教导,该训练尤其在模拟环境中进行,因为这比在真实环境中的训练更安全。
90.计算机程序产品模块30设置用于制定应改善的指标。在当前情况下,该指标是,与真实存在的驾驶时间的预期值相比,直到实现预给定的任务为止的时间(以下称为模拟驾驶时间),例如是从起始地点到目标地点的驾驶时间。
91.如果该指标已高于一定的阈值,例如时间小于根据该预期值确定的极限时间,则该指标可以视为已被满足。然后,算法34可以要么在其他任务方面进行优化和进一步训练,要么可以在真实环境中测试该算法。
92.图3示出映射真实存在的使用区域37的道路地图的模拟环境36。
93.使用区域37的道路地图用作用于训练算法34的模拟环境36。使用区域37的道路地图具有涉及不同道路上的交通流的交通流信息。这些交通流信息是实时信息,所述实时信息可以通过不同的服务来提供。这样的实时信息可以例如由手机定位数据、车辆导航数据、交通监控摄像机的摄像机记录(kameraaufnahmen)和类似物来求取。
94.在实时交通数据中,用停滞的交通38(以虚线示出)或者严重停滞的交通40(以实线示出)来标记使用区域37的道路地图上的各个道路。停滞的交通可以定义为如下交通:该交通以低于20km/h的平均速度流动,严重停滞的交通可以定义为这样的交通:该交通以低于5km/h的平均速度流动。
95.已知,使用相应的实时交通数据以进行路线规划,以便一方面为交通减轻负担,另一方面在尽可能好的时间内到达目的地。
96.图4示出使用区域37的道路地图的模拟环境36以及用于算法34的任务。
97.当前任务是,沿着从起始点s到目标点z的确定的路线驾驶模拟的机动车2。
98.计算机程序产品模块30根据实时交通数据在考虑占主导地位的停滞的交通38和占主导地位的严重停滞的交通40的情况下计算用于完成该任务的、车辆的预期值。该预期值是用于通过模拟的机动车2完成该任务所需要的驾驶时间ts的参考值。
99.图5示出该方法的流程图。
100.首先,在开始之后提供计算机程序产品模块。该计算机程序产品模块包含待训练的算法和自学习神经网络。
101.随后,在真实地图数据的基础上提供模拟环境。该模拟环境除了道路和确定的规则之外还可以包含其他交通参与者及其任务。
102.在另一步骤中,确定模拟环境中的任务。如结合图4所示出的那样,该任务可以是从起始点到目标点的确定的路线的行驶。
103.在下一步骤中,用于驾驶持续时间的预期值可以根据用于待模拟的使用区域的真实交通数据来计算。
104.在另一步骤中,执行所述模拟并且确定模拟驾驶持续时间。为了执行该模拟,可能需要在模拟环境中放置代理物,所述代理物创造与在真实环境中存在的交通状况可比的交通状况。这也可以包括基础设施信息,例如交通信号灯切换。
105.然后,进行模拟驾驶持续时间与预期值的比较。如果模拟驾驶持续时间不够接近预期值,则改变所述算法和/或所述规则集并且重复所述模拟。这个步骤相应于强化学习的原理,该强化学习具有该算法想要实现的奖励指标。
106.如果该算法实现足够接近预期值的模拟驾驶持续时间,则该任务被视为已被成功完成。
107.该算法可以通过不同任务来训练,例如具有相同的起始点和目标点、但是不同的交通状况的任务,或者具有不同的起始点和/或不同的目标点的新任务。只有当所有指标被实现时,才可以冻结该算法。
108.尽管已经通过实施例更详细地说明和阐述主题,但是本发明不受限于所公开的示例,并且其他变型能够由本领域技术人员从中推导出。因此,明显存在多个变型可能性。同样明显的是,示例性地提到的实施方式仅表示示例,这些示例无论如何都不应理解为对如本发明的保护范围、应用可能性或配置的限制。相反,先前的描述和附图描述使得本领域技术人员能够具体地实现示例性的实施方式,其中,本领域技术人员在了解所公开的发明构思的情况下例如能够在示例性的实施方式中所提及的各个元件的功能或布置方面进行各种改变,而不脱离通过权利要求及其法律等同物(例如说明书中的进一步阐述)所限定的保护范围。
109.附图标记列表
110.2机动车
111.4控制器
112.6计算单元
113.8存储器
114.10环境传感器
115.11环境传感器
116.12环境传感器
117.13环境传感器
118.14摄像机
119.15gps模块
120.16车轮转数传感器
121.18加速度传感器
122.20踏板传感器
123.22转向装置
124.24马达控制装置
125.26制动器
126.28计算机程序产品
127.30计算机程序产品模块
128.32神经网络
129.34算法
130.36模拟环境
131.37使用区域
132.38停滞的交通
133.40严重停滞的交通
134.ts模拟驾驶时间
135.m任务
136.s起始点
137.z目标点。

技术特征:


1.一种用于训练用于机动车(2)的控制器(4)的至少一个算法(34)的方法,其中,所述控制器(4)设置用于,在使用所述至少一个算法(34)的情况下基于输入数据通过干预所述机动车(2)的机组(22,24,26)实现自动化的或自主的驾驶功能,其中,通过自学习神经网络(32)训练所述算法(34),所述方法包括以下步骤:a)提供用于所述自动化的或自主的驾驶功能的计算机程序产品模块(30),其中,所述计算机程序产品模块(30)包含待训练的算法(34)和所述自学习神经网络(32),b)提供具有模拟参数的模拟环境(36),其中,所述模拟环境(36)包含真实存在的使用区域(37)的地图数据、所述机动车(2),其中,通过规则集确定所述机动车(2)的行为,c)提供针对所述机动车(2)的任务,d)提供所述真实存在的使用区域(37)的实时交通数据以及重新调整所述模拟环境(36,)中的交通状况;e)根据所述实时交通数据确定用于所述任务的驾驶持续时间;f)在所述模拟环境中执行对所述任务的模拟并且确定用于完成所述任务的模拟驾驶持续时间;g)将所述模拟驾驶持续时间(ts)与所述驾驶持续时间进行比较,其中,(i)当所述模拟驾驶持续时间(ts)以长于预给定的时间间距的方式持续得比所述驾驶持续时间长时,修改所述至少一个算法(34)和/或至少一个规则集并且重复所述任务,或者(ii)当所述模拟驾驶持续时间(ts)以不长于预给定的时间间距的方式持续得比所述驾驶持续时间长时,将所述任务分类为成功。2.根据权利要求1所述的方法,其中,当步骤g)(i)实现时,选择另外的任务并且针对所述另外的任务重复所述方法。3.根据权利要求1或2所述的方法,其中,将确定的交通参与者的驾驶数据和路线选择为实时交通数据,其中,根据所述交通参与者的路线上的地点选择任务。4.根据上述权利要求中任一项所述的方法,其中,所述实时交通数据包含基础设施信息。5.根据上述权利要求中任一项所述的方法,其中,在重新调整所述模拟环境中的交通状况时,使用优化算法,以便将所述模拟环境与所述实时交通数据之间的偏差最小化。6.根据上述权利要求中任一项所述的方法,其中,通过改变所述模拟环境中的交通状况的参数使所述任务发生变化,并且针对经修改的任务执行所述方法。7.根据权利要求6所述的方法,其中,随机地执行对所述参数的改变。8.根据上述权利要求中任一项所述的方法,其中,作为驾驶时间,求取交通参与者的用于根据所述实时交通数据执行所述任务的驾驶时间,或者借助所述模拟环境中的代理物求取所述交通参与者的驾驶时间。9.根据上述权利要求中任一项所述的方法,其中,借助强化学习算法训练所述算法(34)和/或所述至少一个规则集。10.根据上述权利要求中任一项所述的方法,其中,所述驾驶持续时间是由所述任务的模拟的多次迭代的驾驶持续时间所确定的预期值。11.根据上述权利要求中任一项所述的方法,其中,所述驾驶持续时间是由多个真实交通参与者的驾驶持续时间表示的预期值,所述多个真实交通参与者在所述使用区域(37)中
执行所述任务。12.根据上述权利要求中任一项所述的方法,其中,所述自学习神经网络以超出预给定的规则集极限的方式修改所述规则集。13.根据上述权利要求中任一项所述的方法,其中,任务是从至少一个起始点到至少一个目标点的路线的行驶。14.一种计算机程序产品,所述计算机程序产品具有计算机可读的存储介质(8),在所述计算机可读的存储介质上嵌入有指令,当由至少一个计算单元(6)实施所述指令时,所述指令引起,所述至少一个计算单元(6)设置为用于实施根据上述权利要求中任一项所述的方法。15.一种机动车,其具有根据权利要求14所述的计算机程序产品。

技术总结


说明一种用于通过自学习神经网络训练用于机动车的控制器的至少一个算法的方法,所述方法包括以下步骤:提供具有模拟参数的模拟环境,其中,该模拟环境包含真实存在的使用区域的地图数据、机动车,其中,通过规则集确定机动车的行为,提供针对机动车的任务,提供真实存在的使用区域的实时交通数据以及重新调整模拟环境中的交通状况;根据实时交通数据确定用于任务的驾驶持续时间;在模拟环境中执行对任务的模拟并且确定用于完成该任务的模拟驾驶持续时间;将模拟驾驶持续时间与驾驶持续时间进行比较,其中,当模拟驾驶持续时间以长于预给定的时间间距的方式持续得比驾驶持续时间长时,修改至少一个算法和/或至少一个规则集并且重复任务。并且重复任务。并且重复任务。


技术研发人员:

C

受保护的技术使用者:

标致雪铁龙汽车股份有限公司

技术研发日:

2021.02.23

技术公布日:

2022/10/10

本文发布于:2024-09-22 11:40:55,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/23734.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   算法   机动车   交通
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议