一种集装箱班轮历史航线识别分类方法及系统与流程



1.本发明涉及集装箱航运信息化技术领域,具体涉及一种集装箱班轮历史航线识别分类方法及系统。


背景技术:



2.随着经济全球化的快速发展,国际贸易往来日益密切,集装箱运输船舶凭借其运输能力强、装卸速度高、节约装卸劳动力、货损和货差小等优势成为国际贸易的重要组成部分。
3.集装箱班轮航线是指至少在两个港口间通过集装箱船舶定期往返或环绕航行承运集装箱货物的航线,其特征是采用集装箱从事班轮运输。目前绝大部分集装箱航线都以班轮形式经营,各船舶公司对集装箱班轮航线的划分没有一个统一的标准,给航线运力的分类和识别造成了障碍,也很难统计航线运力变化。


技术实现要素:



4.为解决目前各船公司对集装箱班轮航线的划分没有一个统一的标准导致航线运力分类识别障碍等问题,本发明提供一种集装箱班轮历史航线识别分类方法,利用集装箱班轮的ais 数据,并结合业务逻辑,识别出全球集装箱班轮的历史航线,并根据航线经过的港口提炼出航线的相关信息,如航线经过的贸易区、国家等,对识别出的历史航线进行智能分类。本发明还涉及一种集装箱班轮历史航线识别分类系统。
5.本发明的技术方案如下:
6.一种集装箱班轮历史航线识别分类方法,其特征在于,包括以下步骤:
7.数据采集处理步骤,采集集装箱班轮的ais数据,并将ais数据进行清洗以去除干扰数据;
8.航线识别步骤,依据集装箱班轮历史航线相对固定并会不断重复出现的特点,通过动态规划算法最长公共子串来识别集装箱班轮多次出现的航线循环,将识别出的最长公共子串作为识别出的集装箱班轮历史航线;
9.航线分类步骤,结合业务逻辑,根据集装箱班轮历史航线经过的二级贸易区对识别出的集装箱班轮历史航线去重并且根据经过的一级贸易区进行编码,确保每条识别出的集装箱班轮历史航线均具有唯一编码,再根据集装箱班轮历史航线的一级贸易区编码对集装箱班轮历史航线进行分类;
10.航线运力识别监控步骤,将每艘集装箱班轮的历史动态与识别出的集装箱班轮历史航线匹配,并根据相似度将集装箱班轮历史航线细化到对应的港口航线,对任意两港口或任意两贸易区自动获取经过所述两港口或两贸易区的所有集装箱班轮历史航线,进而进行运力统计和运力变化分析。
11.优选地,所述数据采集处理步骤采集的ais数据包括集装箱班轮的ais静态和动态信息、集装箱班轮挂港情况、港口信息;将ais数据进行清洗包括去掉ais数据缺失量超过阈
值的数据、修船、起始港有缺失、终点港有缺失或港口为未知的数据以及去掉起点港与终点港为相同港口的数据,并将起始港和终点港分别匹配到相应的国家和区域,所述区域涉及集装箱班轮历史航线中对贸易区的划分,将贸易区分为一级贸易区和二级贸易区。
12.优选地,所述航线识别步骤将集装箱班轮历史上经过的所有贸易区作为一个总字符串,将待识别的集装箱班轮历史航线作为子字符串,识别集装箱班轮历史航线的过程为利用动态规划算法寻最长公共子字符串的过程,寻出来的最长公共子字符串作为一条固定的集装箱班轮贸易区的历史航线。
13.优选地,所述航线分类步骤结合业务逻辑,根据集装箱班轮历史航线经过的二级贸易区对识别出的集装箱班轮历史航线去重,去掉经过的二级贸易区的数量和顺序都相同只是由于子字符串选择了不同起点而造成的不同航线,对去重后的集装箱班轮历史航线根据其经过的一级贸易区进行编码,通过字母和数字结合的方式,确保每条识别出的集装箱班轮历史航线均具有唯一编码。
14.优选地,所述航线运力识别监控步骤将每艘集装箱班轮的历史动态与识别出的集装箱班轮历史航线匹配,使用jaccard相似系数判断港口航线的相似度,并根据相似度将集装箱班轮历史航线细化到对应的港口航线,提取港口航线的起始时间和终止时间、航线每个港口的抵离港时间、航行时长及里程、靠泊时长信息,将港口航线分为东西向和南北向并确定其起终点港口;再对任意两港口或任意两贸易区自动获取经过所述两港口或两贸易区的所有集装箱班轮历史航线,进而进行运力统计和运力变化分析。
15.一种集装箱班轮历史航线识别分类系统,其特征在于,包括依次连接的数据采集处理模块、航线识别模块、航线分类模块和航线运力识别监控模块,
16.所述数据采集处理模块,采集集装箱班轮的ais数据,并将ais数据进行清洗以去除干扰数据;
17.所述航线识别模块,依据集装箱班轮历史航线相对固定并会不断重复出现的特点,通过动态规划算法最长公共子串来识别集装箱班轮多次出现的航线循环,将识别出的最长公共子串作为识别出的集装箱班轮历史航线;
18.所述航线分类模块,结合业务逻辑,根据集装箱班轮历史航线经过的二级贸易区对识别出的集装箱班轮历史航线去重并且根据经过的一级贸易区进行编码,确保每条识别出的集装箱班轮历史航线均具有唯一编码,再根据集装箱班轮历史航线的一级贸易区编码对集装箱班轮历史航线进行分类;
19.所述航线运力识别监控模块,将每艘集装箱班轮的历史动态与识别出的集装箱班轮历史航线匹配,并根据相似度将集装箱班轮历史航线细化到对应的港口航线,对任意两港口或任意两贸易区自动获取经过所述两港口或两贸易区的所有集装箱班轮历史航线,进而进行运力统计和运力变化分析。
20.优选地,所述数据采集处理模块采集的ais数据包括集装箱班轮的ais静态和动态信息、集装箱班轮挂港情况、港口信息;将ais数据进行清洗包括去掉ais数据缺失量超过阈值的数据、修船、起始港有缺失、终点港有缺失或港口为未知的数据以及去掉起点港与终点港为相同港口的数据,并将起始港和终点港分别匹配到相应的国家和区域,所述区域涉及集装箱班轮历史航线中对贸易区的划分,将贸易区分为一级贸易区和二级贸易区。
21.优选地,所述航线识别模块将集装箱班轮历史上经过的所有贸易区作为一个总字
符串,将待识别的集装箱班轮历史航线作为子字符串,识别集装箱班轮历史航线的过程为利用动态规划算法寻最长公共子字符串的过程,寻出来的最长公共子字符串作为一条固定的集装箱班轮贸易区的历史航线。
22.优选地,所述航线分类模块结合业务逻辑,根据集装箱班轮历史航线经过的二级贸易区对识别出的集装箱班轮历史航线去重,去掉经过的二级贸易区的数量和顺序都相同只是由于子字符串选择了不同起点而造成的不同航线,对去重后的集装箱班轮历史航线根据其经过的一级贸易区进行编码,通过字母和数字结合的方式,确保每条识别出的集装箱班轮历史航线均具有唯一编码。
23.优选地,所述航线运力识别监控模块将每艘集装箱班轮的历史动态与识别出的集装箱班轮历史航线匹配,使用jaccard相似系数判断港口航线的相似度,并根据相似度将集装箱班轮历史航线细化到对应的港口航线,提取港口航线的起始时间和终止时间、航线每个港口的抵离港时间、航行时长及里程、靠泊时长信息,将港口航线分为东西向和南北向并确定其起终点港口;再对任意两港口或任意两贸易区自动获取经过所述两港口或两贸易区的所有集装箱班轮历史航线,进而进行运力统计和运力变化分析。
24.本发明的有益效果为:
25.本发明提供的一种集装箱班轮历史航线识别分类方法,主要是利用动态规划算法,结合 ais数据特点、集装箱航运的区域特点和集装箱班轮的实际业务逻辑特征,完成全球集装箱班轮历史航线的识别,并根据航线经过的港口提炼出航线的相关信息,如航线经过的贸易区、国家等,对识别出的历史航线进行智能分类,进而对不同类别的航线运力规划提供数据支持。本发明的数据来源均为集装箱班轮历史上真实的航行数据,由此确保了识别出的航线的真实性和准确性;本发明为所有的集装箱班轮航线定义了一个统一的标准,为分航线的运力统计和监控提供了支持,解决了目前各船公司对集装箱班轮航线的划分没有一个统一的标准导致航线运力分类识别障碍等问题。通过业务逻辑从贸易区开始对航线进行识别和分类,避免了从港口角度每次可能经过港口不完全相同无法识别成功的问题。采用的动态规划算法,算法相对较为简单,运行起来速度快;同时保留了各航线相关信息,为航线运力统计和航线运力变化分析提供数据基础。
26.本发明还涉及一种集装箱班轮历史航线识别分类系统,该系统与上述的集装箱班轮历史航线识别分类方法相对应,可理解为是一种实现上述集装箱班轮历史航线识别分类方法的系统,包括依次连接的数据采集处理模块、航线识别模块、航线分类模块和航线运力识别监控模块,各模块相互协同工作,利用集装箱班轮的ais数据,并结合业务逻辑,识别出全球集装箱班轮的历史航线,并根据航线经过的港口提炼出航线的相关信息,如航线经过的贸易区、国家等,对识别出的历史航线进行智能分类,进而对不同类别的航线运力规划提供数据支持,提高了航线识别的效率。
附图说明
27.图1是本发明集装箱班轮历史航线识别分类方法的流程图。
28.图2是本发明集装箱班轮历史航线识别分类方法的优选流程图。
具体实施方式
29.下面结合附图对本发明进行说明。
30.本发明涉及一种集装箱班轮历史航线识别分类方法,该方法的流程图如图1所示,包括如下步骤:
31.一、数据采集处理步骤,采集集装箱班轮的ais数据,并将ais数据进行清洗等预处理,去除无用的干扰数据。
32.如图2所示优选流程,可从数据库提取航线过程中需要集装箱班轮的ais静态和动态信息、集装箱班轮挂港情况、港口信息等,具体来说包括船舶mmsi、船型、每个航段的起始和结束时间及起终点港口、港口所属的国家和区域、港口经纬度等。获得上述数据后,先对 ais数据进行预处理,去掉ais有问题(如缺失量超过阈值,即缺失过多)、修船、起始港和终点港有缺失或港口为未知的数据以及起点港与终点港为相同港口的数据,并将起始港和终点港分别匹配到相应的国家和区域。这里的区域参考已知的集装箱班轮历史航线中对贸易区的划分,将贸易区分为一级贸易区和二级贸易区。
33.二、航线识别步骤,依据集装箱班轮历史航线相对固定并会不断重复出现的特点,通过动态规划算法最长公共子串来识别集装箱班轮多次出现的航线循环,将识别出的最长公共子串作为识别出的集装箱班轮历史航线。该步骤是基于动态规划算法对不同公司不同船型的集装箱班轮历史航线进行识别。
34.(1)动态规划算法dp
35.动态规划(dynamic programming)是一种多阶段决策最优解模型,一般用来求最值问题,多数情况下它可以采用自下而上的递推方式来得出每个子问题的最优解(即最优子结构),进而自然而然地得出依赖子问题的原问题的最优解。
36.动态规划算法的基本思想是将待求解问题分解成若干个子问题,先求解子问题,然后从这些子问题的解得到原问题的解。适合于用动态规划求解的问题,经分解得到子问题往往不是互相独立的。如果我们能够保存已解决的子问题的答案,而在需要时再出已求得的答案,这样就可以避免大量的重复计算,节省时间。我们可以用一个表来记录所有已解的子问题的答案。不管该子问题以后是否被用到,只要它被计算过,就将其结果填入表中。这就是动态规划算法的基本思路。具体的动态规划算法多种多样,但它们具有相同的填表格式。
37.(2)利用动态规划识别集装箱班轮历史航线最长公共子串
38.可利用python的psycopg2库,连接存储数据的数据库,用于提取集装箱船的历史航行数据。根据集装箱班轮的航线相对来说较为固定和在港口间环绕航行的特点,参考动态规划算法中对最长公共子串的定义,将集装箱班轮历史上经过的所有贸易区看成一个大字符串(或者说是总字符串)。由于子串要求在原字符串中是连续的,而子序列只需保持相对顺序一致,并不要求连续,而待识别的班轮航线都是连续的序列,所以将需要识别出的集装箱班轮历史航线看作子字符串。由于集装箱班轮历史航线相对固定且会不断重复出现的特点,识别集装箱班轮历史航线的过程可以看作一个利用动态规划算法寻最长公共子串(子串即子字符串) 的过程,通过这种方法出来的最长公共子串可以认为是一条固定的集装箱班轮贸易区的历史航线。
39.三、航线分类步骤,结合业务逻辑,根据集装箱班轮历史航线经过的二级贸易区对
识别出的集装箱班轮历史航线去重并且根据经过的一级贸易区进行编码,确保每条识别出的集装箱班轮历史航线均具有唯一编码,再根据集装箱班轮历史航线的一级贸易区编码对集装箱班轮历史航线进行分类。该步骤实质为结合业务逻辑提取航线相关信息提取并对航线进行分类。
40.(1)从业务逻辑上来看,全球集装箱班轮航线主要在亚太、欧洲、美洲、拉非四个贸易区之间循环往复运行,以上四个贸易区作为一级贸易区。根据班轮航线的业务逻辑可以将这四个一级贸易区继续细分为远东、西北欧、美西北、美西南等18个二级贸易区。根据集装箱班轮的港口历史数据,将港口信息映射到这18个二级贸易区中,得到集装箱班轮的贸易区历史航线数据。
41.(2)由于集装箱班轮航线与船型及船公司都有密切的关系,集装箱班轮的贸易区航线呈现出同船型、同船公司的航线规律性更明显,而不同船型、不同船公司的航线规律性不够明显的特征。为了方便定义,分别考虑不同公司不同船型的贸易区历史数据,将原始数据集切分为多个部分。船型指对于给定的运输任务,可以采用不同类型的船舶运输,如不同载箱量、不同主尺度、不同航速或不同结构形式的船舶等。船型选择就是在特定的航线和货流结构条件下,按照一定的原则和要求选择最适宜的船舶类型来从事运输任务,以达到最优的效果。
42.(3)完成贸易区航线识别后,出历史数据中出现两次及以上的贸易区航线作为第一阶段确定下的标准航线,而其他贸易区航线则作为临时航线备用。
43.(4)对第一阶段到的贸易区航线进行去重,去掉经过的二级贸易区的数量和顺序都相同,只是由于子字符串选择了不同起点而造成的不同航线。例如a-b-c和b-c-a两条航线,由于集装箱班轮航线具有循环往复的特点,并没有一个标准的起终点,所以上述两条应当算同一条航线。
44.(5)对去重后的贸易区航线根据其经过的一级贸易区进行编码,航线经过的二级贸易区完全相同则认为是同一条航线,通过字母和数字结合的方式,保证每条航线均有唯一的编码与之一一对应。
45.(6)根据集装箱班轮航线的一级贸易区编码,对贸易区航线进行分类。重要航线包括跨太平洋航线(远东-北美航线)、跨大西洋航线(北美-欧洲、地中海航线)、欧洲、地中海
‑ꢀ
远东航线、远东区域内航线、远东-澳新航线、欧洲、地中海-西非、南非航线。
46.四、航线运力识别监控步骤,将每艘集装箱班轮的历史动态与识别出的集装箱班轮历史航线匹配,并根据相似度将集装箱班轮历史航线细化到对应的国家航线和港口航线,对任意两港口或任意两贸易区自动获取经过所述两港口或两贸易区的所有集装箱班轮历史航线,进而进行运力统计和运力变化分析。
47.(1)由于集装箱班轮运力监控需要细化到港口层面,根据航线经过的二级贸易区信息,将贸易区的历史航线细化到对应的国家航线和港口航线。由于同一条港口航线每次经过的港口可能非常相似但不完全相同,可以使用jaccard相似系数判断港口航线的相似度。jaccard 系数用于比较有限样本集之间的相似性与差异性,系数值越大,样本相似度越高。给定两个集合a,b,jaccard系数定义为a与b交集的大小与a与b并集的大小的比值,定义如下:
[0048][0049]
用于计算两条港口航线相似度时,按照上式计算两条港口航线经过港口的交集和并集的比例,相似度大于0.7的航线认为是同一条港口航线,否则就不是同一条港口航线,不同港口航线需要用不同的数字编号区别。
[0050]
(2)出每条港口航线的基本信息。如图2所示,首先是港口航线起始时间和终止时间,用以确定该航线运营的相关年份时间信息。其次是各港口的到港时间、离港时间、航行时长、航行里程、靠泊时长等信息。同一港口航线取时长和里程数据的中位数作为该港口航线的标准推荐值保存。
[0051]
(3)出每条港口航线的航行走向。通过比较港口航线经过的港口东西向和南北向的距离来判断港口航线的方向是东西向还是南北向,并取其最东、最西或最南、最北的港口作为航线起终点。从数据库中取出港口的经纬度坐标,利用半正矢公式—haversine公式,可以通过经纬度求解两点球面距离。haversine公式计算两点球面距离的方法如下:
[0052][0053]
其中lat1、lon1、lat2、lon2分别为两点的经纬度坐标,r为地球半径,计算中可取平均值 6371km。
[0054]
(4)统计港口航线的运力。已知任意两港或任意两贸易区,可以出经过这两港或两贸易区的所有集装箱班轮历史航线,根据已经定义好的港口航线和贸易区航线进行运力统计和运力变化分析。
[0055]
以mmsi为219861000的集装箱班轮为例,对本发明集装箱班轮历史航线识别分类方法进行进一步的说明。
[0056]
一、数据采集处理步骤:
[0057]
使用python中的psycopg2库连接postgresql数据库,从数据库中取出mmsi为219861000 的集装箱船的ais历史动态数据,以及港口的相关信息,包括港口所属的国家和贸易区、港口经纬度等。对ais数据进行预处理,去掉ais有问题(如缺失过多)、修船、起始港和终点港有缺失或港口为未知的数据以及起点港与终点港为相同港口的数据,并将起始港和终点港分别匹配到相应的国家和区域。
[0058]
二、航线识别步骤,基于动态规划算法对不同公司不同船型的集装箱班轮历史航线进行识别:
[0059]
根据船舶的历史航行动态,将该集装箱船历史上经过的所有贸易区看作一个大的字符串 (总字符串),使用动态规划算法在历史动态中查重复出现的最长公共子串(最长公共子字符串),作为识别出的历史航线。该集装箱班轮自2020年2月起一直在跑亚洲到欧洲的航线,经过的二级贸易区如表1所示的mmsi为219861000的集装箱班轮历史航线识别结果:
[0060]
表1
[0061][0062]
三、航线分类步骤,结合业务逻辑提取航线相关信息提取并对航线进行分类:
[0063]
结合业务逻辑,对上述航线进行分类和编码,从一级贸易区来看,该航线属于亚太-欧洲贸易区航线,采用字母与数字结合的方式,将其编码为ap-eu8,其中ap代表亚太贸易区, eu代表欧洲贸易区。如表2所示的mmsi为219861000的集装箱班轮历史航线编码结果:
[0064]
表2
[0065][0066]
四、航线运力识别监控步骤,进行集装箱班轮历史航线运力识别及监控:
[0067]
将上述贸易区航线细化到港口层面,并提取航线每个港口的抵离港时间、航行时长及里程、靠泊时长等信息,如表3所示的mmsi为219861000的集装箱航线的相关信息:
[0068]
表3
[0069][0070]
从港口层面来看该航线每次经过的港口并不完全相同,根据jaccard相似度计算出的相似航线作为相同航线,如表4所示的mmsi为219861000的集装箱班轮港口航线,这几条航线的相似度大于0.7,认为是同一条航线,取其众数作为标准推荐航线,即上海洋山-大连-天津
ꢀ‑
釜山-宁波-上海洋山丹戎帕拉帕斯-苏伊士运河-鹿特丹-不来梅港-哥德堡-奥尔胡斯-不来梅港
ꢀ‑
威廉港-丹吉尔-苏伊士运河-新加坡-上海-洋山。
[0071]
表4
[0072][0073]
根据已经识别出的航线可以对经过任意两港后任意两贸易区的集装箱班轮航线进行运力统计和运力变化分析,进而可以进行各船公司运营效率对比分析。
[0074]
本发明还涉及一种集装箱班轮历史航线识别分类系统,该系统与上述的集装箱班轮历史航线识别分类方法相对应,可理解为是一种实现上述集装箱班轮历史航线识别分类方法的系统,包括依次连接的数据采集处理模块、航线识别模块、航线分类模块和航线运力识别监控模块。其中,所述数据采集处理模块,采集集装箱班轮的ais数据,并将ais数据进行清洗以去除干扰数据;所述航线识别模块,依据集装箱班轮历史航线相对固定并会不断重复出现的特点,通过动态规划算法最长公共子串来识别集装箱班轮多次出现的航线循环,将识别出的最长公共子串作为识别出的集装箱班轮历史航线;所述航线分类模块,结合业务逻辑,根据集装箱班轮历史航线经过的二级贸易区对识别出的集装箱班轮历史航线去重并且根据经过的一级贸易区进行编码,确保每条识别出的集装箱班轮历史航线均具有唯一编码,再根据集装箱班轮历史航线的一级贸易区编码对集装箱班轮历史航线进行分类;所述航线运力识别监控模块,将每艘集装箱班轮的历史动态与识别出的集装箱班轮历史航线匹配,并根据相似度将集装箱班轮历史航线细化到对应的港口航线,对任意两港口或任意两贸易区自动获取经过所述两港口或两贸易区的所有集装箱班轮历史航线,进而进行运力统计和运力变化分析。
[0075]
进一步地,所述数据采集处理模块采集的ais数据包括集装箱班轮的ais静态和动态信息、集装箱班轮挂港情况、港口信息;将ais数据进行清洗包括去掉ais数据缺失量超过阈值的数据、修船、起始港有缺失、终点港有缺失或港口为未知的数据以及去掉起点港与终点港为相同港口的数据,并将起始港和终点港分别匹配到相应的国家和区域,所述区域涉及集装箱班轮历史航线中对贸易区的划分,将贸易区分为一级贸易区和二级贸易区。
[0076]
进一步地,所述航线识别模块将集装箱班轮历史上经过的所有贸易区作为一个总字符串,将待识别的集装箱班轮历史航线作为子字符串,识别集装箱班轮历史航线的过程为利用动态规划算法寻最长公共子字符串的过程,寻出来的最长公共子字符串作为一条固定的集装箱班轮贸易区的历史航线。
[0077]
进一步地,所述航线分类模块结合业务逻辑,根据集装箱班轮历史航线经过的二级贸易区对识别出的集装箱班轮历史航线去重,去掉经过的二级贸易区的数量和顺序都相同只是由于子字符串选择了不同起点而造成的不同航线,对去重后的集装箱班轮历史航线根据其经过的一级贸易区进行编码,通过字母和数字结合的方式,确保每条识别出的集装箱班轮历史航线均具有唯一编码。
[0078]
进一步地,所述航线运力识别监控模块将每艘集装箱班轮的历史动态与识别出的集装箱班轮历史航线匹配,使用jaccard相似系数判断港口航线的相似度,并根据相似度将集装箱班轮历史航线细化到对应的港口航线,提取港口航线的起始时间和终止时间、航线每个港口的抵离港时间、航行时长及里程、靠泊时长信息,将港口航线分为东西向和南北向并确定其起终点港口;再对任意两港口或任意两贸易区自动获取经过所述两港口或两贸易区的所有集装箱班轮历史航线,进而进行运力统计和运力变化分析。
[0079]
本发明提供的集装箱班轮历史航线识别分类方法及系统,主要是利用动态规划算法,结合ais数据特点、集装箱航运的区域特点和集装箱班轮的实际业务逻辑特征,识别出全球集装箱班轮的历史航线,并根据航线经过的港口提炼出航线的相关信息,如航线经过的贸易区、国家等,对识别出的历史航线进行智能分类,为航线运力统计和航线运力变化分析提供数据基础,提高了航线识别的效率。
[0080]
应当指出,以上所述具体实施方式可以使本领域的技术人员更全面地理解本发明创造,但不以任何方式限制本发明创造。因此,尽管本说明书参照附图和实施例对本发明创造已进行了详细的说明,但是,本领域技术人员应当理解,仍然可以对本发明创造进行修改或者等同替换,总之,一切不脱离本发明创造的精神和范围的技术方案及其改进,其均应涵盖在本发明创造专利的保护范围当中。

技术特征:


1.一种集装箱班轮历史航线识别分类方法,其特征在于,包括以下步骤:数据采集处理步骤,采集集装箱班轮的ais数据,并将ais数据进行清洗以去除干扰数据;航线识别步骤,依据集装箱班轮历史航线相对固定并会不断重复出现的特点,通过动态规划算法最长公共子串来识别集装箱班轮多次出现的航线循环,将识别出的最长公共子串作为识别出的集装箱班轮历史航线;航线分类步骤,结合业务逻辑,根据集装箱班轮历史航线经过的二级贸易区对识别出的集装箱班轮历史航线去重并且根据经过的一级贸易区进行编码,确保每条识别出的集装箱班轮历史航线均具有唯一编码,再根据集装箱班轮历史航线的一级贸易区编码对集装箱班轮历史航线进行分类;航线运力识别监控步骤,将每艘集装箱班轮的历史动态与识别出的集装箱班轮历史航线匹配,并根据相似度将集装箱班轮历史航线细化到对应的港口航线,对任意两港口或任意两贸易区自动获取经过所述两港口或两贸易区的所有集装箱班轮历史航线,进而进行运力统计和运力变化分析。2.根据权利要求1所述的集装箱班轮历史航线识别分类方法,其特征在于,所述数据采集处理步骤采集的ais数据包括集装箱班轮的ais静态和动态信息、集装箱班轮挂港情况、港口信息;将ais数据进行清洗包括去掉ais数据缺失量超过阈值的数据、修船、起始港有缺失、终点港有缺失或港口为未知的数据以及去掉起点港与终点港为相同港口的数据,并将起始港和终点港分别匹配到相应的国家和区域,所述区域涉及集装箱班轮历史航线中对贸易区的划分,将贸易区分为一级贸易区和二级贸易区。3.根据权利要求1所述的集装箱班轮历史航线识别分类方法,其特征在于,所述航线识别步骤将集装箱班轮历史上经过的所有贸易区作为一个总字符串,将待识别的集装箱班轮历史航线作为子字符串,识别集装箱班轮历史航线的过程为利用动态规划算法寻最长公共子字符串的过程,寻出来的最长公共子字符串作为一条固定的集装箱班轮贸易区的历史航线。4.根据权利要求1至3之一所述的集装箱班轮历史航线识别分类方法,其特征在于,所述航线分类步骤结合业务逻辑,根据集装箱班轮历史航线经过的二级贸易区对识别出的集装箱班轮历史航线去重,去掉经过的二级贸易区的数量和顺序都相同只是由于子字符串选择了不同起点而造成的不同航线,对去重后的集装箱班轮历史航线根据其经过的一级贸易区进行编码,通过字母和数字结合的方式,确保每条识别出的集装箱班轮历史航线均具有唯一编码。5.根据权利要求1至3之一所述的集装箱班轮历史航线识别分类方法,其特征在于,所述航线运力识别监控步骤将每艘集装箱班轮的历史动态与识别出的集装箱班轮历史航线匹配,使用jaccard相似系数判断港口航线的相似度,并根据相似度将集装箱班轮历史航线细化到对应的港口航线,提取港口航线的起始时间和终止时间、航线每个港口的抵离港时间、航行时长及里程、靠泊时长信息,将港口航线分为东西向和南北向并确定其起终点港口;再对任意两港口或任意两贸易区自动获取经过所述两港口或两贸易区的所有集装箱班轮历史航线,进而进行运力统计和运力变化分析。6.一种集装箱班轮历史航线识别分类系统,其特征在于,包括依次连接的数据采集处
理模块、航线识别模块、航线分类模块和航线运力识别监控模块,所述数据采集处理模块,采集集装箱班轮的ais数据,并将ais数据进行清洗以去除干扰数据;所述航线识别模块,依据集装箱班轮历史航线相对固定并会不断重复出现的特点,通过动态规划算法最长公共子串来识别集装箱班轮多次出现的航线循环,将识别出的最长公共子串作为识别出的集装箱班轮历史航线;所述航线分类模块,结合业务逻辑,根据集装箱班轮历史航线经过的二级贸易区对识别出的集装箱班轮历史航线去重并且根据经过的一级贸易区进行编码,确保每条识别出的集装箱班轮历史航线均具有唯一编码,再根据集装箱班轮历史航线的一级贸易区编码对集装箱班轮历史航线进行分类;所述航线运力识别监控模块,将每艘集装箱班轮的历史动态与识别出的集装箱班轮历史航线匹配,并根据相似度将集装箱班轮历史航线细化到对应的港口航线,对任意两港口或任意两贸易区自动获取经过所述两港口或两贸易区的所有集装箱班轮历史航线,进而进行运力统计和运力变化分析。7.根据权利要求6所述的集装箱班轮历史航线识别分类系统,其特征在于,所述数据采集处理模块采集的ais数据包括集装箱班轮的ais静态和动态信息、集装箱班轮挂港情况、港口信息;将ais数据进行清洗包括去掉ais数据缺失量超过阈值的数据、修船、起始港有缺失、终点港有缺失或港口为未知的数据以及去掉起点港与终点港为相同港口的数据,并将起始港和终点港分别匹配到相应的国家和区域,所述区域涉及集装箱班轮历史航线中对贸易区的划分,将贸易区分为一级贸易区和二级贸易区。8.根据权利要求6所述的集装箱班轮历史航线识别分类系统,其特征在于,所述航线识别模块将集装箱班轮历史上经过的所有贸易区作为一个总字符串,将待识别的集装箱班轮历史航线作为子字符串,识别集装箱班轮历史航线的过程为利用动态规划算法寻最长公共子字符串的过程,寻出来的最长公共子字符串作为一条固定的集装箱班轮贸易区的历史航线。9.根据权利要求6至8之一所述的集装箱班轮历史航线识别分类系统,其特征在于,所述航线分类模块结合业务逻辑,根据集装箱班轮历史航线经过的二级贸易区对识别出的集装箱班轮历史航线去重,去掉经过的二级贸易区的数量和顺序都相同只是由于子字符串选择了不同起点而造成的不同航线,对去重后的集装箱班轮历史航线根据其经过的一级贸易区进行编码,通过字母和数字结合的方式,确保每条识别出的集装箱班轮历史航线均具有唯一编码。10.根据权利要求6至8之一所述的集装箱班轮历史航线识别分类系统,其特征在于,所述航线运力识别监控模块将每艘集装箱班轮的历史动态与识别出的集装箱班轮历史航线匹配,使用jaccard相似系数判断港口航线的相似度,并根据相似度将集装箱班轮历史航线细化到对应的港口航线,提取港口航线的起始时间和终止时间、航线每个港口的抵离港时间、航行时长及里程、靠泊时长信息,将港口航线分为东西向和南北向并确定其起终点港口;再对任意两港口或任意两贸易区自动获取经过所述两港口或两贸易区的所有集装箱班轮历史航线,进而进行运力统计和运力变化分析。

技术总结


本发明提供了一种集装箱班轮历史航线识别分类方法及系统,该方法包括数据采集处理步骤、航线识别步骤、航线分类步骤和航线运力识别监控步骤,利用集装箱班轮的AIS数据,并结合业务逻辑,识别出全球集装箱班轮的历史航线,并根据航线经过的港口提炼出航线的相关信息,如航线经过的贸易区、国家等,对识别出的历史航线进行智能分类,为航线运力统计和航线运力变化分析提供数据基础,提高了航线识别的效率。率。率。


技术研发人员:

张健豪 张哲熙

受保护的技术使用者:

中远海运科技股份有限公司

技术研发日:

2022.07.25

技术公布日:

2022/12/22

本文发布于:2024-09-21 01:29:18,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/46068.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:航线   班轮   集装箱   历史
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议