基于CRNN-CTC模型研究的汽车车牌识别系统

·技术与应用·基于CRNN-CTC模型研究的汽车车牌识别系统

■赵文艳徐杰李梦雪

郑州信息工程职业学院河南郑州 450000

摘要：为了更好的识别汽车车牌，以CRNN-CTC模型和RNN序列为基础，从识别汽车车牌角度出来，对OCR技术进行了介绍。通过分析发现，利用CRNN-CTC模型和RNN序列研发车牌识别系统，可以有效地提高交通管理、交通道路监视管理系统。

关键词：CRNN-CTC，OCR；图像识别；文字识别；车牌识别系统

引言

轴流式压气机随着我国汽车数量日益增加，城市交通状况越来越成为相关部门所关注地焦点问题，如何高效维护交通安全和城市治安，防止交通堵塞，实现交通自动化管理，就需要运用图像处理和识别技术，研发相应的交通道路监视管理系统、车牌识别系统，可以有效地提高交通管理。

1.车牌识别技术介绍

1.1车牌识别技术

车牌识别技术在道路监控管理、智能停车场应用越来越广泛，车牌识别技术是通过从复杂的背景中识别汽车牌照并自动提取车牌内容。国际交通技术对识别率的指标论述，要求24小时车牌识别的正确识别率85%-95%。

识别速度是决定了一个车牌识别系统是否能够满足实时实际应用的要求。如果需要几秒钟，甚至几分钟才能识别出结果，那么这个系统就会因为满足不了实际应用中的实时要求而毫无实用意义。

1.2.车牌识别技术分类

目前车牌硬件识别分为两种，带有单独的车牌识别仪和前端硬件识别。前端硬件识别一体式摄像机是将传统单独的车牌识别仪嵌入至摄像机中，实现前端硬件与摄像机一体化，完现图像抓拍、视频流传输、字符识别、道闸抬杆等一系列的工作。

软件识别是在电脑上安装一个配套的车牌识别软件，对抓拍的图片进行识别处理。它的工作方式是通过摄像机连续抓拍多张照片，选择其中较为清晰的一张，然后通过电脑软件进行字符处理，实现车牌识别的。多功能折叠椅

车牌识别技术(Vehicle License Plate Recognition, VLPR) ，它以计算机技术、图像处理技术、模糊识别为基础，通过建立车辆的特征模型，来识别车辆的特征，如汽车的车牌、车的型号、车的颜等。

水表箱

1.3 CRNN-CTC模型来实现OCR文字识别

阻尼线我们重点要介绍的是使用CRNN-CTC模型来实现OCR文字识别。CRNN-CTC算法不但对固定长度的文字有良好的识别效果，而且对变长的文字也有不错的识别效果。

低频声波吹灰器2. OCR技术介绍

2.1 OCR技术概述

OCR，英文上是Optical Character Recognition，简称光学字符识别，它可以把图像中的文字进行识别，并以文本的形式返回，比如身份证识别、数码相机或扫描仪，或者检查纸上打印的字符。

2.2OCR技术路线

通常，OCR分为图像预处理和文字识别两个步骤。一个典型的OCR的流程是从获得图像信息，对图像信息预处理，再进行文字识别，最后输出图像。

随着人工智能的发展，这一阶段衍生出许多深度学习网络结构。在汽车车牌的文字识别中，通过深度学习做文字识别，所涉及到网络不管是CNN、VGG、RESNET，越深的网络训练最终的模型效果越好，但考虑到训练的难度和后期线上部署时预测的速度，第一步需要搭建网络和计算图，文字识别是

一个多分类任务，比如豫A4H215的车版文字识别就是A4H215个类别的分类任务。第二步进行模型训练，在数据输入的场景中，从硬盘中读取输入，放到内存中，速度较慢。如果在训练神经网络的场景中，训练网络与读取数据异步，主线程训练网络，其他线程读取硬盘数据存入内存。在汽车车牌图像文字识别中，利用CNN网络对固定长度的文字进行识别，比如对于简单验证码进行识别，识别率非常高。

它的缺点是利用CNN网络的图像文字识别技术大多通过识别每个单字符以实现全文的识别，这一过程很容易导致上下文信息的丢失，虽然对于单个字符有较高的识别正确率，但对于整体语句的识别，其正确率却难以保证。

对于序列问题的处理，RNN是强项，它衍生出了新的一类算法，分别是CNN+RNN+CTC和CNN+RNN+Attention。这两大方法主要区别在于最后的输出层即翻译层，如何将网络学习到的序列特征信息转化为最终的识别结果。

2.3 CRNN-CTC算法

CRNN-CTC的网络结构从下到上包括三部分：卷积层使用CNN 是从输入图像中提取特征序列，循环层使用RNN或lstm预测从卷积层获取的特征序列的标签分布，转录层使用CTC把从循环层获取的标签分布通过去重整合等操作转换成最终的识别结果。

2.4 CRNN部分

在CRNN模型中，去除了全连接层，采用标准CNN模，来从输入图像中提取序列特征。在进入网络之前，所有的图像需要缩放到相同的高度。然后从卷积后产生的特征图中提取特征向量序列，这些特征向量序列作为循环层的输入。具体来说，特征序列的每一个特征向量在特征图上按列从左到右生成。这意味着第i个特征向量是所有特征图第i列的连接。在我们的设置中每列的宽度固定为单个像素。

在卷积层，最大池化层和激活函数是在局部区域上执行的，因此它们是平移不变的。因此，特征图的每列对应于原始图像的一个矩形区域（称为感受野），并且这些矩形区域与特征图上从左到右的相应列具有相同的顺序。特征序列中的每个向量关联一个矩形区域（感受野），并且可以被认为是该区域的图像描述符。

2.5 RNN部分

卷积层的顶部是一个深度双向循环神经网络，我们把它称为循环层。作为循环层，它的优点有：第一RNN模型具有很强的捕获序列内上下文信息的能力。第二个优点是RNN模型可以将误差值反向传播到上一步的卷积层，从而允许我们在统一的网络中共同训练循环层和卷积层。第三个优点是RNN模型能够从头到尾对任意长度的序列进行操作。

2.6转录层

转录层：转录层是将RNN所做的每帧预测转换成标签序列的过程。从数学上分析，转录是根据每帧预测到具有最高概率的标签序列。在实际操作中，词典是一组标签序列，预测受拼写检查字典约束，它存在两种转录模式，即无词典转录和基于词典的转录。在无词典模式中，预测时没有任何词典。在基于词典的模式中，通过选择具有最高概率的标签序列进行预测。

（下转第253页）pvc面膜

2020年10期 ·251

本文发布于:2024-09-24 15:24:22，感谢您对本站的认可！

本文链接：https://www.17tex.com/tex/3/149209.html

上一篇：一种录入登记条盒卷烟32位喷码的识别系统及其实现方法[发明专利]

下一篇：计算机图像处理和识别技术分析