光学字符识别

Optical character recognition

英恒利将OCR技术应用在车牌识别和仪表读数识别系统中,结合自研发的平台与算法,不断地训练与优化。目前系统已可以识别不同制式的车牌、不同仪表的读数,并且识别率高达99%。

OCR 是指电子设备检查图像中的字符,通过亮、暗等模式识别确定其形状,然后用字符识别方法将形状翻译成计算机文字。

整个识别过程涉及到一系列图像处理与机器学习的算法。图像采集后要进行预处理,以便后续进行特征提取与学习。预处理的工作对于图像识别效果非常重要,但是却容易被忽视。其实这里的工作步骤很多,包括旋转(rotation)、灰度化(grayscale)、降噪 (noisy reduction)、二值化(binarization)、字符检测 (detection)、字符切分(segmentation) 以及归一化(normalization) 等子步骤。首先将图像的背景颜色、识别对象颜色进行处理,再通过滤波器、深度学习下的图像约束器 (regularizer) 等算法去除噪点。降噪的效果对于特征提取的影响很大。二值化将识别对象与背景区分开来,随后进字符切分,将图像中的文字分割成单个文字,因为识别时是按单个字符来识别的。如果图像角度有倾斜还要进行倾斜校正。归一化是指将单个文字图像规整到同样的尺寸,在同一个规格下,应用统一的算法。

图像预处理结束后便进行特征提取,此处需要规定特征,然后再由分类器对其进行分类。同时,分类器也需要进行训练。所以不同的识别对象对于OCR算法要求也完全不同。