连续手写体不规则数码识别的研究与设计
时间:2022-03-20 10:13:01 浏览次数:次
摘要:摘要:字符是人类信息交流的主要载体之一,手写体数字识别技术是多年来的研究热点问题,也是字符识别中的一个非常重要的类别。连续不规则手写体数码识别在一定的环境下应用十分广泛。对于数码识别要求有很高的识别可靠性。手写体数字识别除对识别精度的要求和可靠性外,还对识别速度、识别率等问题有一定的要求。
关键词:预处理;特征提取;BP神经网络;手写体数字识别
中图分类号:TP391.4 文献标识码:A文章编号:1007-9599 (2012) 06-0000-02
手写数字识别(Handwritten Numeral Recognition)是光学字符识别技术(Optical Character Recognition)的一个分支,它研究的对象是:如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字。在整个OCR领域中,最为困难的就是脱机手写字符的识别。手写数字识别技术,涉及到模式识别和图像处理、人工智能、形式语言和模糊数学、组合数学、信息论、计算机等学科;同时也涉及语言文字学、心理学、生物学等,是一门综合性的技术[1]。
一、数字识别基本原理
人工神经网络,是从生物学神经系统中发展而来的一门学科,在生物学的神经网络中,神经元就是最基本的单元。一个神经网络主要是有三个方面的要素来祖征的,一是:神经元计算特性、二是网络结构、三是连接值的学习规则。一个神经细胞是有细胞体、树突、轴突和突触四个部分组成的,一个完整的神经元结构模型如图1.1所示:
图1.1结构模型
图中的x1、x2、x3…、xn为神经元的输入,uj为神经元的内部状态,j为阀值,Wij为ui到uj连接的权值, yj为输出,上述模型可以描述为
(1.1)
这个函数被称为神经元的激活函数(Active function)[3]。通常所用的神经元特性函数如图1.2所示:
图1.2 常用特性函数示意图
(一)神经网络的结构和学习规则
神经细胞是通过突触相互联系的,将大量的神将元按照一定的规则联接成为神经网络,构成十分复杂的大脑神经网络系统,可以建立许多种神经网络模型[4]。
根据联接方式的不同,大致可以分为两大类:层状和网状[5]。
层状的神经网络结构是由许多层组成,每一层中有若干个神经元并且相邻神经元是单向联接的,而且同层间的神经元是不能联接的;和层状的神经网络不同,网状的神经网络中,每个神经元之间都有可能为双向联接的,如图1.3所示。
图1.3 不同的神经网络的联接形式
二、前向多层网络的结构及其BP学习算法
(一)感知器
感知器信息处理的规则为:
(2.1)
式2.1中 为输入分量, 为它在t时的第i个输入的值, 是阀值, 即为阶跃函数。
所以感知器学习的规则为:
(2.2)
其中 为学习率(0< <1), 为导师信号, 是则为实际输出。
通过不断对权重的调整,使得 对大量样本保持稳定,则学习过程结束。
(二)前向多层网络的BP学习算法
目前研究较多的网络形式中向前网络占有很高的比重,它分为输入层、隐含层、输出层三部分。隐含层又可分为一层或者多层[6],如图2.1所示。
网络中的原始信息是由输入单元的状态所决定的,输入单元的活性决定着隐含单元的活性,同样隐含单元的活性决定着输出单元的行为。
(三)误差反向传播算法计算步骤
我们可以假设:i、j为输入层和它前一层中的一个单元,从而运用加权输入 来求解出输出单元i的活性,即
(2.3)
第i个单元和第j个单元的联接权值即为 ,而 则视为前一层中第i个单元的活性水平。
解出的 ,我们可以用一个S函数来求解 ,即:
(2.4)
经过上述计算我们可以所有输出元活性后,
利用 来计算网络的误差:(2.5)
式2.5中输出层第j个单元的活性水平有 来表示,而 则表示第j个单元的期望输出。
简单的说反向传播算法包括以下4个步骤:
(1)当一个输出单元的活性被改变时,误差倒数 就是期望活性与实际活性的差。
(2.6)
(2)求一个单元在所接受总输入量变化时的误差倒数 ,即式2.6的结果乘以输出变化率 ,即:
(2.7)
(3)计算一个与输出单元联接权值改变时的误差变化率EW。
(2.8)
可以看出 为式2.7的结果乘以与 。
(4)把对各输出单元的所有单独影响相加。
(2.9)
三、BP算法的实现流程
BP算法实现按如下步骤进行:
(1)首先进行初始化,并给所有的权值赋以随机任意小的值,并对阀值进行初值设定;
(2)拟定训练数据合集,并给出输入向量x和期望输出 ;
(3)计算y(实际输出值)值
(3.1)
其中函数 ()为Sigmoid函数,即:
(3.2)
(4)对权值进行调整,按照误差进行反向传播,从而得到隐含层的修正权值
(3.3)
式中节点j的误差为 , 为大于零的增益,根据节点j的不同形式计算出 :
中的 为大于零的增益, 为节点j的误差, 的计算根据节点j的形式不同,由下式分别计算
(3.4)
(5)返回第(2)步重复,直至误差满足要求为止[6]。
参考文献:
[1]张捷.手写数字识别的研究与应用.硕士学位论文.西安:西安建筑科技大学,2004
[2]胡硕.基于遗传算法的图像分割研究.硕士学位论文.长春:东北师范大学,2003
[3]朱晓波.基于BP神经网络的手写体数字识别分析与研究.硕士学位论文.武汉:武汉科技大学,2003
[4]魏兴国.基于核方法的手写体数字识别研究.硕士学位论文.南京:南京理工大学,2003
[5]蒋伟.基于GA的神经网络在手写数字识别中的应用研究.硕士学位论文.成都:四川大学,2004
[6]瞿海金.手写体数字识别方法的研究与实现.硕士学位论文.南京:南京理工大学,2005
[连续手写体不规则数码识别的研究与设计]相关文章