常裕文档网    > 范文大全 > 公文范文 >

连续手写体不规则数码识别的研究与设计

时间:2022-03-20 10:13:01  浏览次数:

摘要:摘要:字符是人类信息交流的主要载体之一,手写体数字识别技术是多年来的研究热点问题,也是字符识别中的一个非常重要的类别。连续不规则手写体数码识别在一定的环境下应用十分广泛。对于数码识别要求有很高的识别可靠性。手写体数字识别除对识别精度的要求和可靠性外,还对识别速度、识别率等问题有一定的要求。

关键词:预处理;特征提取;BP神经网络;手写体数字识别

中图分类号:TP391.4 文献标识码:A文章编号:1007-9599 (2012) 06-0000-02

手写数字识别(Handwritten Numeral Recognition)是光学字符识别技术(Optical Character Recognition)的一个分支,它研究的对象是:如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字。在整个OCR领域中,最为困难的就是脱机手写字符的识别。手写数字识别技术,涉及到模式识别和图像处理、人工智能、形式语言和模糊数学、组合数学、信息论、计算机等学科;同时也涉及语言文字学、心理学、生物学等,是一门综合性的技术[1]。

一、数字识别基本原理

人工神经网络,是从生物学神经系统中发展而来的一门学科,在生物学的神经网络中,神经元就是最基本的单元。一个神经网络主要是有三个方面的要素来祖征的,一是:神经元计算特性、二是网络结构、三是连接值的学习规则。一个神经细胞是有细胞体、树突、轴突和突触四个部分组成的,一个完整的神经元结构模型如图1.1所示:

图1.1结构模型

图中的x1、x2、x3…、xn为神经元的输入,uj为神经元的内部状态,j为阀值,Wij为ui到uj连接的权值, yj为输出,上述模型可以描述为

(1.1)

这个函数被称为神经元的激活函数(Active function)[3]。通常所用的神经元特性函数如图1.2所示:

图1.2 常用特性函数示意图

(一)神经网络的结构和学习规则

神经细胞是通过突触相互联系的,将大量的神将元按照一定的规则联接成为神经网络,构成十分复杂的大脑神经网络系统,可以建立许多种神经网络模型[4]。

根据联接方式的不同,大致可以分为两大类:层状和网状[5]。

层状的神经网络结构是由许多层组成,每一层中有若干个神经元并且相邻神经元是单向联接的,而且同层间的神经元是不能联接的;和层状的神经网络不同,网状的神经网络中,每个神经元之间都有可能为双向联接的,如图1.3所示。

图1.3 不同的神经网络的联接形式

二、前向多层网络的结构及其BP学习算法

(一)感知器

感知器信息处理的规则为:

(2.1)

式2.1中 为输入分量, 为它在t时的第i个输入的值, 是阀值, 即为阶跃函数。

所以感知器学习的规则为:

(2.2)

其中 为学习率(0< <1), 为导师信号, 是则为实际输出。

通过不断对权重的调整,使得 对大量样本保持稳定,则学习过程结束。

(二)前向多层网络的BP学习算法

目前研究较多的网络形式中向前网络占有很高的比重,它分为输入层、隐含层、输出层三部分。隐含层又可分为一层或者多层[6],如图2.1所示。

网络中的原始信息是由输入单元的状态所决定的,输入单元的活性决定着隐含单元的活性,同样隐含单元的活性决定着输出单元的行为。

(三)误差反向传播算法计算步骤

我们可以假设:i、j为输入层和它前一层中的一个单元,从而运用加权输入 来求解出输出单元i的活性,即

(2.3)

第i个单元和第j个单元的联接权值即为 ,而 则视为前一层中第i个单元的活性水平。

解出的 ,我们可以用一个S函数来求解 ,即:

(2.4)

经过上述计算我们可以所有输出元活性后,

利用 来计算网络的误差:(2.5)

式2.5中输出层第j个单元的活性水平有 来表示,而 则表示第j个单元的期望输出。

简单的说反向传播算法包括以下4个步骤:

(1)当一个输出单元的活性被改变时,误差倒数 就是期望活性与实际活性的差。

(2.6)

(2)求一个单元在所接受总输入量变化时的误差倒数 ,即式2.6的结果乘以输出变化率 ,即:

(2.7)

(3)计算一个与输出单元联接权值改变时的误差变化率EW。

(2.8)

可以看出 为式2.7的结果乘以与 。

(4)把对各输出单元的所有单独影响相加。

(2.9)

三、BP算法的实现流程

BP算法实现按如下步骤进行:

(1)首先进行初始化,并给所有的权值赋以随机任意小的值,并对阀值进行初值设定;

(2)拟定训练数据合集,并给出输入向量x和期望输出 ;

(3)计算y(实际输出值)值

(3.1)

其中函数 ()为Sigmoid函数,即:

(3.2)

(4)对权值进行调整,按照误差进行反向传播,从而得到隐含层的修正权值

(3.3)

式中节点j的误差为 , 为大于零的增益,根据节点j的不同形式计算出 :

中的 为大于零的增益, 为节点j的误差, 的计算根据节点j的形式不同,由下式分别计算

(3.4)

(5)返回第(2)步重复,直至误差满足要求为止[6]。

参考文献:

[1]张捷.手写数字识别的研究与应用.硕士学位论文.西安:西安建筑科技大学,2004

[2]胡硕.基于遗传算法的图像分割研究.硕士学位论文.长春:东北师范大学,2003

[3]朱晓波.基于BP神经网络的手写体数字识别分析与研究.硕士学位论文.武汉:武汉科技大学,2003

[4]魏兴国.基于核方法的手写体数字识别研究.硕士学位论文.南京:南京理工大学,2003

[5]蒋伟.基于GA的神经网络在手写数字识别中的应用研究.硕士学位论文.成都:四川大学,2004

[6]瞿海金.手写体数字识别方法的研究与实现.硕士学位论文.南京:南京理工大学,2005

推荐访问:手写体 不规则 识别 连续 数码


[连续手写体不规则数码识别的研究与设计]相关文章