机器视觉之家VISIONHOME.CN微信公众号:石鑫华视觉网

 找回密码
 注册会员
查看: 940|回复: 0

OCR字符识别系统

[复制链接]

主题

好友

3775

积分

白金会员

  • TA的每日心情
    开心
    2015-3-5 16:19
  • 签到天数: 126 天

    [LV.7]70FPS

    发表于 2013-12-31 11:56:31 |显示全部楼层
    OCR(Optical Character Recognition,光学字符识别)是指利用电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别的方法将形状翻译成计算机文字的过程,即对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。下面介绍一下OCR字符识别系统主要组成:( _, q! W/ ]( d* P) A$ E  M
        一、图像输入、预处理& ]/ y: A8 [% U
        图像输入:对于不同的图像格式,有着不同的存储格式,不同的压缩方式。
    - t+ Z, e; U8 }4 }4 J    预处理:主要包括二值化,噪声去除,倾斜较正等。7 |7 G; a4 W! v: s7 O7 U
    ( p6 N7 X8 q1 Y( Z* q7 i
        二、二值化
    & c! L) A0 f" c: A: t" b. o    对摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快更好的识别文字,我们需要先对彩色图进行处理,使图片只前景信息与背景信息,可以简单的定义前景信息为黑色,背景信息为白色,这就是二值化图了。1 f; V3 m( Q) s+ I
        三、噪声去除
    / L8 L* j5 R* |* }5 h0 Q4 F    对于不同的文档,对噪声的定义可以不同,根据噪声的特征进行去噪,叫做噪声去除。
      Z) @9 G5 ]; {! O: r) @/ M    四、倾斜校正
    + H! q' b4 j4 H# {* x    在拍照文档时,拍出来的图片不可避免的产生倾斜,这就需要文字识别软件进行较正。; H, Z$ ?0 w* \( B6 h, `. a
        五、版面分析
    * x1 B+ V/ w3 w* B" N    将文档图片分段落,分行的过程就叫做版面分析,由于实际文档的多样性,复杂性,因此,目前还没有一个固定的,最优的切割模型。' x. C% Y5 R& |9 C
        六、字符切割$ M$ H1 D! I; L- Y  Z/ s
        由于拍照条件的限制,经常造成字符粘连,断笔,因此极大限制了识别系统的性能,在众多文字识别软件中有显示字符切割的效果。. x1 }/ T. m5 Z: G4 _
        七、字符识别7 ^. ~- b4 K7 k9 z0 A9 i% X* o: P
        这一研究,已经是很早的事情了,比较早有模板匹配,后来以特征提取为主,由于文字的位移,笔画的粗细,断笔,粘连,旋转等因素的影响,极大影响特征的提取的难度。
    $ Y' L# l7 @1 S# Y( Z    八、版面恢复
    8 }" i! g1 D* B" G: [) \- E    人们希望识别后的文字,仍然像原文档图片那样排列着,段落不变,位置不变,顺序不变,的输出到word文档、pdf文档等,这一过程就叫做版面恢复。
    8 f0 l8 w% Q) x5 \; T, E* R    九、后处理、校对% G: U- Y$ ]0 \3 Z, {% M' f
        根据特定的语言上下文的关系,对识别结果进行较正,就是后处理。
    4 x: k/ Q7 |1 q% f5 C2 _. O   
      ^# o. B: n3 _/ z5 x
    0 H' Y6 I! E* D& Y8 E
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册会员

    本版积分规则

    淘宝机器视觉商城

    Archiver|手机版|小黑屋|视觉之家|东莞市华动智能科技有限公司 ( 粤ICP备17078359号-1 )|网站地图|申请友情链接

    GMT+8, 2018-1-23 20:01

    Powered by shixinhua.com X3.2 Licensed

    © 2012-2018 VISIONHOME.CN 浏览量:

    快速回复 返回顶部 返回列表