본문 바로가기
IT 정보

광학 문자 인식 시스템 이해하기

by AIIA 2023. 3. 30.

포스팅 목차

    다양한 산업 분야에서 디지털 전환이 빠르게 진행되고 있는 중입니다. 이에 따라 업무 자동화에 대한 관심도도 자연스레 증가하고 있는 추세입니다. AI와 로봇프로세스자동화와 더불어 광학 문자 인식 기술인 Optical Character Recognition 또한 줌고을 받는 중입니다. 지금부터 광학 문자 인식 시스템이란 무엇인지 알아보도록 하겠습니다.

    programmer notebook

    회사를 다니는 직장인들이라면 서류를 보관하는 것이 얼마나 중요한지 잘 알고 계실 겁니다. 중요성이 커지면서 문서 전자화 시스템을 도입하는 기업들도 증가하고 있습니다. 수작업 위주의 입력 저장 방식을 혁신하기 위해서 광학 문자 인식이라고 하는 기술이 주목을 받고 있는 중입니다. 이는 스캐너를 통하여 입력된 문서 영상에서 문자에 해당되는 부분의 내용을 인식하는 기술을 의미합니다.

    광학 문자 인식이란?

    광학 문자 인식은 OCR로도 불리고 있습니다. 기계 학습 알고리즘을 통하여 스캔한 문서나 사진과 같은 이미지 문자를 인식하고 디지털화하는 기술을 말합니다. 해당 기술은 인쇄되거나 작성된 문서에서 정보를 추출하고 편집, 분석 그리고 처리할 수 있는 디지털 텍스로 변환을 할 수 있습니다. 사용 사례로는 문서 스캠과 인덱싱 분야가 있습니다. OCR 시스템은 송장이나 계약서 같은 실제 문서를 스캔한 다음 해당 문서에 포함되어 있는 텍스트를 추출할 수가 있습니다. 그리고 이 텍스트를 활용하여 디지털 데이터베이스나 색인을 작성해 문서에 포함되어 있는 정보를 조금 더 쉽게 검색하고 분석을 할 수가 있습니다.

     

    또 다른 사용 사례로는 번호판 인식이 있습니다. 경찰이나 보안 회사, 주차 시스템에서 차량을 정확하고 빠르게 식별하기 위해서 사용되는 중입니다. 번호판의 이미지를 캡처한 다음에 기계 학습 알고리즘을 사용해 그 안에 포함되어 있는 텍스트를 추출합니다. 이 외에 명함에서도 정보를 추출할 수가 있습니다. 이름이나 직함, 회사명, 전화번호와 이메일 등 추출 가능합니다.

    광학 문자 인식의 방식

    광학 문자 인식의 기술인 문자 인식 방법은 문자 패턴의 표현방법과 분류방법에 의하여 원형정합, 통계적, 구조 분석적 방법으로 나누어지고 있습니다.

     

    1. 원형정합 방법: 원형정합 방법은 문자 패턴을 배열 형태로 분류하여 원형 패턴과 비교하여 가장 유사한 형태를 찾아내는 방법을 말합니다. 초기에는 많이 사용됐지만 주로 하나의 고정된 형식의 문자에 대해서만 사용이 가능하다는 문제점이 있어 현재는 사용을 하지 않고 있습니다.

     

    2. 통계적 방법: 통계적 문자 인식 방법은 인식대상에서 특징벡터를 추출하여 문자 인식을 하는 것입니다. 학습 단계를 통하여 특징벡터의 통계적인 확률 분포 특징을 구하고 이를 활용하여 벡터 공간을 각 분류별로 분리를 시키는 것입니다.

     

    3. 구조 분석적 방법: 문자의 구성 원리에 입각하여 자획 등과 같은 문자를 구성하는 기본 요소와 그들의 연관성을 추출하여 문자를 인식하는 방법입니다. 이는 이론적인 정립이 잘 되어 있으며 방법이 단순하다는 장점이 있지만 특징 문자에 대한 규칙이 활자체에 따라 매우 다양해지기 때문에 인식 시간이 오래 걸린다는 단점을 가지고 있습니다. 최근에 문자 패턴을 인식하기 위해 인공지능 시스템 중 인공신경망 모델을 이용한 연구가 주목을 받고 있습니다.

     

    4. 인공신경망 방법: 인공 신경망 모델은 인간의 뇌구조를 모형화하여 뇌를 구성하는 기본 단위인 뉴런으로 단순한 계산소자의 연결을 통하여 좋은 성능을 나타낸다는 것을 기본 가정으로 하고 있습니다. 인공 신경망 모델은 음성이나 문자, 이미지 분석 등 계산량이 많으며 병렬성을 요구하고 있는 문제에 적합한 모델이라 볼 수 있겠습니다. 최근 들어서 가장 많이 이용되고 있는 OCR 기술입니다.