한국국학진흥원, 고서의 한자 자동 인식하는 인공지능 개발!!

인공지능 학습용 데이터 구축, 고서 한자 OCR 길 열어

유교책판의 한자를 기반으로 한 인공지능 프로그램이 고서의 한자를 인식해 변환한 모습

한국국학진흥원에서 추진하는 유교책판의 활자를 인공지능 데이터로 구축해 고서의 한자를 자동으로 인식하는 시스템 개발이 순조롭게 진행되고 있다.

기존 문자인식 프로그램으로는 고도서의 한자 인식에 한계가 많은 실정이다 이에 한국국학진흥원은 고서 속의 한자를 자동 인식할 수 있는 시스템 개발을 진행해 1차년도 사업을 완료했다.

유교책판의 활자를 영인한 고서의 한자 인식률 70%를 목표로 시작했던 1차 사업은 현재 약 80%의 정확도로 문자를 인식하는 수준에 이르렀고 이후 지속적 개발을 통해 정확도를 올릴 예정이다. 이 결과는 현재 최종 품질 검증을 거쳐 AI-Hub를 통해 공개될 예정이다.

유교책판의 활자를 찍어낸 문집 등의 고서는 전통 기록유산 중에서 가장 많은 양을 차지하고 있다. 고서에 대한 접근성을 높이는 것은 한국 전통 인문학의 발전을 앞당기고 전통문화 기반의 새로운 콘텐츠 제작의 가능성을 열어준다.

이를 위해 가장 중요한 첫걸음은 책으로만 남아 있던 고서 내용을 디지털 문자로 치환함으로써 검색성과 활용도를 높이는 일이다.

현재 한글 및 영문, 기타 다양한 언어 영역에서 광학문자인식(OCR) 시스템이 폭넓게 활용되고 있다. 따라서 한국국학진흥원은 광학문자인식 인공지능 모델 개발 전문업체인 ㈜누리IDT 및 ㈜NHN다이퀘스트 등의 기술력을 적용해 한자를 자동으로 인식하기 위한 OCR 시스템 개발에 착수했다.

이번 ‘한자 인식 OCR 인공지능 모델 개발’은 인공지능(AI)이 가진 딥-러닝 기술이 적극 차용됐다. 이번 1년차 사업을 통해 글자수 기준 1000만자의 이미지를 입력하고 이를 인공지능이 지속적으로 학습할 수 있도록 했다.

고해상도의 이미지인 경우 80%의 정확도를 보여주고 있으며 향후 지속적인 사업을 통해 더 많은 글자 이미지를 입력해 인공지능 학습이 이뤄질 수 있게 하면 인식률은 더 높아질 것으로 기대하고 있다.

특히 이 사업이 본 궤도에 오르면 일반 사용자들이 유적지 등을 방문했을 때 한자로 기록된 현판이나 문서들을 이미지로 촬영해 한자의 뜻과 의미를 확인할 수 있게 될 것이며 또 한자 텍스트를 기반으로 개발 중인 자동 번역 시스템과 연계할 때 한국 고전 번역에 획기적인 속도를 기대할 수 있다.

한국국학진흥원 정종섭 원장은 “산적해 있는 고서들을 활용하기 위한 첫 단계가 디지털화 작업인데 이번 1년차 사업만으로도 디지털화 속도가 몇 배 이상 빨라졌다”며 “향후 이미지 인식률을 높일 수 있는 사업을 계속 추진해나갈 것이며 이 결과물이 일반인들이 실생활에서 활용할 수 있는 서비스까지 이어질 수 있도록 노력하겠다”고 말했다.

<경북도민일보는 한국언론진흥재단의 디지털 뉴스콘텐츠 이용규칙에 따른 저작권을 행사합니다 >
▶ 디지털 뉴스콘텐츠 이용규칙 보기

정운홍기자 다른기사 보기

윤진한 2021-04-06 02:43:28

삭제하기

계성왕(启圣王)이시고 공자님 어머니 시호는 계성왕 부인(启圣王夫人)이십니다.

http://blog.daum.net/macmaca/3127

윤진한 2021-04-06 02:42:55

삭제하기

학교교육도 유교교육이 주류입니다. 세계사로 볼 때, 유교는 공자님도 제사하며, 한나라때 동아시아(중국,한국,베트남,몽고)지역에 성립된 세계종교입니다. 공자님께서는 이전부터 전해지던 신앙인 始原유교의 天(하늘,하느님)숭배, 여러 神明숭배를 계승하시면서, 인간이 행해야 할 禮와 道를 제자들과 제후들에게 가르치신 스승(先師,至聖先師)이시자, 성인임금(文宣帝,文宣王)으로 추증되신 성인이십니다. 그래서 유학은 聖學이라고도 합니다.@공자님의 시호.
공자님의 시호. 하늘이 보내신 성자이신 성인 임금 공자님은 황제 칭호인 문선제(文宣帝).대성지성문선왕(大成至圣文宣王)의 오랜 전통으로 호칭되어 오고 있습니다.聖人에 이르신 스승(至聖先師). 은나라 왕족의 후손이신 공자님. 참고로 하면, 공자님 아버지 시호는 계성왕(启圣王)

윤진한 2021-04-06 02:41:28

삭제하기

시대의 흐름에 맞게 함께 기술문명을 활용하는 유교. 유교사회에서는 天(하느님,하늘)을 두려워하고, 공자님의 가르침을 지속적으로 따르며, 법치국가의 틀내에서 군자의 길을 추구해야 합니다. 공자님께서 하늘(天,하느님)에 죄지으면 빌곳이 없다고 하셨습니다. 공자님이 天[하늘(하느님),하느님]으로부터 부여받아 깨달으신 天命,天德(공자님께서 하느님으로부터 부여받으신 德)에 의해 가르치신 도덕과, 인의예지신, 공맹의 가르침에 근거한 삼강오륜등을 생활화하고, 法(공자님도 한때 대사구란 형조판서격 재판관의 공직도 수행하심, 한나라의 율령은 이후 한국 고대사회에 수용됨)에 근거한 유교전통 계승사회가 되기를 희망합니다. 불교Monkey일본 항복후,조선성명복구령, 한국은 행정법.관습법상 유교국으로 복구되었고, 학교교육도 유교교