이미지에서 텍스트를 추출하는 것을 OCR 기술이라고 한다. 간편하고 한국어 텍스트 추출 성능이 좋은 OCR 찾아보다가 가까운 곳에 있었다. 네이버 클로바 OCR을 이용하면 간편하게 글자 추출을 할 수 있다.
Optical Character Revognition 의 약자인데, Chat GPT나 스테이블 디퓨전 같은 인공지능도 발달하는 마당에 이미지에 있는 글자 정도는 쉽게 뽑아줘야 되는거 아니야? 생각했는데
정작 챗지피티로 이미지 올리고 글자 추출해달라고 하니까 OCR 기능이 잘 안되서 어쩌고 저쩌고 얘는 어떻게 진짜 사람처럼 뺀질뺀질거리는지 모르겠다. 맨날 에러내고 생략해서 결과주고 짜증나는게 한두번이 아니다.
아무튼 이런 작업 할 일이 종종 있다면 네이버에서 만든 클로바OCR 즐겨찾기 해놓고 필요할 때 사용하면 된다.
처음에 가입하면서 인적사항 회사정보 적는 란이 나오는데 알아서 적당히 적고 넘어가자.
그럼 이렇게 작업 화면이 나온다. 일반적인 그림을 올릴거면 general OCR , 아니면 특별한 양식이 있는 것들을 하고 싶으면 영수증 신용카드 사업자등록증 고지서 명함 신분증 프리셋 모드가 있다.
그림 파일로 표가 만들어져 있는 것을 하나 올려봤더니 텍스트 추출을 아주 정확하게 해주는 것을 알 수 있다. 이정도는 껌이고, 성능을 보려면 밑에 각 회사 로고들까지 몽땅 추출한 것을 보면 된다. 네이버에서 만들어서 그런지 한국어가 포함된 이미지파일의 텍스트 추출할 때에는 최고의 OCR인 것 같다.
솔직히 예전에는 한국 인터넷 생태계를 가두는 주범인 네이버를 싫어했었는데, 유저 수익이나 뺏어먹으려고 돈통 들이미는 카카오보다야 이렇게 IT기업으로써 해야 될 일은 하는 네이버가 최소한 더 낫다. 카카오는 이제 생각만 하면 치가 떨릴 지경이다.
아무튼 CLOVA OCR을 통해 추출한 글자들은 엑셀에서 텍스트마법사 > 구분기호로 분리를 시켜서 정리하던지, 아니면 이 정도는 지피티에게 던져주고 깔끔하게 표로 다시 배열하라고 하면 그정도는 해줄 것이다.