이미지에서 한글 텍스트 추출하는 방법 (네이버 CLOVA OCR)

이미지에서 텍스트를 추출하는 것을 OCR 기술이라고 한다. 간편하고 한국어 텍스트 추출 성능이 좋은 OCR 찾아보다가 가까운 곳에 있었다. 네이버 클로바 OCR을 이용하면 간편하게 글자 추출을 할 수 있다.

Optical Character Revognition 의 약자인데, Chat GPT나 스테이블 디퓨전 같은 인공지능도 발달하는 마당에 이미지에 있는 글자 정도는 쉽게 뽑아줘야 되는거 아니야? 생각했는데

정작 챗지피티로 이미지 올리고 글자 추출해달라고 하니까 OCR 기능이 잘 안되서 어쩌고 저쩌고 얘는 어떻게 진짜 사람처럼 뺀질뺀질거리는지 모르겠다. 맨날 에러내고 생략해서 결과주고 짜증나는게 한두번이 아니다.

아무튼 이런 작업 할 일이 종종 있다면 네이버에서 만든 클로바OCR 즐겨찾기 해놓고 필요할 때 사용하면 된다.

처음에 가입하면서 인적사항 회사정보 적는 란이 나오는데 알아서 적당히 적고 넘어가자.

이미지에서 한글 텍스트 추출방법 네이버 CLOVA OCR

그럼 이렇게 작업 화면이 나온다. 일반적인 그림을 올릴거면 general OCR , 아니면 특별한 양식이 있는 것들을 하고 싶으면 영수증 신용카드 사업자등록증 고지서 명함 신분증 프리셋 모드가 있다.

그림 파일로 표가 만들어져 있는 것을 하나 올려봤더니 텍스트 추출을 아주 정확하게 해주는 것을 알 수 있다. 이정도는 껌이고, 성능을 보려면 밑에 각 회사 로고들까지 몽땅 추출한 것을 보면 된다. 네이버에서 만들어서 그런지 한국어가 포함된 이미지파일의 텍스트 추출할 때에는 최고의 OCR인 것 같다.

솔직히 예전에는 한국 인터넷 생태계를 가두는 주범인 네이버를 싫어했었는데, 유저 수익이나 뺏어먹으려고 돈통 들이미는 카카오보다야 이렇게 IT기업으로써 해야 될 일은 하는 네이버가 최소한 더 낫다. 카카오는 이제 생각만 하면 치가 떨릴 지경이다.

아무튼 CLOVA OCR을 통해 추출한 글자들은 엑셀에서 텍스트마법사 > 구분기호로 분리를 시켜서 정리하던지, 아니면 이 정도는 지피티에게 던져주고 깔끔하게 표로 다시 배열하라고 하면 그정도는 해줄 것이다.

0 0 투표
Article Rating

0 Comments
Most Voted
Newest Oldest
Inline Feedbacks
댓글 모두 보기