구글 검색엔진의 로직은 이러하니 SEO에 맞게 쓰면 상위노출 100퍼센트 된다는 비법은 없다. 하지만 그들이 추구하는 큰 방향에 맞춘다면 선택을 받을것이다. 구글에서 공식적으로 발표한 검색순위 선정 시스템에 대한 가이드 문서가 있다.
구글 검색엔진이 추구하는 바는 단순하다.
가장 관련있고 유용한 결과를
‘즉시’ 표시한다.
이를 위해 전세계 수천억 개의 웹페이지를 색인해놓고 수많은 주제와 질문에 대해 분류를 해놓는다. 기존에 없는 새로운 검색 요청이 들어오는 경우에도 즉각적으로 판별하여 관련도 높은 결과를 보여줄 수 있도록 한다.
어떤 웹페이지 문서를 상위에 보여주느냐가 구글의 핵심 기술인데, 이를 위해 다양한 알고리즘이 동원되고 끊임없는 실험과 개선이 이루어진다.
검색순위 상위를 결정하는 알고리즘들은 다음과 같은 것들이 사용된다. 구글이 직접 밝힌 AI 알고리즘 로직을 살펴보고 그에 맞게 어떻게 글을 써야할지 생각해본다.
BERT
여러 단어가 조합된 구문과 문장이 어떠한 의미를 가지는지, 말하고자 하는 의도는 무엇인지 파악해내는 AI이다.
이를 위해 간결하고 정확하게 써내는 것이 좋다. 수식어와 미사여구를 잔뜩 붙여서 구구절절 긴 문장으로 쓰면 해석이 어려워진다. 사람이 읽어도 무슨 말인지 모르는 것처럼. 담백하고 짧은 문장으로 요점만 말하는 것이 좋다.
위기 정보
단순히 정보 검색이 아니라 폭력, 약물과 같은 위험한 상황인지 판단하고 신뢰도 있는 전문기관을 알려준다. 재난이나 자연재해와 관련된 주제라면 국가 기관의 업데이트 사항을 빠르게 전달한다.
우선적으로 표시하는 공인된 웹사이트들이 있으므로 이런 주제로는 적지 않는 것이 좋다.
중복문서
일치하거나 유사한 웹페이지가 동시에 노출되지 않도록 제거한다. 추천 스니펫에 뜬 내용이 검색 결과에 다시 등장하지 않게 하는 작업 등이 포함된다.
지금 이 시간에도 발전하고 있는 구글의 검색엔진 로직이 베껴쓴 것은 기가 막히게 잡아내기 때문에, 다른 문서를 보면서 말을 바꿔 쓰면 걸리게 되어 있다. 자료를 찾으면서 핵심 포인트만 메모하고 스스로 머리속에 공부한 뒤 완전히 새로 써야한다.
도메인 이름
도메인 주소에 있는 단어를 통해 검색어와의 관련도를 파악한다. 동시에 이를 악의적으로 이용하려는 과도한 남용을 막는다.
따라서 처음 웹사이트 도메인 이름을 지을 때 가급적 쓰려는 주제와 연관되도록 네이밍 하는것이 필요하다. (이 블로그 주소는 이미 망…) 금융 관련 블로그라면 money financial banking 같은 관련된 단어를 이용해서 사이트 주소명을 짓는것이 좋다. 그렇게 한다고 잘 노출되는 것은 아니지만 안하는 것 보다는 조금이라도 낫다는 것이다.
최신 정보
구글은 최신 정보를 좋아한다는 지난 글에서도 소개한 바 있다.
아주 오랫동안 변치않는 정보라면 그것을 빨리 써서 상위 노출된 글이 왠만해선 잘 내려오지 않는다. 하지만 계속 바뀌는 성질의 정보라면 새로운 것이 나올 때마다 업데이트 해주는 문서를 더 선호하고 상위로 올려준다.
유용한 콘텐츠
트래픽만 뽑아먹으려고 SEO만 교묘하게 이용해서 상위노출하는 것과, 정말 사람들에게 도움이 되도록 쓰여진 문서를 구분한다.
여기에 가장 중요하다고 알려진 것이 바로 체류시간과 이탈률이다. 검색을 통해 들어온 방문자가 얼마나 오랫동안 내 글을 꼼꼼하게 다 읽었는지, 그리고 마음에 들어서 사이트 내의 다른 글도 들여다보았는지 그런 것들로 유용한 콘텐츠 여부를 판단한다.
페이지랭크
구글 검색엔진의 초기부터 있어온 순위산정 알고리즘이다. 이 페이지가 다른 곳에 많이 인용되었다면 유용하다고 판단하는 것이다.
이를 위해 백링크 작업을 하는 꼼수를 쓰기도 하지만 구글이 못잡아낼리 없다. 백링크도 신뢰도 높은 좋은 사이트에서 내 블로그가 링크되어야 페이지랭크 점수가 올라간다.
오히려 이걸 역이용해서 다른 사이트를 공격하는 경우도 있다. 쓰레기 같은 스팸 블로그를 수백 수천개 생성하면서 거기에 똥글을 쓰고 특정 블로그의 주소를 링크하는 것이다. 마치 그 블로그에서 이렇게 작업을 한 것처럼 보이게 말이다.
지역
현지 지역에 특화된 뉴스 매체의 컨텐츠를 찾아준다.
내가 쓰고자 하는 키워드로 검색을 해봤을 때 뉴스 기사들만 상단에 쭉 꽂혀있다면 써도 노출되기 어렵다. 그 주제에 대해서는 구글이 뉴스 매체의 신뢰도가 더 높다고 판단하고 있기 때문이다.
MUM
언어를 이해, 생성하는 AI 알고리즘이다. 추천 스니펫 같이 전체 내용 중에서 질문과 가장 연관된 부분을 추출하고 보기 좋은 형태로 가공하여 출력해준다.
검색 엔진이 보다 잘 이해할 수 있도록 SEO에 맞게 소제목 구분을 잘 해서 쓴다. (h2 h3 태그) 그리고 핵심 내용만 요약해놓은 표 형태, 문제 해결을 깔끔하게 나타낸 순서와 같이 정리하면 스니펫 노출 가능성이 높아진다.
신경망 검색
검색자가 입력한 검색어와, 색인된 페이지에 들어있는 개념들이 얼마나 유사한지 판단한다.
단순히 검색어와 같은 단어가 포함되었는지를 보는것이 아니라, 의도를 매칭하는 것이다. ㅁㅁ를 절약하는 방법을 검색했다면 아낀 후기, 사용량 감소, 덜쓰는 법 같이 같은 개념을 가지고 있는 콘텐츠를 찾아서 매핑한다.
따라서 너무 키워드에 목맬 필요는 없고 남들이 다 쓰는 제목을 그대로 쓸 필요도 없다. 내가 쓴 본문 내용에 걸맞게 자연스러운 제목을 지으면 된다. 키워드가 제목에 전혀 없더라도 내용이 딱 원하는 결과물이면 구글이 결국 찾아준다.
원본
중복문서, 유사문서 보다 이 곳들에서 인용한 원본 컨텐츠를 찾아서 더 상위에 올려준다.
토씨 하나 안틀리게 베끼면 당연히 안되고, 토씨만 바꿔서 짜집기해도 안된다. 위에 중복문서 항목에서도 설명했듯이, 내 머리로 공부하고 정리해서 새로운 글을 써내야 한다.
삭제 내역
위법 사항이나 저작권, 개인정보 침해 등으로 삭제된 글이 있다면 해당 블로그의 지수도 깎는다.
블로그 오래보고 할 거라면 문제의 소지가 될만한 글은 쓰지 않는 것이 좋다.
페이지 경험
방문자의 페이지 경험이 우수한 사이트에 높은 점수를 부여한다.
내 웹사이트의 페이지 경험은 구글 서치콘솔 > 실험 > 페이지 경험으로 들어가서 확인할 수 있다. 전에는 모바일 친화적 여부와 페이지 스피드 점수가 활용되었으나 지금은 페이지 경험으로 통합되었다.
텍스트 위주로 깔끔한 문서를 작성하고 이미지는 쓸데없이 넣지말고 꼭 필요한 것만 webp로 변환하여 용량을 줄인다. 스킨에 각종 스크립트나 플러그인 덕지덕지 달지말고 최대한 깔끔하게 페이지 로딩속도를 최우선으로 삼는다.
문구
문서의 개별 섹션이나 깊숙히 쳐박힌 정보까지 찾아준다. 동영상도 특정 순간에 태그를 지정해서 검색이 용이하도록 한다.
전문가 애호가
어떤 제품에 대한 리뷰라면 관련된 내용이 많은 전문가나 애호가의 문서를 먼저 보여준다.
맛집만 올리다가 뜬금없이 아이폰 신제품 리뷰를 써도 구글이 노출시켜주지 않는다는 소리다. 어떤 제품의 리뷰로 트래픽을 모으고 싶다면, 관련 카테고리의 제품 리뷰글을 꾸준하게 쌓아야 한다.
스팸은 점점 많아지고 상위 노출을 위한 기술적 꼼수는 갈수록 발전하고 있다. 그래서 검색 엔진에서는 더욱 오랜기간 관련 분야의 콘텐츠를 쌓아오며 검증된 진짜 전문가의 글을 더 높게 쳐줄 것이다.
RankBrain
단어와 개념간의 관계를 이해한다. 이를 통해 검색어가 포함되어 있지 않아도 관련된 컨텐츠를 찾아준다.
신뢰할 수 있는 정보
위에 전문가 리뷰 항목과 마찬가지로 공신력 있는 사이트를 우선적으로 노출한다. 구글 노출을 위해선 장기간 꾸준히 제대로 된 컨텐츠를 양산한다는 믿음의 시간이 필요하다.
사이트 다양성
동일 사이트에 관련된 내용의 페이지가 여러개 있더라도 두 개 이상 표시하지 않는다. 정말 관련이 높아서 보여줘야 하는경우 두 개까지 가끔 나오기도 한다. 이 때 루트 도메인의 하위 도메인도 하나의 사이트로 인식하고 판단한다.
스팸 감지
자동 프로그램으로 무슨무슨 순위 TOP10 이런 글 잔뜩 찍어내면서 제휴링크나 트래픽 낚시를 하는 사이트들도 많다. 이런 곳들을 판별하여 퓨어 스팸으로 처리하고 저품질을 때려버린다.
실제로 검색 사용자가 원하는 결과를 충실하게 작성한 것이 아니면 불순한 의도는 결국 하나하나 처단하는 것이 구글 검색엔진이다.
구글 검색순위 시스템에 대한 가이드를 원문도 자세히 일독해보길 권한다.