• 동일한 주제를 다루는 구버전 콘텐츠와 새로운 버전의 콘텐츠는 리디렉션 처리를 해야합니다.
• 검색엔진이 중복 콘텐츠로 인식하지 않게 캐노니컬 태그를 잘 사용해야합니다.
중복 콘텐츠란?
중복 콘텐츠는 다른 웹사이트 또는 내 웹사이트의 다른 페이지에 있는 유사하거나 동일한 콘텐츠가 있는 경우, 중복 콘텐츠라고 정의할 수 있습니다.
웹사이트에 많은 양의 중복 콘텐츠가 있을 경우 Google 검색 순위에 부정적인 영향을 미칠 수 있습니다.
다시 말해서, 중복 콘텐츠는 다른 페이지에 나타나는 콘텐츠와 내용이 매우 유사한 콘텐츠입니다.
원본에서 약간의 수정만 거친 콘텐츠도 중복 콘텐츠에 해당합니다.
중복 콘텐츠가 SEO에 미치는 영향
구글은 중복 콘텐츠를 선호하지 않습니다.
구글은 이렇게 얘기합니다.
“검색자에게 유용하며 유니크한 페이지를 색인하고 랭크를 매기는데 최선을 다하고 있습니다.”
그렇기 때문에 중복 콘텐츠가 많아지면 구글상위노출에 불리할 수 있습니다.
아래 3가지는 중복 콘텐츠가 받는 불이익 입니다.
1. 자연 트래픽 감소
위에서 말했듯 구글은 복제 콘텐츠를 싫어합니다.
크롤링에 리소스가 낭비되며 저작권 문제가 생길수도 있기 때문입니다.
또한 내부 페이지들끼리 경쟁하여 백링크가 분산되고 그 결과 SERP 순위가 떨어집니다.
그 다음 해외 방문자가 어떻게 행동하는지 확인합니다.
-방문하는 서비스 및 제품 페이지 확인
-페이지 체류 시간
-전화 또는 문의 폼 작성 여부
2. 패널티, 밴
저작권을 심각하게 위반한것이 아니라면 패널티까지 받지는 않습니다.
그렇지만 이런 경우는 매우 드물게 발생합니다.
3. 색인되는 페이지 감소
페이지 수가 매우 많은 웹사이트의 경우 중복 콘텐츠 이슈가 심하면 색인을 거부할 수 있습니다.
구글의 크롤링 예산이 한정되어 있기 때문입니다.
중복 콘텐츠 대표적인 케이스
사이트 내부 동일한 콘텐츠
저희 경험상 이 케이스가 예상외로 많습니다.
쇼핑몰 사이트를 예시로 들어보겠습니다.
정석 SEO 세팅이 되어있었다면 하나의 상품페이지를 가지고 있어야하지만
A 티셔츠를 판매중인데 색상별로 URL이 별도로 있는 케이스가 있습니다.
또는 거의 달라진게 없는 상품인데 25년 새로 업로드해서 중복으로 콘텐츠가 존재하는 경우도 있습니다.
이런 상황이 계속되면 중복된 콘텐츠가 계속 증가하게 됩니다.
검색기능 관련 SEO 설정이 제대로 안되어 있는 경우
또 다른 예시로 사이트에 검색 기능이 달려있는 경우입니다.
키워드 별로 색인 되어 중복페이지가 수천개 생성되기 쉽습니다.
특별한 이유가 없다면 검색 페이지가 색인 되어야 할 이유가 없습니다.
robots.txt에서 검색 페이지 색인 거부 세팅을 적어두셔야합니다.
또는 html 상단부에 noindex 설정을 해주셔야합니다.
URL 매개변수 (쿼리스트링) 문제
URL 매개변수, 즉 쿼리스트링을 사용하여 페이지를 표시하는 경우 올바르게 Canonical 세팅이 되어있지 않다면 복제 콘텐츠로 취급받기 딱 좋습니다.
예를들어, abcd.com 과 abcd.com/?search=cookie 은 검색엔진이 보기에 같은 링크인지 다른 링크인지 헷갈립니다.
페이지의 원본을 표시하는 Canonical 태그의 설정이 필요합니다.
중복 콘텐츠를 확인 할 수 있는 방법
인덱싱된 페이지 확인
중복 콘텐츠를 찾으려면 시간과 리소스가 조금 필요합니다.
사이트에 페이지가 몇개 없는 경우 제일 쉬운 방법은 구글에 색인된 페이지 수를 체크하는 것입니다.
[사진]
site:abcd.com
이렇게 검색하면 색인된 페이지를 모두 확인할 수 있습니다.
어떤 페이지가 빠져있는지 확인하여 중복 콘텐츠 이슈가 있는지 비교, 대조해보시면 됩니다.
구글 서치콘솔로 색인 안된 페이지 확인
만약 사이트 내부에 콘텐츠가 많다면 위에서 알려드린 방법으로는 한계가 있습니다.
[사진]
이런 경우에는 구글 서치콘솔을 이용해야합니다.
색인이 안된 페이지가 몇개인지 살펴보고 왜 색인이 안되었는지 파악해서 조치하면됩니다.
중복 콘텐츠 외에 다른 이유로 색인이 안된 경우도 같이 해결하면 SEO에 도움이 됩니다.
중복 콘텐츠를 확인 할 수 있는 방법
사이트, 도메인 리디렉션 설정하기
www.abcd.com 과 abcd.com 두가지 경로로 모두 접속이 가능한 사이트들이 있습니다.
검색엔진은 서브도메인이 붙으면 다른 사이트로 보기 때문에 꼭 리디렉션을 통해 한개의 링크로 통합해야합니다.
또한 http와 https도 하나로 통합해야합니다.
http를 아직도 사용하는 사이트는 보안적으로 매우 위험하니 꼭 SSL 설치를 권장합니다.
콘텐츠 301 리디렉션 설정하기
만약 위에서 봤던 대표적인 중복 콘텐츠 케이스에 해당한다면 301 리디렉션을 통해 문제를 해결할 수 있습니다.
301 리디렉션은 영구적으로 지금 콘텐츠를 다른 콘
텐츠로 이전했다는 신호입니다.
워드프레스를 사용하시는 경우 Redirection 플러그인을 통해 해결이 가능합니다.
솔루션 없이 직접 개발한 경우 Apache, Nginx 설정파일을 잘 편집하여 리디렉션 설정을 걸어두시면 됩니다.
가끔 자바스크립트로 리디렉션(주소이동)을 하시는 경우가 있는데 검색엔진은 종종 JS를 실행시키지 않는 경우가 있어서 서버단에서 처리하시는것을 권장드립니다.
캐노니컬 태그 올바르게 사용하기
캐노니컬 태그는 원본이 어떤 페이지인지 표시해주는 아주 중요한 SEO 설정입니다.
href 속성에는 콘텐츠의 원본을 어디로 생각하면 되는지 체크하시면 됩니다.
www.naver.com/login?redirect=blog.naver.com
위 코드를 예시로 설명 드려보겠습니다.
위 코드는 로그인 성공 이후 사용자를 직전 페이지인 블로그 페이지로 다시 보낼거라는 정보를 담고 있습니다.
만약 캐노니컬 태그를 설정하지 않았다면 로그인 페이지가 수십개가 생성이 될 수 있습니다.
이는 검색엔진을 헷갈리게 만들며 불필요한 크롤링을 하게 만듭니다.
www.naver.com/login?utm_source=google&keyword=과자
위 코드는 광고를 돌릴 때 흔히 볼 수 있는 UTM입니다.
사용자가 구글에서 과자 광고를 클릭해서 왔다는 정보를 담겨 있습니다.
만약 캐노니컬 설정이 없다면 이런 링크가 수십개 생겨날 수 있습니다.






