Metadata

Metadata

어떤 목적을 가지고 만들어진 데이터로서 검색엔진등에 제공하기 위해 데이터를 정보자원 자체에 포함하여 작성하는 정보

  • 페이지가 어떤 정보를 갖고 있는지 검색엔진이 판단할 수 있는 데이터를 제공해주는 데이터

  • 메타데이터가 담긴 Tag를 Meta tag라 부르며 <head>에 포함시켜 페이지의 정보를 제공한다.

Meta tag

Meta tag의 중요한 4가지 요소

description

<meta name='description' content='페이지 요약' />
  • 영문 130 ~ 160자 내외, 한글 80 ~ 110자 추천

  • SEO 점수에는 반영되지 않으므로 유입을 기대하는 키워드들의 반복은 피하자.

  • 검색결과에 CTR 에는 영향을 준다.

  • 페이지의 핵심 내용과 검색어의 검색 의도에 초점을 두어 작성하는것이 포인트

    • 검색어에 해당하는 키워드들은 볼드체로 굵게 표시된다.

    • 트래픽 유입을 기대하는 키워드들은 앞부분 50자 내에 작성

  • 모든 페이지 내에 description을 반드시 작성

  • 각 페이지의 description은 유니크해야 한다.

    • 문서 페이지라면 게시일자, 작성자 등을 추가

    • 제품이라면 제품의 가격, 옵션 같은 정보를 추가

robots

크롤러는 따로 설정하지 않아도 페이지를 읽어서 색인(index)하거나 자유롭게 돌아다닐 수 있다.(follow)

  • index → 크롤러에게 웹페이지를 읽어서 색인하도록 허용

  • noindex → 크롤러에게 웹페이지를 읽지 않게 함

    • 한시적으로 오픈하는 이벤트 페이지

    • 수정이나 제작이 production에서 발생되는 페이지

    • 페이지의 갱신 소멸이 일어나는 경우 제 때 검색엔진에 알리지 않게되면 접근할 수 없는 페이지를 제공하게되어 불이익을 받을 수 있음

  • follow → 페이지 내부 링크를 따라서 크롤러가 이동을 하도록 허용

  • nofollow → 페이지 내부 링크를 따라서 크롤러가 외부로 이동하지 못하도록 설정

    • 외부 링크로 이동이 가능한 페이지 (유저 코멘트)

title

  • <title> 과 중복 시 <title>를 읽게 되어 큰 의미는없다.

keyword

  • 검색결과를 최상위에 노출시키기 위해 키워드를 남발하는 악용이 문제가 되어 더 이상 seo 점수에 반영이 안된다.

Title tag

검색 결과 페이지에서 사용자가 가장 먼저 보게 되는 것

  • 검색엔진에 있어서 HTML 요소들 중 가장 중요도가 높다.

  • 문서의 내용을 잘 보여주는 키워드를 포함시킨다.

  • 영문 55자, 한글 30자 이내에 작성

  • 페이지 내 모든 타이틀은 유니크해야 한다.

    • 사이트 내 동일 타이틀끼리 경쟁하게 되므로 노출이 어려워짐

  • 불필요한 기호나 공백은 사용자에게 잘못된 페이지라는 인식을 주기 때문에 삽입하지 않는것이 좋다.

Heading tag

h1 ~ h6 까지 문서의 단락을 나타내기 위한 태그로 컨텐츠간 논리적 구조 연결을 의미

  • 페이지당 하나의 h1 작성

    • 페이지 타이틀

    • 기사 타이틀

    • 제품 명

  • 스타일이 아닌 논리적 구성에 맞춰 사용해야한다.

  • heading element는 1 ~ 6 뎁스까지 순차적으로 구성되어야 한다.

  • 페이지의 주제와 컨텍스트를 검색엔진에 전달하는 중요한 역할을 하며 SEO 점수에 반영된다.

  • heading tag 정리로 인해 노출 가능

  • bullet list, numbered list, table, context

  • pagegraph, image 등으로 구성

  • 검색어와 동일한 질문과 답으로 구성

alt prop

시각 장애인들을 위해 대체 텍스트를 제공하는 접근성 측면에서 중요한 속성

  • 접근성 측면은 SEO 점수에 반영되기 때문에 중요하다.

  • 해당 이미지가 무엇을 나타내는지 검색엔진에게 제공

robots.txt / sitemap.xml

인덱싱과 크롤러를 제어하는 역할로 중요하지만 많은 사이트에서 간과하는 부분

인덱싱 관리가 잘못된 예시

robots.txt

해당 파일에 아무것도 작성하지 않으면 검색엔진 크롤러 봇들은 웹 사이트 내 모든 컨텐츠를 인덱싱하고 검색엔진에 노출시킴

  • 특정 컨텐츠 / 페이지 / 서브폴더 / 디렉토리 크롤러 접근 제어

  • sitemap 파일에 위치를 전달

  • 크롤러에 의한 과부하 방지

  • 모든 사용자들이 접근할 수 있어 보안 수단으로 사용 X

  • 검색엔진이 반드시 robots.txt를 따르는것은 아님, 설령 따르더라도 즉각적으로 반영이 일어나는 것도 아님

sitemap.xml

검색엔진 크롤러 봇에게 크롤링 해야할 URL을 전달하여 크롤링을 보다 효율적으로 진행할 수 있도록 제공

  • Navigation 컨텐츠 (GNB, LNB 등)를 통해 접근할 수 없는 컨텐츠 정의

  • js에 의해 라우팅되는 경우도 이를 통해 제공

  • 사이트맵 제출이 모든 페이지의 인덱싱을 보장하진 않음

  • 각 URL과 추가 정보(URL 최종 업데이트 시점, 업데이트 빈도, 다른 URL 대비 중요도 정보)를 담을 수 있다.

  • 검색엔진에 URL을 추가 및 배제하는 규약으로서 robots.txt 를 보완한다.

  • 사이트의 컨텐츠에 맞춰 늘 업데이트 되어야하기 때문에 수동보다는 빌드 시점에 생성

  • Google Search Consol 을 이용해 검색엔진에 등록할 수 있다.

sitemap 생성 도구

next-sitemap, globby

Last updated