Recommanded Free YOUTUBE Lecture: <% selectedImage[1] %>

몇 년간의 [http]사이트관리 경험을 바탕으로 컨텐츠관리 노하우에 대해서 글을 써보려고 합니다. 양이 꽤 되기 때문에 나누어서 글을 쓸 계획입니다. 이글은 그 중 첫번째 글입니다.

컨텐츠의 영향력 확대

정보를 지배하는 자가 현재와 미래를 지배할 것이라는 얘기는 오래전부터 나왔지만 일반인 입장에서는 그리 와닿는 격언은 아니었던거 같다. 포탈, 인터넷 서비스회사와 같은 IT관련 업체나 실감하고 있었을 것이다.

그러던게 고속정보통신망이 일반화 되고, 구글과 같은 대량의 데이터를 처리할 수 있는 기반기술을 가진 회사가 나오면서 일반인들에게 까지 예전의 그 격언을 실감할 수 있게 되었다. 순수한 목적이든 아니든지 간에 컨텐츠확보가 부의 축적에 직접적으로 영향을 끼칠 수 있다는 것은 이제는 세삼스러운 얘기가 되었다. 인터넷(:12) 서비스 회사뿐만 아니라 개인도 컨텐츠를 확보하기 위해서 많은 노력을 기울이고 있다. 일반인의 컨텐츠확보 노력이 표면화 된게 UCC(:12)열풍쯤 되겠지 싶다.

중심에 서기

이제 일반인들도 보다 쉽게 자신의 컨텐츠를 배포할 수 있는 창구와 툴을 가지게 되었다. 인터넷, 초고속통신망, 각종 이미지및 동영상 저작툴과 이들을 쉽게 배포할 수 있는 블로그 그리고 가장 중요하다고 할 수 있는 검색엔진이 그것이다.

이게 흐름이라면 기왕이면 흐름의 중심에 서고자 하는 사람들이 생겨날 것이다. - 나 역시 그러한 사람 중 하나다 - 중심에 서기위한 키워드라면 창구와 툴의 효율적인 사용과 시대에 맞는 철학이 아닐까 싶다. 이들에 대해서 나름 가지고 있는 생각들을 얘기해 보려고 한다.

첫째도 둘째도 셋째도 컨텐츠

말할필요도 없다. 제아무리 좋은 사업아이템이 있어도 돈이 없으면 말짱 도루묵이듯, 제아무리 훌륭한 툴과 창구와 철학을 가지고 있다고 하더라도 컨텐츠가 없으면 아무 소용이 없다. 이를테면 컨텐츠는 총알이다.

보통 총알은 소비성인데 반해서, 컨텐츠는 (관리만 잘한다면) 소비성이 아니라는 크나큰 장점도 가지고 있다. 사업자금 떨어지면 낭패지만 컨텐츠는 마음먹고 꾸준히 쌓아간다면 그 결과가 표면화 되는 시점이 반드시 오게 되어 있다. 적어도 손해는 보지 않는다. - 투자한 시간대비 얻는게 없으면 손해라고 할 수도 있겠지만, 이건 그러려니 하고 넘어가도록 하겠다 -

전문적이든 아니든간에 일단 컨텐츠를 만드는 시도를 해보기 바란다. 컨텐츠가 없는 상태에서 이렇게 저렇게 요렇게 최적화 하면 최고더라. 메뉴를 이렇게 구성해야 한다! 아니다! 하는거 전부 뜬구름잡는 이야기일 뿐이다. - 시작초기라면 - 온라인상에 떠도는 무슨무슨 최적화 이런거 신경쓰지 말기 바란다. 서당개 3년이면 풍월을 읊는다고 컨텐츠관리 1년이면 누가 알려주지 않아도, 온라인상에 알려진 수준의 최적화 기법들은 저절로 터득하게 되어있다.

위키와 블로그를 활용하라

컨텐츠의 축적과 배포수단으로 블로그(:12)의 활용은 대세인거 같다. 덧붙이자면 wiki(:12)의 활용을 적극적으로 권장하는 바이다. 블로그는 웹로그(:12)의 성격을 가진 매체이다. 이런 특징이 개인미디어로의 활용을 좋게하기는 하는데, 나름대로의 문제점이 있다. 그것은 이미 만들어진 컨텐츠가 멈추어버린다는 거다. 멈추어 있으니 시간이 지나면 지날 수록 컨텐츠의 중요도가 점점 떨어지게 된다.

반면 위키는 웹로그가 가지는 장점을 가지지 못한대신에 컨텐츠를 지속적으로 관리할 수 있다는 장점을 가진다. 지식기반 시스템을 위해서 위키를 사용하는 이유이고, 가장 성공한 케이스가 wikipedia(:12)일 것이다.

개인적으로 추천하는 방식은 블로그로 소통을 하고 위키로 컨텐츠를 체계적으로 관리해서 지식정보화 시키는 방식이다. 우리나라에서는 찾아보기 어렵지만 외국에서는 꽤나 일반적인 방식이기도 하다.

이 방식의 또다른 장점은 컨텐츠의 배포경로를 두군대로 할 수 있다는데 있다. 배포경로가 다양하다는 것은 검색이 더 잘된다는 것 이상의 의미를 가진다.

블로그컨텐츠와 웹문서로 분류될 수 있는 위키컨텐츠는 문서의 중요도가 산정되는 방식에 있어서 많은 차이를 보인다. 구글검색을 보더라도 블로그검색과 웹문서검색은 분명하게 구분되어 있다. 블로그문서는 웹로그라는 특성상 시간문서의 중요도를 위한 가장큰 계산요소중 하나다. 이를테면 휘발성 컨텐츠라는 개념이 강한게 블로그 컨텐츠이다. 시간이 지날 수록 문서의 중요도가 계속적으로 떨어진다. 제아무리 좋은 문서를 만들었다고 해도 시간이 지나서 문서가 검색되지 않는다면, 컨텐츠의 역할을 한다고 볼 수 없습니다.

웹문서는 지속성개념의 컨텐츠다. 오래된 문서일 수록 더 많은 링크가 발생하고, 삭제되지 않는한 계속적으로 가치가 올라가게 되어 있다. 가치를 지속적으로 상승시키고 싶은 컨텐츠가 있다면, 위키와 블로그 양쪽 모두를 통해서 문서를 배포하기 바란다. 개인이 위키사이트를 관리하기 힘들다면 스프링노트와 같은 위키서비스를 이용하면 될 것이다.

이글을 쓰는 필자역시 위키로 관리하고 블로그로 배포하는 방식을 사용하고 있다. 위키를 오래 사용해서, 많은 데이터가 위키를 통해서 관리되었던 이유도 있지만 말이다.

도메인을 변경하지 말라

가능한 문서를 가리키는 주소를 변경시키지 않는게 중요합니다. 컨텐츠에 대한 인식이 비교적 강한 외국의 경우에는 어떤일이 있어도 링크를 깨지지 않도록 유지하는데 힘을 씁니다. 주소를 옮겨야될 일이 있어도, 링크 복사본을 남겨두죠.

우리나라는 심지어는 포탈이라고 하더라도 링크가 깨지던 말건 상관없이 커텐츠를 몽땅 들어올려서 이사하는 경우가 흔합니다. 뭐.. 포탈안에서만 검색되면 된다라는 생각에서 대수롭지 않게 여긴결과인지도 모르겠지만, 컨텐츠에 대한 인식이 아직은 후진적이기 때문이라는 생각이 듭니다.

검색엔진 최적화

SEO라고도 하는데, 이건 어느정도 컨텐츠가 축적되어 있어야지 효과를 볼 수 있는 방법이다.

SEO는 검색엔진의 특징을 이용해서 문서를 훼손하지 않는 범위에서 검색결과 상위에 노출되도록 하는 기술을 말한다. 돈을 벌려면 금융시스템을 잘 알 수록 유리한것과 마찬가지가 되겠다. 다음의 공식을 이해하면, SEO를 8할쯤 마스터한거라고 볼 수 있다. 나머지는 응용이다.

문서의 점수 = tf(:12) * idf(:12)

아주 단순한 공식이다. tf는 문서에 발생한 해당 단어의 갯수이고, idf는 단어를 포함한 문서의 갯수다.

리눅스를 포함한 문서를 찾는다고 하면, 리눅스(:12)라는 단어를 많이 포함한 문서일 수록 더 중요한 문서일것이라고 가정할 수 있을 것이다. 매우 직관적이다. 이 것을 수치화 한게 tf이다.

전문적인 단어는 적은 문서에서 나타날 것이다. 반면 일반적인 단어는 많은 문서에서 발생할 것이다. 즉 해당단어를 포함한 문서가 적으면 더 높은 점수를 줄 수 있다는 결론에 도달한다. 이것을 수치화한게 idf이다. 예를 들어 그 리눅스로 검색을 한다면, 그와 리눅스 모두를 포함한 문서가 가장 높은 점수를 받고, 그 다음으로 리눅스만 포함한 문서가 높은 점수를 받을 것이다. 아주 일반적인 단어인 그만 포함한 문서는 밑으로 깔릴 것이다.

이 상에서 다음과 같은 SEO 기법들을 생각해 낼 수 있다.

  • 키워드가 자주 발생하게 한다. tf를 높이겠다는 얘기가 되겠다.
리눅스와 윈도우의 차이점에 대해서 얘기를 하겠다. 전자는 후자에 비해서 이런이런 장점을 가지고 있다이런식으로 작성하는 것보다는 리눅스와 윈도우의 차이점에 대해서 얘기를 하겠다. 리눅스는 윈도우에 비해서 이런이런 ...식으로 키워드를 자주 노출시키도록 한다.
  • 전문분야에 대한 컨텐츠를 많이 작성한다. idf를 높일 수 있다.
  • 문서의 제목과 URL은 신중하게 결정한다.
웹문서는 제목, 본문, URL의 3가지 요소로 구성된다. 똑같은 단어라도 어떤 요소에서 발생했는가에 따라서 부여하는 점수가 틀리다. URL > 제목 > 본문 순이다. 그러므로 URL과 제목은 그 문서를 특징할 수 있는 단어를 포함하게 해야 한다. 그것도 가능하면 2번이상 포함하게 한다. 리눅스를 사용하자 라는 제목보다는 리눅스? 리눅스의 활용처가 궁금하다라는 식으로 제목을 작성하는게 좋다.
  • URL과 제목은 간략하게
단어의 갯수가 많아질수록 점수가 떨어진다. 여러분 리눅스를 사용하면 어떤 점이 좋을지 궁금하지 않으세요?" 보다 리눅스를 사용하자가 더 좋은 제목이다. 메타블로그에도 노출시킬 거라면, 후자가 반드시 좋은방법이라고 보기는 힘들것이다. 적절한 제목을 부여하도록 하자.

===링크를 이길 수는 없다 === 그러나 위의 tf * idf에 기반한 검색엔진 최적화는 링크를 이길 수 없다.

tf * idf? 그렇다면 다음과 같이 tf를 늘리는 소위 낚시성 웹페이지를 만들 수 있을 거라고 생각할 수 있을 것이다.

애플 아이폰, 애플 아이폰, 애플 아이폰, 애플 아이폰 .... 한 100번쯤 반복

실제 저런 식의 낚시성 사이트들이 꽤 있다. tf*idf 의 취약성을 공격하는건데, 취약한 검색엔진 알고리즘을 가진 사이트의 경우에는 저런 웹페이지가 top으로 검색되는걸 볼수 있다.

하지만 최근의 검색엔진들은 pagerank(:12)와 같은 링크기반의 웹페이지 중요도산정 기술들을 도입하고 있기 때문에 저런식의 낚시사이트는 잘 검색되지 않는다. 이들 기술은 중요한 페이지 일 수록 많은 웹페이지들로 부터 링크 되어 있을 것이다라는 가정에서 출발한다. 그래서 페이지의 링크를 계수해서 문서의 스코어를 결정한다. 즉 공식은 다음과 같이 수정될 수 있을 것이다.

문서 중요도 = (tf * idf) * pagerank

위 공식에서 pagerank가 상당히 높기 때문에 낚시사이트가 상위페이지에 검색이 안되는 것이다. 아래는 pagerank의 개념을 보여주는 그림이다.

attachment:pagerank.png

C는 A와 B문서로 부터 링크를 가지고 있고, 이 링크의 점수를 모두 더해서 PageRank가 계산된다. 물론 링크라고해서 다 같은 점수를 가지고 있는건 아니다. 중요도가 높은 문서로부터 링크가 되어 있다면 더 높은 점수를 가지게 된다.

결국, 다른 웹페이지들로 부터 링크를 당할? 만큼의 좋은 문서를 만드는게 가장 우선이 됨을 알 수 있다. tf * idf를 통한 최적화는 비슷한 수준의 문서끼리 경쟁할때나 써먹는 것이다. 이를테면 링크는 온라인상의 표라고 보면 될 것이다. 일단 표를 획득해야 뭘하든지 해먹을거 아닌가.

이쯤에서 눈치빠른 독자라면 또다른 최적화 포인트를 찾았을 것이다. 바로 높은 페이지랭크를 가진 사이트에 자신의 페이지를 가리키는 링크를 만드는 것이다. 양질의 컨텐츠를 가진 사이트와 커뮤니케이션 하라는 얘기가 되겠다. 링크를 통한 커뮤니케이션은 게시판등을 통한 링크, 트랙백등을 통해서 이루어지도록 할 수 있을 것이다.

문서를 작성했다면 나루 블로그검색, 웹검색 서비스등을 이용해서 자신의 문서와 관련있는 좋은 문서를 찾아서 적극적으로 커뮤니케이션 하기 바란다. 특히 나루의 생각부자는 자신의 문서와 관련있는 문서를 찾기위한 매우 좋은 서비스다.

attachment:search.png

근데, 이런걸 꼭 나쁜쪽으로 써먹는 부류의 사람들이 있다. 스팸을 남발하는 부류의 사람들이다. 지금도 여러분의 게시판과 포스트에는 스팸댓글과 스팸트랙백이 달리고 있을 것이다. 커뮤니케이션의 도구로 사용할지 스팸으로 사용할지는 여러분의 행동에 달려있다.

자주 꾸준히 포스팅 하라

위의 방식은 웹검색에서는 매우 유용하게 사용될 수 있지만 블로그검색은 많은 차이가 있다. 시간을 중요시하는 웹로그시스템이기 때문이다. 시간이 가장큰 점수산정 요소이므로 가능한 부지런히 포스팅 하는게 좋다.

혹시 기존의 웹문서 컨텐츠를 블로그로 옮길 계획이라면 하루에 수백건씩 몽땅 올리는우를 범하지 말기 바란다. 느긋하게 하루에 2-3개씩 정도를 포스팅 하도록 하자.

블로그에서의 문서 중요도는 시간과 채널 중요도에 따라서 결정이 된다. 채널 중요도는 이 블로그가 얼마나 포스팅을 열심히 하는가로 결정하는데 하루에 수십-수백개씩 올리면, 이 채널은 뉴스사이트 혹은 메타사이트정도로 인식이 되어서 채널중요도가 떨어지게 된다. 그러므로 꾸준히 올리는게 중요하다.

오늘은 여기까지 하겠습니다. 다음번에는 사이트내에서의 검색을 통한 최적화에 대해서 알아보겠습니다.