Recommanded Free YOUTUBE Lecture: <% selectedImage[1] %>

정의

태그는 어떤 단위정보의 특징을 확인시켜줄 수 있는 정보와 연관된 단어 혹은 핵심어로 정의 내릴 수 있다. 여기에서 단위정보란 그림, 블로그 포스트, 위키페이지, 동영상, 지도정보등이 될 수 있을 것이다.

예를들어서 피카소의 게르니카의 태그는 화가,피카소,예술작품,게르니카,현대미술이 될 수 있을 것이다. 상징, 혹은 기호라는 측면에서 바라볼 수 있을 것이다. 상징이나 기호가 가지는 좋은 장점은 정보를 압축할 수 있다는 점일 것이다. 태그와 같은 상징으로 압축된 정보는 분류하기 쉽고, 더 빨리 찾아낼 수 있을 것이다. 분류를 쉽게 하기 위해서, 물건등에 태그를 붙이는 것을 우리는 쉽게 찾아볼 수 있다.

attachment:ge.jpg

태그의 필요성및 장점

인터넷의 단위정보들에 대해서 태그를 붙이는 것도 같은 이유다. 특정한 주제를 다루는 문서의 경우에 있어서, 이 문서가 어떤 단어로 대표될 수 있는가 하는건 매우 중요한 문제가 된다. 원하는 문서를 찾을 때 이 단어를 이용해서 찾아내기 때문이다. 그렇지만 컴퓨터를 이용해서 이러한 일을 하는 건 쉬운일이 아니다. 다행히도 검색엔진(:12)의 발달로 TF(:12)와 IDF(:12) 그리고 문서랭킹에 기반해서 단어를 대표로 하는 문서들을 찾아낼 수 있기는 하지만, 역시 지능을 가지지 않는 컴퓨터가 하는 일이니 만큼 써억 만족스럽지가 못하다.

그나마 문서는 검색엔진을 써서 어떻게 해보기라도 하지만, 정보의 대상이 이미지나 영상정도가 되면 컴퓨터를 이용해서 대표되는 단어를 찾아내는 것은 거의 불가능에 가깝다고 할 수 있을 것이다.

태그는 인간이 자신의 정보에 부여하는 것이기 때문에, 이러한 문제를 근본적으로 해결할 수 있는 장점을 가진다. 또 다른 장점은 검색엔진(:12)을 사용하는 것에 비해서 태그시스템을 구축하는게 매우 용이하다는 점이 될 것이다.

태그가 가지는 또다른 뛰어난 장점으로는 문화를 대표하는 keyword를 뽑아낼 수 있다는 점이다. 인간의 문화는 대게가 함축적이고 상직적일 수가 있는데, 컴퓨터는 여기에서 이들을 상징하는 단어들을 뽑아내는게 불가능 하다.

attachment:black.jpg

위의 그림을 예로 들어보자. 이 그림을 대표하는 keyword는 개인과 문화에 따라 매우 달라질 수 있을 것이다. 컴퓨터는 이러한 문화적차이에 따른 keyword를 결코 찾아낼 수 없을 것이다. 그러나 인간은 이 이미지에 다양한 keyword를 부여할 수 있다. 이 keyword 는 자신의 생각 문화 환경의 영향을 받은 것들일 것이다.

이와 같이 태그는 바이너리 정보로 연결되는 문서들을 문화적 키워드로 연결시켜줄 수 있다.

태그의 단점

그러나 태그가 근본적으로 사람에게 의존한다는 점 때문에, 몇 가지 문제가 발생한다.
  1. 귀찮음
태그의 가장 큰 문제점은 귀찮다라는 점이 될 것이다. 혹은 귀찮음을 무릅쓰고서라도 태그를 달만한 가치를 느끼지 못하기 때문일 수도 있다. 태그가 쓸모가 있게 보일려면, 태그가 가지는 문화적 특성을 잘 보여줄 수 있어야 한다. 그런데, 아직까지는 이러한 마땅한 툴이 없는 것 같다. 그냥 태그 클라우드 형식으로만 보여주는 것 같다. 태그 클라우드는 현재의 이슈를 보여줄 수 있겠지만 그 이상은 힘들며, 단지 태그 클라우드로써 태그가 활용된다고 하면, 사용자 입장에서도 딱히 태그를 달 필요는 없는 것이다. 그냥 태그 SEO(:12)차원에서 검색이 더 잘되게 하기 위한 정도 ?
  1. 똑똑한 태깅의 어려움
1번과 연결해서 생각할 수 있다. 문서를 작성할 때, 어려운 점 중의 하나는 제목을 정하는 일이다. 이는 문서를 대표할 수 있는 keyword를 뽑아내는게 생각만큼 쉽지가 않다는 것을 반증하는 예이다. 여기에 귀차니즘까지 더하게 된다면 대충대충 태깅을 하게 되고, 태그의 질적저하를 가져오게 될 것이다.
  1. 태그를 상대로한 SEO
검색엔진의 최대적은 SEO일 것이다. 허용할 수 있는 수준에서의 SEO도 있지만 그 수준을 넘어설 경우 검색결과의 품질자체를 떨어트리게 되는데, 태그 역시 동일한 문제가 발생할 수 있다. 많은 메타블로그들이 문서를 노출시키기 위한 방법으로 태그를 이용하게 되는데, 이를 악용해서 자신의 문서를 상위에 노출시키고자 하는 경우는 어렵지 않게 찾아볼 수 있다. 가장 손쉬운 방법은 최근뜨는 태그를 - 그렇지만 자신의 문서와는 별 관계도 없다 - 적당히 끼워 넣는 것이다. 역시 태그의 품질을 크게 떨어트리게 된다. 이 문제를 해결하기 위해서 구글검색엔진의 경우 PageRank와 같은 페이지단위의 랭킹 알고리즘을 적용하고 있다. 태그를 이용한 정보검색, 분류, 클라우드 생성에도 적당한 알고리즘이 개발될 필요가 있다.

태그가 가지는 문제점 - 한계 - 의 해결

자신의 컨텐츠에 대해서 태깅을 하지 않는 문제는 자동으로 keyword를 찾아주는 것으로 어느정도 해결할 수 있을 것이다. 간단하게 TF(:12) 기반으로 많이 발견된 단어를 태깅을 위한 keyword로 제시를 하는 것으로 컨텐츠 장성자로 하여금 태깅을 하기 위한 동기를 부여해주는 효과를 얻을 수 있다. 이 방법은 사용자가 똑똑한 태깅을 하는데 더 많은 자원을 소비할 수 있게 만들어준다는 부가적인 효과도 누릴 수 있다.

태그를 대상으로 하는 SEO에 대응되는 알고리즘은 자세히 설명하지 않도록 할 것이다. 이에 대해서는 더 많은 고민이 필요할 것이며, 아래에 간단히 언급만 하고 넘어가도록 하겠다. 대상은 비교적 쉽게 설명이 가능한 블로그 컨텐츠로 한정하도록 하겠다.
  1. 블로그에 대한 랭킹
    • 포스팅 빈도 : 일주일 단위로 2-3건 정도의 포스팅 패턴을 가지는 경우 높은 랭크를 부여하는 방법 등.
    • 단어의 범위 : 특정한 주제를 중점적으로 다루는 블로그 일 수록 더 높은 점수를 줄 수 있을 것이다. 특정한 주제를 다루는지는 단어가 얼마나 넓은 범위에서 출현하는지를 계수하는 방법을 사용할 수 있다. 다양한 주제에 대해서 포스팅을 한다면, 넓은 범위에서 유니크한 단어들이 출현을 예상할 수 있을 것이다. 이러한 블로그는 낮은 랭킹 점수를 부여한다.
  2. 태그에 대한 가중치
    • 단일 블로그 영역에서의 가중치
  3. 태깅을 위해서 더 많이 사용된 keyword는 그 두께를 다르게 하는 방식으로 이미 구현되어서 사용되고 있다.
    • 블로그 스피어영역에서의 태그 가중치 :
    keword가 많이 발생한 것들에 대해서 더 많은 점수를 주게 될 경우 발생하는 문제점은 높은 점수를 받는 주제가 거의 고정된다는 점이다. 메타블로그 관점에서 보자면, 노출되는 포스트만 계속 노출되는 문제점이 발한다는 건데, allblog(:12)에서 실제 이러한 현상을 찾아볼 수 있다. allblog의 경우 특별한 주제를 가지지 않는 메타사이트임에도 불구하고 IT, 정치, 몇개 사회적 이슈만이 계속해서 높은 점수를 가지고 대문을 장식하는 것을 볼 수 있다. 이 문제의 해결은 검색엔진에서 찾을 수 있다. IDF(:12)알고리즘을 적용하는 것으로, keywords의 두께가 적을 경우 이것은 전문적인 주제에 대한 keywords로 보고 좀 더 높은 점수를 주는 것이다. 이 방식은 구현이 간단하고 효율적이다. 왜냐면 포스트의 특징을 제대로 표현하는 keywords를 찾아내는 것은 쉬운일이 아니며, 이는 제대로된 keywords 일 수록 그 두께가 대체로 더 얇아질 수 있음을 의미하는 것이기 때문이다. IDF 알고리즘은 제대로된 keywords를 찾아서 태깅한데 대한 보상을 줄 수 있다. 이런 태그를 포함한 문서는 더 좋은 문서일 확률이 높다고 볼 수 있다.

    계속 고민...

    문화를 keyword 하는 태그

    • A라는 문화에서 코카콜라는 젊음과 자유의 상징이다.
    • B라는 문화에서 코카콜라는 제국주의의 상징이다.
       B문화                                                    A 문화
            |                      +-------+                  | 
            | <--> IMPERIALISM <-->| coke  |<---> free <----> |
            |                      +-------+                  |
  4. A문화와 B문화를 연결하는 의미
    • A문화와 B문화의 차이-틈, 간격-를 만드는 의미
    계속 고민 ...

    태그 클라우드의 한계

    • 태그의 가장 흔한 응용
    • 태그 클라우드를 서비스하는 사이트들을 찾아보고 한계점을 찾아보도록 하자.

    태그의 카테고리화

    태그의 그래프화

    1. 태그는 그래프 - 자료구조로써의 그래프를 말한다 - 화 할 수 없을까 ?
      • 태그가 효과적으로 그래프화 되기 위해서는 태그의 순서가 예상될 수 있어야 한다. 즉 연상의 순서를 따르는 식.
      • 태그가 나열되는 위치에 관계를 찾을 수 있는지 확인 해봐야 할 것 같다.