Vuejs로 Google custom Search를 붙여봤다.

의 문서 검색을 위해서 Solr, ElasticSearch등을 붙여본적도 있었다. 공부는 할 수 있었지만 유지&보수의 귀찮음 그리고 품질 문제 때문에(이것도 결국 귀차니즘의 문제가 되겠다.) 그냥 Google Custom Search를 사용하기로 했다. (구글 맞춤검색)은 구글에서 제공하는 검색 서비스다. 다른 검색 엔진을 만들거나 구축할 필요 없이(ES...

Solr

Solr는 루신(lucene)기반의 검색 소프트웨어다. 루신이 검색엔진이라면, Solr는 색인과 검색, 분산 검색, 리플리케이션, 로드밸런싱 등 검색서비스를 위한 다양한 기능을 포함한 검색 소프트웨어라고 할 수 있다. 이 바닥에서는 ElasticSearch을 많이 사용하고 있는 것 같다. 스키마를 정의 할 필요가 없어서 로그와 같은 비정형 데이터를 색인하기...

Solr로 로컬 검색서비스 만들기

Solr로 로컬 검색서비스 만들기 4.7 버전에 맞추어 새로 작성 중Solr은 Apache 프로젝트에 기반을 둔 검색엔진으로 기업 대상으로 개발을 했다. 현재(@DATE) 최신 버전은 Apache solr 4.7.0 버전이다.Solr는 단독 애플리케이션 서버 형태로 작동하며, REST 형식의 API를 제공한다. 문서들은 를 이용해서 XML, JSON...

google page rank

google page rank ...

Lucene & Nutch

Lucene & NutchLucene은 오픈소스 기반의 고성능 검색엔진이다. Java 언어로 개발됐으며, Full-text 검색을 지원한다. ...

PHP Solr 테스트

PHP Solr 테스트 우분투 리눅스 14.04 PHP Version 5.5.9 PECL 사용은 문서를 참고한다. Solr 확장을 패키지 하기 위해서 몇개 패키지들을 추가 설치해야 한다. 먼저 php5-dev를 설치한다.# apt-get install php5-devcurl을 위한 헤더파일이 필요하다. # apt-get libcurl4-gnutls-d...

nutch에서의 MapReduce

nutch에서의 MapReduce 문서의 내용은 완성된 상태가 아니다. nutch소스코드를 분석하면 완성된 문서가 만들어질 것이다.MapReduce는 Google( 1. http 1. attachmentMapReduce는 완성된 상태로 배포되는 라이브러리 혹은 프로그램이 아닌 모델이다. 그러므로 자신의 환경에 맞는 MapReduce 시스템을 만들어...

Nutch Hadoop 설치 운용 문서

Nutch Hadoop 설치 운용 문서 .. 좀 오래된 문서라서, 지금 상황 (2008/10/22)에 맞도록 수정할 계획임)Hadoop은 분산(distributed file system)으로 MapReduce(이 문서는 Nutch와 Hadoop의 구조적인 부분을 설명하지는 않을 것이다. 단지 설치하고 운용하는데에 촛점을 맞출 것이다. 원문은 ht...

테스트 환경 만들기

테스트 환경 만들기검색엔진의 이론적 기본은 이미 5년전전에 완성되었으며, 발표된 이론을 거의 대부분 수용하고 있는 lucene 검색엔진까지 개발된 상태다. 현재로써는 새로운 검색엔진의 개발이라는 목표를 세울 필요도 없다. 몇가지 할일이라고는 검색을 최적화 하기 위해서 몇몇 수식을 약간씩 고치는 정도이겠지만 별 의미 없는 일이라고 생각된다. 그거 약간 고친...

nutch

nutchnutch는 공개 검색엔진인 Lucene을 좀더 발전시킨 형태로 개발하고 있는 진보된 공개 검색엔진이다. 기존에 발표된 문서수집/검색 알고리즘 뿐만 아니라, 최근에 발표된 다른 알고리즘도 반영되고 있으므로 검색엔진의 개발을 기획하는데 많은 도움을 줄 수 있을 것이라는 판단하에 nutch에 대한 분석을 하기로 했다. ...