의 문서 검색을 위해서 Solr, ElasticSearch등을 붙여본적도 있었다. 공부는 할 수 있었지만 유지&보수의 귀찮음 그리고 품질 문제 때문에(이것도 결국 귀차니즘의 문제가 되겠다.) 그냥 Google Custom Search를 사용하기로 했다. (구글 맞춤검색)은 구글에서 제공하는 검색 서비스다. 다른 검색 엔진을 만들거나 구축할 필요 없이(ES...
Solr는 루신(lucene)기반의 검색 소프트웨어다. 루신이 검색엔진이라면, Solr는 색인과 검색, 분산 검색, 리플리케이션, 로드밸런싱 등 검색서비스를 위한 다양한 기능을 포함한 검색 소프트웨어라고 할 수 있다. 이 바닥에서는 ElasticSearch을 많이 사용하고 있는 것 같다. 스키마를 정의 할 필요가 없어서 로그와 같은 비정형 데이터를 색인하기...
Solr로 로컬 검색서비스 만들기 4.7 버전에 맞추어 새로 작성 중Solr은 Apache 프로젝트에 기반을 둔 검색엔진으로 기업 대상으로 개발을 했다. 현재(@DATE) 최신 버전은 Apache solr 4.7.0 버전이다.Solr는 단독 애플리케이션 서버 형태로 작동하며, REST 형식의 API를 제공한다. 문서들은 를 이용해서 XML, JSON...
PHP Solr 테스트 우분투 리눅스 14.04 PHP Version 5.5.9 PECL 사용은 문서를 참고한다. Solr 확장을 패키지 하기 위해서 몇개 패키지들을 추가 설치해야 한다. 먼저 php5-dev를 설치한다.# apt-get install php5-devcurl을 위한 헤더파일이 필요하다. # apt-get libcurl4-gnutls-d...
구글 사이트 관리자 도구 검색엔진의 경쟁력은 얼마나 많은 양질의 웹문서에 대한 Index(색인)결과를 가지고 있느냐에 달려있다. 구글이 세계최고의 회사중 하나가 된데에는 방대한 양의 웹색인 문서를 가지고 있기 때문이다. 구글 연구소에서 개발된 선도적인 기술들 덕분이다. 그러나 문제가 있다. 워낙에 방대한 양의 문서들이 생기기 때문에, 웹문서를 crawl...
검색엔진 Boolean Model은 정보검색(불리언 모델은 사용자 쿼리로 부터 주어진 Term을 포함한 문서를 찾는다고 하면, 해당 문서가 Term을 포함하고 있는지 (true), 아닌지 (false)에 대한 정보만을 가지고 문서를 찾아낸다. 매우 단순하고 효율적이며 빠른 구현이 가능하지만, 문헌의 우선순위나 사용자 질의에 대한 가중치등을 부여할 수 없기...
검색엔진 공개 검색엔진(루신은 vector A B C 검색어는 구글 검색 엔진 이라고 가정해보자. 3문서 모두다 "구글 검색 엔진"을 포함하고 있으며, TF(A 번 문서는 "구글 검색 엔진"이 모두 동일한 위치에서 높은 밀도로 발생했으며, C 번 문서는 각각 다른 장소에서 낮은 밀도로 발생하고 있다. 그렇다면 A 문서가 더 높은 값을 가지도록 계산요소...
40 POSTS HERE
Vuejs로 Google custom Search를 붙여봤다.
의 문서 검색을 위해서 Solr, ElasticSearch등을 붙여본적도 있었다. 공부는 할 수 있었지만 유지&보수의 귀찮음 그리고 품질 문제 때문에(이것도 결국 귀차니즘의 문제가 되겠다.) 그냥 Google Custom Search를 사용하기로 했다. (구글 맞춤검색)은 구글에서 제공하는 검색 서비스다. 다른 검색 엔진을 만들거나 구축할 필요 없이(ES...
Solr
Solr는 루신(lucene)기반의 검색 소프트웨어다. 루신이 검색엔진이라면, Solr는 색인과 검색, 분산 검색, 리플리케이션, 로드밸런싱 등 검색서비스를 위한 다양한 기능을 포함한 검색 소프트웨어라고 할 수 있다. 이 바닥에서는 ElasticSearch을 많이 사용하고 있는 것 같다. 스키마를 정의 할 필요가 없어서 로그와 같은 비정형 데이터를 색인하기...
Solr로 로컬 검색서비스 만들기
Solr로 로컬 검색서비스 만들기 4.7 버전에 맞추어 새로 작성 중Solr은 Apache 프로젝트에 기반을 둔 검색엔진으로 기업 대상으로 개발을 했다. 현재(@DATE) 최신 버전은 Apache solr 4.7.0 버전이다.Solr는 단독 애플리케이션 서버 형태로 작동하며, REST 형식의 API를 제공한다. 문서들은 를 이용해서 XML, JSON...
Lucene & Nutch
Lucene & NutchLucene은 오픈소스 기반의 고성능 검색엔진이다. Java 언어로 개발됐으며, Full-text 검색을 지원한다. ...
google page rank
google page rank ...
PHP Solr 테스트
PHP Solr 테스트 우분투 리눅스 14.04 PHP Version 5.5.9 PECL 사용은 문서를 참고한다. Solr 확장을 패키지 하기 위해서 몇개 패키지들을 추가 설치해야 한다. 먼저 php5-dev를 설치한다.# apt-get install php5-devcurl을 위한 헤더파일이 필요하다. # apt-get libcurl4-gnutls-d...
구글 사이트 관리자 도구 : Google Sitemap
구글 사이트 관리자 도구 검색엔진의 경쟁력은 얼마나 많은 양질의 웹문서에 대한 Index(색인)결과를 가지고 있느냐에 달려있다. 구글이 세계최고의 회사중 하나가 된데에는 방대한 양의 웹색인 문서를 가지고 있기 때문이다. 구글 연구소에서 개발된 선도적인 기술들 덕분이다. 그러나 문제가 있다. 워낙에 방대한 양의 문서들이 생기기 때문에, 웹문서를 crawl...
검색엔진및 검색서비스
검색엔진및 검색서비스 ...
검색엔진 : Boolean Model
검색엔진 Boolean Model은 정보검색(불리언 모델은 사용자 쿼리로 부터 주어진 Term을 포함한 문서를 찾는다고 하면, 해당 문서가 Term을 포함하고 있는지 (true), 아닌지 (false)에 대한 정보만을 가지고 문서를 찾아낸다. 매우 단순하고 효율적이며 빠른 구현이 가능하지만, 문헌의 우선순위나 사용자 질의에 대한 가중치등을 부여할 수 없기...
검색엔진 : Density based model
검색엔진 공개 검색엔진(루신은 vector A B C 검색어는 구글 검색 엔진 이라고 가정해보자. 3문서 모두다 "구글 검색 엔진"을 포함하고 있으며, TF(A 번 문서는 "구글 검색 엔진"이 모두 동일한 위치에서 높은 밀도로 발생했으며, C 번 문서는 각각 다른 장소에서 낮은 밀도로 발생하고 있다. 그렇다면 A 문서가 더 높은 값을 가지도록 계산요소...