인터넷 검색 엔진 의 분류는 계층 적 검색 엔진, 디렉토리, 하이브리드 검색 엔진 및 메타 검색 엔진으로 나눌 수 있습니다.
검색 엔진은 World Wide Web에서 정보를 찾을 수 있도록 설계된 소프트웨어 시스템입니다. 키워드를 사용하여 해당 단어와 관련된 문서를 검색 한 다음 검색중인 주제와 관련된 순서대로 결과의 순위를 매 깁니다.
인터넷 검색 엔진은 사용자가 필요로하는 정보를 추출하려고합니다. 이것은 인터넷에서 사용 가능한 대용량 데이터베이스로 인해 가능합니다.
그들은 정보를 찾기 위해 매일 사용하는 도구가되었습니다. 덕분에 현재 Google, AOL, Yahoo 및 Bing과 같은 검색 엔진을 사용하여 정보를 쉽게 찾을 수 있습니다.
인터넷에는 수천 개의 서로 다른 검색 엔진이 있습니다. 각각의 능력과 특성이 다릅니다.
처음으로 개발 된 검색 엔진은 Archie였으며 FTP 파일을 검색하는 데 사용되었습니다. 최초의 텍스트 기반 검색 엔진은 Veronica였습니다.
사용자는 컴퓨터, 스마트 폰, 태블릿 또는 기타 전자 장비의 브라우저를 통해 검색 엔진에 액세스 할 수 있습니다.
인터넷 검색 엔진 유형 분류
1- 계층 적 구도자 (거미)
이러한 유형의 검색 엔진은 '스파이더'를 사용하여 인터넷에서 웹 사이트를 검색합니다. 이 스파이더는 개별 웹 페이지에 들어가 키워드를 추출한 다음 인터넷 검색 엔진의 데이터베이스에 페이지를 추가합니다.
이러한 유형의 검색 엔진의 장점은 많은 페이지를 포함하고 사용하기 쉽다는 것입니다. 이러한 이유로 사용자가 익숙해지면서 반복적으로 사용하는 것이 매우 일반적입니다.
반면에 단점은 너무 많은 데이터를 추출하기 때문에 너무 많은 정보를 가질 수 있다는 것입니다.
인터넷에서 인기있는 대부분의 검색 엔진은 Google, Bing, Yahoo, Baidu 및 Yandex와 같이 계층 적입니다.
모든 계층 적 인터넷 검색 엔진은 봇 (스파이더)을 사용하여 검색 데이터베이스에 대한 새 콘텐츠를 찾아 색인을 생성합니다.
검색 결과에 웹 페이지를 표시하기 전에 모든 계층 적 검색 엔진이 따르는 네 가지 기본 단계가 있습니다.
슬라이드하려면
검색 엔진은 사용 가능한 웹 페이지를 찾기 위해 인터넷 전체를 크롤링합니다. 이것은 spider라는 소프트웨어에 의해 수행됩니다. 산사태 사이의 빈도는 며칠이 걸릴 수 있습니다.
인덱싱
웹 페이지를 가장 잘 설명하는 단어와 표현을 식별하는 과정입니다. 식별 된 단어를 키워드라고하며 페이지는 식별 된 단어에 할당됩니다.
관련성 계산
검색 엔진은 요구 사항 문자열의 검색 문자열을 데이터베이스의 인덱싱 된 페이지와 비교합니다.
둘 이상의 페이지가 검색 문자열을 포함 할 가능성이 더 높기 때문에 검색 엔진은 검색 문자열과 색인에있는 각 페이지의 관련성을 계산하기 시작합니다.
관련성을 계산하기위한 몇 가지 알고리즘이 있습니다. 이러한 각 알고리즘에는 키워드 또는 링크 밀도와 같은 공통 요소에 대해 서로 다른 상대적 가중치가 있습니다.
이것이 각 검색 엔진이 동일한 검색 문자열에 대해 서로 다른 결과 페이지를 제공하는 이유입니다.
때때로 검색 엔진은 알고리즘을 변경합니다.
결과 검색
기본적으로 브라우저에 결과를 표시하는 것입니다. 가장 관련성이 높은 것부터 중요하지 않은 것 순으로 정렬 된 끝없는 검색 결과 페이지입니다.
2- 디렉터리
디렉토리는 목록에 대한 사람의 활동에 의존하는 검색 엔진입니다. 웹 페이지는 디렉토리에 제출되고 포함 여부는 편집 팀의 승인을 받아야합니다.
이 프로세스는 다음과 같이 발생합니다.
1- 웹 사이트의 소유자는 자신의 사이트에 대한 간단한 설명을 목록에 포함되어야하는 카테고리와 함께 디렉토리에 제출합니다.
2- 제출 된 사이트는 수동으로 검토됩니다. 그런 다음 적절한 카테고리에 추가하거나 목록에서 거부 할 수 있습니다. 콘텐츠가 좋은 사이트는 콘텐츠가 좋지 않은 웹 페이지보다 추가 될 가능성이 높습니다.
3- 검색 창에 입력 한 키워드가 웹 페이지 설명과 일치합니다. 즉, 사이트의 설명 만 중요하므로 사이트의 내용에 대한 변경 사항은 고려되지 않습니다.
장점은 각 페이지를 포함하기 전에 관련성과 콘텐츠를 검토한다는 것입니다. 종종 결과가 적다는 것은 필요한 것을 더 빨리 찾을 수 있음을 의미합니다.
즉, 형식과 레이아웃은 대부분의 사람들에게 친숙하지 않으며 덜 일반적인 검색으로 어려움을 겪을 수 있습니다. 또 다른 단점은 웹 페이지 생성 및 디렉토리에 포함하는 데 지연이 있다는 것입니다.
유명한 디렉토리로는 Open Dictionary Project, Internet Public Library 및 최근에 폐쇄 된 DMOZ가 있습니다.
3- 하이브리드 검색 엔진
이러한 검색 엔진은 계층 적 검색 엔진과 디렉토리를 모두 사용하여 검색 결과에 웹 페이지를 나열합니다.
Google과 같은 대부분의 스파이더 검색 엔진은 기본적으로 계층 적 검색 엔진을 기본 메커니즘으로 사용하고 수동 모니터링을 보조 메커니즘으로 사용합니다.
때때로 사용자에게 웹이나 디렉토리를 검색 할 수있는 옵션이 제공됩니다. 다른 경우에 사용자는 동일한 검색에서 사람이 선별 한 결과와 계층 적 결과를 모두받을 수 있습니다. 이 경우 일반적으로 사람의 결과가 먼저 나열됩니다.
점점 더 많은 검색 엔진이이 시스템으로 마이그레이션되고 있지만 Google과 Yahoo는이 범주에 속하는 두 가지 주요 검색 엔진입니다.
4- 메타 검색 엔진
이러한 인터넷 검색 엔진은 다른 검색 엔진을 동시에 검색 한 다음 결과를 단일 목록으로 결합하는 엔진입니다.
장점은 더 많은 결과를 얻을 수 있지만 관련성과 품질이 상당히 저하 될 수 있다는 것입니다.
메타 검색 엔진의 예로는 Dogpile, Metacrawler 및 Clusty가 있습니다.
참고 문헌
- 다른 유형의 검색 엔진은 무엇입니까 (2016). webnotes.com에서 복구 됨
- 인터넷 검색 : 검색 엔진 유형. libguides.astate.edu에서 복구
- 검색 엔진 유형 (2008). zeald.com에서 복구
- 검색 엔진 및 유형 (2015). slideshare.com에서 복구 됨
- 검색 엔진 (2017). computerhope.com에서 복구