我们日常生活中经常会用到搜索引擎,用户提交查询,搜索引擎返回查询列表,看似平常不过,实则不简陋。本系列博文将介绍WEB搜索引擎原理及基本构成。一般WEB搜索引擎包括“网络爬虫”、“预处理模块”、“查询服务模块”等主要模块。“网络爬虫”从英特网中抓取网页作为原始网页库保存在搜索引擎服务器,这也是我们在百度等搜索引擎上经常看到的“网页快照”。根据爬虫抓取的原始网...
我们日常生活中经常会用到搜索引擎,用户提交查询,搜索引擎返回查询列表,看似平常不过,实则不简陋。本系列博文将介绍WEB搜索引擎原理及基本构成。一般WEB搜索引擎包括“网络爬虫”、“预处理模块”、“查询服务模块”等主要模块。“网络爬虫”从英特网中抓取网页作为原始网页库保存在搜索引擎服务器,这也是我们在百度等搜索引擎上经常看到的“网页快照”。根据爬虫抓取的原始网...