搜索引擎工作原理图
搜索引擎工作过程大体分为三个阶段:
1、抓取和爬行:搜索引擎蜘蛛通过跟踪链接访问网页,获得页面HTML代码存入数据库。
2、预处理:搜索引擎程序对抓去来的页面数据进行文字提取、中文分词、索引处理,以备排名程序调用。
3、排名:用户输入关键词后,排名程序调用索引数据,计算相关性,然后按一定格式生成搜索结果页面。