荔园在线

荔园之美,在春之萌芽,在夏之绽放,在秋之收获,在冬之沉淀

[回到开始] [上一篇][下一篇]


发信人: PhilCF (起床.挂站.TSG.下站.睡觉), 信区: NetResource
标  题: 毕业论文二、搜索引擎的历史与发展[ZZ]
发信站: 荔园晨风BBS站 (Tue Jun 25 19:10:42 2002), 转信

发信人: chenhua (陈华), 信区: FtpSearch
标  题: 毕业论文二、搜索引擎的历史与发展
发信站: 天网搜索论坛 (Wed May 29 22:22:49 2002)

二、    搜索引擎的历史与发展

a)      搜索引擎的起源

    1991年,XWAIS版本提供了一个有着友好界面的信息搜索系统,但这个系统要求很
特殊的文件格式。而在同一年还出现了另外一个信息搜索系统,这是我们所称之为的
GOPHER。Gopher 是一种按"菜单"形式组织的分布式文档查询系统 ,  最初在
Minnesota大学发展起来(1991年),  开始用于校园网,  后来推广到Internet. Gopher
为用户查询信息提供一个多级的菜单界面,  只需按照菜单指示的路径就能获取你想要
的信息,  使用非常方便. Gopher由 Gopher客户(Gopher Client)程序和Gopher服务器
(Gopher Server)程序两部分组成. 在Internet上建立了数以千计的运行Gopher服务器
程序的 Gopher 服务器. 它们是一些能为用户提供信息查询服务的计算机系统. 到
1995年初的统计,  约有 6, 000主机安装了Gopher Server,  遍及全世界 100多个国家
. 绝大多数 Gopher 服务器都是向 所有Internet用户开放的. Gopher系统的主要信息
形式是正文文件. 信息文件可能驻留在不同的计算机上,  通过目录结构把它们链接在
一起. 一个 Gopher 服务器的所有信息文件组成一棵信息树. 由于这种链接是透明的,
 用户查询时可以在信息树之间自由穿越,  不必考虑信息的物理位置. Gopher 客户程
序是用户端的信息浏览程序,  用于同Gopher Server进行对话. 用户查询时,  通过
Client对Server发出查询请求; Server接收这种请求并把查询结果送回Client. 任何一
台能够通过某种方式与Internet连接的计算机,  都可以通过一定方法成为 Gopher
client .

b)      真正意义的搜索引擎

    最早的真正意义上的搜索引擎是Lycos,创建于1994年的春天,当时Michael
Mauldin将Johneavitt的spider程序接入到其索引程序中。Yahoo!也是在当年成立的。
而NCSA Mosaic出现在1993年,Netscape出现在1994年。搜索引擎起源于传统的信息全
文检索理论,即计算机程序通过扫描每一篇文章中的每一个词,建立以词为单位的倒排
文件,检索程序根据检索词在每一篇文章中出现的频率和每一个检索词在一篇文章中出
现的概率,对包含这些检索词的文章进行排序,最后输出排序的结果。搜索引擎除了全
文检索系统之外,还要有“蜘蛛”(SPIDER)系统,即能够从互联网上自动收集网页的数
据搜集系统。蜘蛛将搜集所得的网页内容交给索引和检索系统处理,就形成了我们常见
互联网搜索引擎系统。

c)      Ftp的搜索引擎

I、基于文本的ftp搜索引擎:Archie。
    Archie能在只知道文件名的前提下,为用户找到这个文件所在的FTP服务器的地址
。Archie实际上是一个大型的数据库,再加上与这个大型数据库相关联的一套检索方法
。该数据库中包括大量可通过FTP下载的文件资源的有关信息,包括这些资源的文件名
、文件长度、存放该文件的计算机名及目录名等。  使用Archie服务器有三条途径,常
用到的是:通过远程登录到Archie主机,用Archie作为登录名。一旦登录成功,一个
Archie程序将自动执行,这时一次输入一条命令,告诉Archie想查寻的内容,Archie将
检索自己的数据库并显示检索的结果。如果用户对自己想要的东西并不太清楚,
Archie还提供“whatis”服务项目,该服务提供成千上万个程序、数据文件和文档的简
短说明。

II、基于Web的Ftp搜索引擎。
    WWW的出现改变了Archie在文件搜索方面的统治地位,在美观、方便的WWW页面上搜
索ftp文件成为用户的一大需求。在功能上,基于Web的ftp搜索引擎实现的功能与
Archie基本一样,都是对用户提交的查询匹配串找到可以下载的ftp站点链接。但基于
Web的ftp搜索引擎也有很多特色的功能,比如天网ftp搜索引擎的文件分类功能等等。
基于Web的ftp搜索引擎也采用了很多WWW搜索引擎的策略,比如使用Spider自动收集数
据,采用倒排索引,智能换页链接技术以及大型ftp搜索引擎必须采用的分布收集和服
务技术。目前国内国际ftp搜索引擎已有不少,但在系统底层上有区别的只有几种,其
中较为有名的有北京大学天网搜索引擎的ftp子系统,华南木棉的ftp搜索系统,号称全
球最大的ftp搜索引擎的philes.com,以及lycos.com使用的fastsearch.com的
fastftpsearch,小型网站常使用的NOSEY PARKER系统以及其他一些搜索引擎。


--

※ 来源:.天网搜索论坛 http://binglebbs.dhs.org[FROM: 162.105.80.74]

--

      WELCOME TO PC's Home  HTTP://192.168.48.84

※ 来源:·荔园晨风BBS站 bbs.szu.edu.cn·[FROM: 192.168.48.84]


[回到开始] [上一篇][下一篇]

荔园在线首页 友情链接:深圳大学 深大招生 荔园晨风BBS S-Term软件 网络书店