荔园在线

荔园之美,在春之萌芽,在夏之绽放,在秋之收获,在冬之沉淀

[回到开始] [上一篇][下一篇]


发信人: PhilCF (起床.挂站.TSG.下站.睡觉), 信区: NetResource
标  题: 毕业论文四、eWWW搜索界面[ZZ]
发信站: 荔园晨风BBS站 (Tue Jun 25 19:12:00 2002), 转信

发信人: chenhua (陈华), 信区: FtpSearch
标  题: 毕业论文四、e) WWW搜索界面
发信站: 天网搜索论坛 (Wed May 29 22:35:23 2002)

e)      WWW搜索界面

    网页是FTP搜索引擎的用户界面。美观大方、使用方便以及兼容不同操作系统下不
同浏览器是网页设计的标准。用户的输入页面有两种:简单查询与复杂查询页面。简单
查询只有一个输入框用以输入要搜索的字串,其它限制信息由CGI缺省给出。简单查询
可以和WWW查询集成,由用户选定使用WWW搜索器还是FTP搜索器查找。复杂查询由一个
复杂表单供用户选定各种过滤,如时间,大小,站点,类型过滤等。另外,最新的天网
ftp搜索引擎增加了快捷方式系统,使得WWW搜索界面更为方便,快捷方式系统另外独立
描述。

    CGI程序从网页表单的提交或直接由URL得到搜索要求,进行参数检查。然后将搜索
请求发往服务器,服务器将过滤后的结果信息返回,CGI程序按此生成网页。


i.      CGI参数说明

    CGI参数分成两类,一类是搜索用的,一类是显示页面用的。

用于搜索的参数有:

word                    匹配串,缺省为“.exe”
ResultNum               已知的结果总数,缺省为-1,即未知结果数
SearchType              确定是否需要过滤属性,缺省为0,即不过滤
Fromyear                起始年号,缺省为1970
Frommonth               起始月份,缺省为1
Fromdate                起始日期,缺省为1
Toyear                  终止日期,缺省为2050
Tomonth                 终止月份,缺省为12
Todate                  终止日期,缺省为31
FromSize                起始大小,缺省为0
ToSize                  终止大小,缺省为0x7fffffff,接近4G
FileType                受限的文件类型编号,缺省为0,即所有文件类型
Inputstr                表单里的已知查询字串,如果它不空即是结果中查询
ExactSearch             精确匹配选项,缺省为0,即不是精确匹配
Site                    受限站点编号,缺省为0,即所有站点

        用于显示的参数

MaxHits                 每页显示的结果数目,缺省为40
BeginWith               当前页显示的起始结果编号,缺省为0
Single                  结果页面的显示样式:表单或者条目,缺省为条目样式
Cdtype                  结果页面的语言版本:gb:简体中文,big5:繁体中文,
                        en:英文,缺省为简体中文


ii.     智能的换页机制

    由于大部分情况下搜索结果在一页内显示不了,因而要采用换页机制。即CGI程序
向服务器提供起始显示项号和最大显示项数,由服务器过滤,将可显示的结果信息返回
给CGI程序。CGI程序由服务器给出的结果总数和起始显示项号生成换页链接。在北大“
天网”FTP搜索引擎里,我们采用了一种智能的换页方案:将当前的起始显示项号对应
的链接放在链接表的中间,以最大显示项数为间距生成有限个向后和向前的链接。这样
用户可以保持鼠标不动的情况下,以相同的间距向前或向后翻页。如图6所示为最大显
示数为20时的一种情况:



 0  20   50   70   90   110  130  150  170  190  210  230  250  270  290  310

50  70   90   110  130  150  170  190  210  230  250  270  290  310  330  350

90  110  130  150  170  190  210  230  250  270  290  310  330  350  370  390

                                                       ▲鼠标不动,每次跳过40个

                        图【6】一种智能的换页方案


iii.    使用结果页面模板

    为了使ftp搜索得界面更为灵活,将算法和界面分离的模板技术是十分方便有用的
。模板技术的使用,使得多语言版本实现成为可能,也为以后可能的应用服务提供基础
。目前的模板里采用Html语法里的特定标注作为模板插入点。这些特定标注是:

<!--next-->             结果中再搜索表单
<!--match-->            匹配串
<!--time-->             搜索消耗的时间
<!--num-->              搜索的结果总数
<!--first-->            起始显示的结果编号
<!--last-->             终止显示的结果编号
<!--index-->            所有结果的翻页索引
<!--list-->             结果显示区域

    在所有标注里,只有<!--list-->是在一个页面里只能使用一次的,其他标注可以
多次使用。而且各个标注的顺序是不定的,但要求标注必须占用一行的起始位置。当
CGI要显示结果的时候,它逐行读入模板文件,如果该行以特定标注开头,则用CGI里的
特定显示字串代替它,否则直接输出。


iv.     多语言版本的支持

    在结果页面使用模板技术后,ftp搜索引擎就可以提供多语言的版本了。一方面,
静态页面比如查询输入页面可以用手工的方法制作各个语言版本的页面,而结果页面,
制作特定语言的模板即可。但CGI也要做些改动,因为结果中再搜索表单和翻页索引里
有语言相关的字符。目前天网ftp搜索引擎提供简体中文和英文两个语言版本,并在
CGI里已经实现里繁体中文的支持,但没有提供给用户使用。


v.      漂亮、实用的结果输出页面

如图7:








                        图【7】 天网ftp搜索结果页面示意图


vi.     为支持分布搜索的改进

1.      使用多服务器的可能性和必要性

    当搜索引擎搜集的站点数目越来越大,数据量也同步很大时,单部PC机完成所有的
搜集建库工作就显得比较艰辛。一方面内存成为瓶颈,因为按目前的情况,一千万的文
件条目需要700M的内存,由于搜索引擎的搜集范围的扩大,所需内存马上就会超过数千
兆,这是普通服务器所难于承受的。另一方面,站点数目的增多使得重新刷新一次数据
库所需的时间增大,如果都放在一台服务器上周期太长,不能更快的体现ftp站点的变
化。所以使用多个服务器进行分布搜集数据和分布搜索是未来发展得方向。

2.      分布搜索的实现

    最新的天网ftp搜索引擎支持了分布搜集和分布搜索,这为系统的未来扩展垫下基
础。在ftp搜索引擎原有结构上实现多服务器的分布数据搜集和分布搜索并不难,因为
在系统的Server/Client结构为系统的分布提供基础。将多个独立的Server分别搜集不
同网段的ftp站点并为这些站点数据的搜索提供搜索服务,令Client分别连接到各个服
务器,将各个服务器得搜索结果合并后输出给用户。这样,我们并没有改动服务器端的
任何代码,在服务器的所作改动就是限制其站点列表数据库,使得各个服务器的站点列
表数据库没有交集。而在CGI客户端,通过系统配置可以知道各个服务器的地址,CGI将
搜索请求发给各个服务器,计算总得结果数,并确定可以显示得结果范围,最后输出给
用户。

3.      对分布搜索的加速

    在未知搜索结果总数的时候,CGI必须把每个搜索请求发给各个服务器,实际上当
前显示页面后面的结果是不需要查询的,查询的目标也仅仅是为了得到结果总数。因而
,如果在第一次查询得到结果总数后,我们把结果总数放在后续翻页的CGI参数里,这
样,后续的翻页动作时已知了结果总数,我们按续请求部分服务器,在当前显示页面的
结果得到后就不必再请求其他服务器,这样就加速了翻页的过程。

--

※ 来源:.天网搜索论坛 http://binglebbs.dhs.org[FROM: 162.105.80.74]

--

      WELCOME TO PC's Home  HTTP://192.168.48.84

※ 修改:·PhilCF 於 Jun 25 19:17:19 修改本文·[FROM: 192.168.48.84]
※ 来源:·荔园晨风BBS站 bbs.szu.edu.cn·[FROM: 192.168.48.84]


[回到开始] [上一篇][下一篇]

荔园在线首页 友情链接:深圳大学 深大招生 荔园晨风BBS S-Term软件 网络书店