荔园在线

荔园之美,在春之萌芽,在夏之绽放,在秋之收获,在冬之沉淀

[回到开始] [上一篇][下一篇]


发信人: PhilCF (起床.挂站.TSG.下站.睡觉), 信区: NetResource
标  题: 毕业论文四、a系统的结构设计[ZZ]
发信站: 荔园晨风BBS站 (Tue Jun 25 19:11:09 2002), 转信

发信人: chenhua (陈华), 信区: FtpSearch
标  题: 毕业论文四、a系统的结构设计
发信站: 天网搜索论坛 (Wed May 29 22:31:47 2002)

四、    海量ftp搜索引擎的系统结构设计

a)      系统的结构设计:四大模块和五个数据库

    参考WWW搜索引擎的一般系统结构,我们设计了如下的四个模块:搜集建库模块、
搜索服务模块、CGI和WWW页面模块以及快捷方式系统。其中使用了五个数据库包括:站
点列表数据库、文件类型数据库、素材库、索引库、快捷方式数据库。
    系统程序和数据的物理位置分配主要分七个部分:

1)     respath:源数据目录。
    包括搜集建库的程序FtpCollect,站点列表库,文件类型库和素材库。同时也存放
搜集程序的日志。

2)     basepath:主目录。
    包括搜索服务器FtpServer,索引库。其中索引库由三个子库组成,它们是:用于
显示的Display库、用户过滤的Content库和用户匹配字串的Index库。同时也存放建库
程序的日志,搜索服务器的日志,页面下载的日志。

3)     manage:管理程序目录。
    包括快捷方式管理系统,站点列表获得程序FtpGetSite,IP站点列表和域名站点列
表合并程序CheckSite、搜索服务器状态监控程序ServerKeeper等等。其中快捷方式系
统包括用户注册项过滤器ItemFilter和快捷方式条目管理ItemManage。

4)     scripts:CGI目录。
    包括提供服务用的CGI和快捷方式系统中的注册CGI Submit.exe、条目显示CGI
TxtSearch.exe,条目点击计数CGI FtpCount.exe等等。

5)     wwwpath:WWW页面目录。
    包括主页面(中英文),搜索结果页面模板(中英文),复杂搜索页面模板(中英
文),文件分类标志图片等等。

6)     cachepath:搜索结果存放的缓冲目录。

7)     SQL数据库系统。
    目前使用的是MS SQL Server 7.0系统。用于存放快捷方式系统里的数据。


--

※ 来源:.天网搜索论坛 http://binglebbs.dhs.org[FROM: 162.105.80.74]

--

      WELCOME TO PC's Home  HTTP://192.168.48.84

※ 来源:·荔园晨风BBS站 bbs.szu.edu.cn·[FROM: 192.168.48.84]


[回到开始] [上一篇][下一篇]

荔园在线首页 友情链接:深圳大学 深大招生 荔园晨风BBS S-Term软件 网络书店