荔园在线
荔园之美,在春之萌芽,在夏之绽放,在秋之收获,在冬之沉淀
[回到开始]
[上一篇][下一篇]
发信人: PhilCF (起床.挂站.TSG.下站.睡觉), 信区: NetResource
标 题: 毕业论文四、a系统的结构设计[ZZ]
发信站: 荔园晨风BBS站 (Tue Jun 25 19:11:09 2002), 转信
发信人: chenhua (陈华), 信区: FtpSearch
标 题: 毕业论文四、a系统的结构设计
发信站: 天网搜索论坛 (Wed May 29 22:31:47 2002)
四、 海量ftp搜索引擎的系统结构设计
a) 系统的结构设计:四大模块和五个数据库
参考WWW搜索引擎的一般系统结构,我们设计了如下的四个模块:搜集建库模块、
搜索服务模块、CGI和WWW页面模块以及快捷方式系统。其中使用了五个数据库包括:站
点列表数据库、文件类型数据库、素材库、索引库、快捷方式数据库。
系统程序和数据的物理位置分配主要分七个部分:
1) respath:源数据目录。
包括搜集建库的程序FtpCollect,站点列表库,文件类型库和素材库。同时也存放
搜集程序的日志。
2) basepath:主目录。
包括搜索服务器FtpServer,索引库。其中索引库由三个子库组成,它们是:用于
显示的Display库、用户过滤的Content库和用户匹配字串的Index库。同时也存放建库
程序的日志,搜索服务器的日志,页面下载的日志。
3) manage:管理程序目录。
包括快捷方式管理系统,站点列表获得程序FtpGetSite,IP站点列表和域名站点列
表合并程序CheckSite、搜索服务器状态监控程序ServerKeeper等等。其中快捷方式系
统包括用户注册项过滤器ItemFilter和快捷方式条目管理ItemManage。
4) scripts:CGI目录。
包括提供服务用的CGI和快捷方式系统中的注册CGI Submit.exe、条目显示CGI
TxtSearch.exe,条目点击计数CGI FtpCount.exe等等。
5) wwwpath:WWW页面目录。
包括主页面(中英文),搜索结果页面模板(中英文),复杂搜索页面模板(中英
文),文件分类标志图片等等。
6) cachepath:搜索结果存放的缓冲目录。
7) SQL数据库系统。
目前使用的是MS SQL Server 7.0系统。用于存放快捷方式系统里的数据。
--
※ 来源:.天网搜索论坛 http://binglebbs.dhs.org[FROM: 162.105.80.74]
--
WELCOME TO PC's Home HTTP://192.168.48.84
※ 来源:·荔园晨风BBS站 bbs.szu.edu.cn·[FROM: 192.168.48.84]
[回到开始]
[上一篇][下一篇]
荔园在线首页 友情链接:深圳大学 深大招生 荔园晨风BBS S-Term软件 网络书店