互联网内容控制系统数据库表结构设计说明书.docx
《互联网内容控制系统数据库表结构设计说明书.docx》由会员分享,可在线阅读,更多相关《互联网内容控制系统数据库表结构设计说明书.docx(168页珍藏版)》请在冰豆网上搜索。
互联网内容控制系统数据库表结构设计说明书
互联网容控制系统数据库表结构设计说明书
1.数据库表结构
1.1.地址库管理子系统数据库表结构
1.1.1.操作员信息表
系统的部用户分为两类:
◆超级用户(UserRight=2):
系统初始化时生成超级用户,用户名/密码(root/root),超级用户可增、删、改和查询管理员、操作员的信息。
◆管理员(UserRight=1):
完成端口管理、关键字管理、安全模板管理、对操作员已确认地址进行核查,不能维护管理员和操作员的资料。
◆操作员(UserRight=0):
对黑/白地址和广告过滤库地址进行录入、确认、分类、修改等操作。
createtableics_admin
(
UserIdnumber(10)notnull,/*操作员编号,seq_userid.nextval*/
UserNamevarchar2(30)notnull,/*登录名*/
FullNamevarchar2(40)default'',/**/
UserDescvarchar2(200)default'',/*用户描述*/
UserRightnumber(5)notnull,/*用户权限0-操作员1-管理员2-ROOT*/
Passwordvarchar2(64)notnull,/*加密后的密码*/
UserStatusintnotnull,/*状态0-正常1-暂停2-注销*/
Emailvarchar2(80)notnull,/*EMAIL地址*/
ContactNumvarchar2(20)notnull,/*联系*/
Departmentvarchar2(40)notnull,/*部门*/
AreaCodevarchar2(32)notnull,/*归属地区*/
CreateOperatornumber(10)notnull,/*开户操作员号*/
CreateTimedatenotnull,/*创建日期*/
ModifyOperatornumber(10)default0,/*开户操作员号*/
ModifyTimedatedefaultsysdate,/*修改日期*/
BatchMaxNumnumber(5)default0/*一次批量确认地址的最大数量*/
);
索引:
对UserName唯一索引
对UserId唯一索引
1.1.2.搜索关键字定义表
◆搜索引擎根据该表配置的数据作为关键字在常用的搜索引擎门户(如google,baidu等)中进行深度和广度搜索,搜索得到的地址存入库ics_original等待操作员进行确认。
◆该表数据由WEB管理工具进行维护(增、删、改、查询)。
createtableics_keyinfo
(
SubClassIdnumber(10)notnull,/*地址3级分类,url_class定义*/
KeyNamevarchar2(40)notnull,/*关键字*/
KeyFlagnumber(5)default0,/*0-正常1-无效*/
DealCountnumber(5)notnull,/*处理次数*/
CreateOperatornumber(10)notnull,/*开户操作员号*/
CreateTimedatenotnull,/*创建日期*/
ModifyOperatornumber(10)default0,/*开户操作员号*/
ModifyTimedatedefaultsysdate,/*修改日期*/
SubClassId2number(10)default0,/*地址分类,2级*/
Prioritynumber(5)default0/*搜索优先级,0最低*/
);
索引:
对subClassId+KeyName唯一索引
1.1.3.自动确认关键字定义表
◆搜索引擎根据该表配置数据对搜索到的地址进行自动确认,搜索得到的地址数据不存入表ics_original而直接放入地址库表url_templet。
自动确认的判断条件为URL域名中包含所配置的关键字,有如下两种匹配方式:
●全匹配:
如配置为org,则.abc.org匹配成功,.abcorg.匹配不成功。
●部分匹配:
只要域名中包含所配置关键字则认为匹配成功。
◆自动匹配的地址需要根据域名得到域名对应的IP地址写入表hostname_info和ip_info,并在操作记录表urlinfo_operate、hostinfo_operate中记录更新信息,用于进行数据同步。
◆该表数据由WEB管理工具进行维护(增、删、改、查询)。
createtableics_keyinfo_confirm
(
SubClassIdnumber(10)notnull,/*地址分类,3级*/
KeyNamevarchar2(40)notnull,/*关键字*/
KeyFlagnumber(5)notnull,/*0-正常1-无效*/
ConfirmMatchnumber(5)notnull,/*0-全匹配,1-部分匹配*/
CreateOperatornumber(10)notnull,/*开户操作员号*/
CreateTimedatenotnull,/*创建日期*/
ModifyOperatornumber(10)default0,/*开户操作员号*/
ModifyTimedatedefaultsysdate,/*修改日期*/
SubClassId2number(10)default0/*地址分类,2级*/
);
索引:
对SubClassId+KeyName唯一索引
1.1.4.搜索模板表
createtableics_search_templet
(
HostName varchar2(80)notnull, /*域名 */
UrlPath varchar2(80)notnull, /*路径(不包括域名)*/
DealCount number(5) default0, /*处理次数 */
SubClassId number(10)notnull, /*地址分类,3级*/
Depth number(5) notnull, /*搜索深度 */
CreateOperator number(10)notnull, /*开户操作员号 */
CreateTime datenotnull, /*创建日期 */
ModifyOperator number(10)default0, /*开户操作员号 */
ModifyTime datedefaultsysdate, /*修改日期 */
Prioritynumber(5)default0,/*搜索优先级,0最低*/
SubClassId2number(10)default0/*地址分类,2级*/
)
索引:
对HostName+UrlPath唯一索引
对DealCount索引
1.1.5.黑原始地址信息表
搜索引擎以关键字搜索和URL深度搜索方式得到的未确认URL地址存入该表,操作员通过管理工具从该表获取数据进行确认和核查操作,确认后修改DealResult字段标志值,不从该表删除已确认的记录。
该表中的地址数据同时作为搜索引擎进行下一次搜索的起点地址。
createtableics_original
(
SubClassIdnumber(10)notnull,/*黑地址分类,3级*/
Depthnumber(5)notnull,/*搜索深度*/
DealFlagnumber(5)notnull,/*处理标志0-未处理1-已处理*/
ReadFlagnumber(5)notnull,
/*确认标志0-未确认1-手工确认2-自动确认*/
DealResultnumber(10)notnull,/*处理结果*/
/*0-未确认1-确认成功2-无法访问3-修改分类
4-地址无效5-黑重复分类*/
HostNamevarchar2(80)notnull,/*域名*/
UrlPathvarchar2(80)notnull,/*路径(不包括域名)*/
Title varchar2(40) , /*标题 */
TitleCount number(5) notnull, /*标题处理次数 */
CreateOperatornumber(10)null,/*开户操作员号*/
CreateTimedatenotnull,/*创建日期*/
ModifyOperatornumber(10)default0,/*修改操作员号*/
ModifyTimedatedefaultsysdate,/*修改日期*/
Prioritynumber(5)default0,/*搜索优先级,0最低*/
SubClassId2number(10),/*黑地址分类,2级*/
StpHostNamevarchar2(40)null/*搜索种子域名*/
)
索引:
对HostName唯一索引
对DealFlag+DealResult索引
对Priority索引
1.1.6.白原始地址库
createtableics_woriginal
(
SubClassIdnumber(10)notnull,/*白地址分类,3级*/
Depthnumber(5)notnull,/*搜索深度*/
DealFlagnumber(5)notnull,/*处理标志0-未处理1-已处理*/
ReadFlagnumber(5)notnull,
/*确认标志0-未确认1-手工确认2-自动确认*/
DealResultnumber(10)notnull,/*处理结果*/
/*0-未确认1-确认成功2-无法访问3-修改分类
4-地址无效5-重复分类*/
HostNamevarchar2(80)notnull,/*域名*/
UrlPathvarchar2(80)notnull,/*路径(不包括域名)*/
Title varchar2(40) , /*标题 */
TitleCount number(5) notnull, /*标题处理次数 */
CreateOperatornumber(10)null,/*开户操作员号*/
CreateTimedatenotnull,/*创建日期*/
ModifyOperatornumber(10)default0,/*开户操作员号*/
ModifyTimedatedefaultsysdate,/*修改日期*/
Prioritynumber(5)default0,/*搜索优先级,0最低*/
SubClassId2number(10),/*白地址分类,2级*/
StpHostNamevarchar2(40)null/*搜索种子域名*/
)
索引:
对SubClassId2+HostName唯一索引
对SubClassId+HostName索引
对DealFlag+DealResult索引
对Priority索引
1.1.7.搜索引擎地址信息表
该表存放一些知名的站点地址,如常用的搜索引擎(goole、、baidu、sina、sohu等),该表中的地址记录可作为关键字搜索的标准地址。
createtableics_white
(
HostNamevarchar2(80)notnull,/*域名*/
UrlPathvarchar2(80)notnull,/*路径*/
CreateOperatornumber(10),/*开户操作员号*/
CreateTimedate/*创建日期*/
)
索引:
对HostName+UrlPath唯一索引
1.1.8.确认地址信息表
◆操作员通过地址管理工具从原始地址数据表ics_original对搜索得到的地址进行确认,确认后的地址记录存入该表。
◆该表数据有增加或删除操作时,需要在表url_operate中插入一条记录,用于地址同步程序讲数据更新记录同步给节点策略服务器。
createtableurl_templet
(
SubClassIdnumber(10)notnull,/*地址三级分类,url_class定义*/
HostNamevarchar2(80)notnull,/*域名*/
UrlPathvarchar2(80)notnull,/*URL路径*/
Protocolvarchar2(40)notnull,/*协议类型如:
http,ftp*/
Validflagnumber(5)notnull,/*有效标志*/
/*
0-有效:
确认后的有效地址,未核查
1-已核查(checkflag=1,2,9)
2-已删除(checkflag=2)
3-返回确认(checkflag=3);
*/
Remarkvarchar2(40)null,/*备注*/
CreateOperatornumber(10)notnull,/*添加记录操作员号*/
CreateTimedatenotnull,/*创建日期*/
ModifyOperatornumber(10)default0,/*修改记录操作员号*/
ModifyTimedatedefaultsysdate,/*修改日期*/
Title varchar2(40), /*标题 */
CheckFlagnumber(5)default0,/*核查:
0-未核查>0表已核查*/
/*0-未核查1-修改分类2-删除3-重新确认9-核查无误*/
CheckOperatornumber(10)default0,/*核查操作员编号*/
CheckTimedatenull/*核查日期*/
)
索引:
对SubClassId+HostName+UrlPath+Protocol唯一索引
对HostName索引
1.1.9.过滤地址表
createtableurl_filtered
(
SubClassIdnumber(10)notnull,/*地址二级分类,url_class定义*/
HostNamevarchar2(80)notnull,/*域名*/
UrlPathvarchar2(80)null,/*URL路径*/
Validflagnumber(5)default0,
/*0-未核查 1-修改分类 2-删除 3-重新确认9-核查无误*/
CreateTimedatedefaultsysdate,/*创建日期*/
ModifyOperatornumber(10)default0,/*修改记录操作员号*/
ModifyTimedatedefaultsysdate/*修改日期*/
)
索引:
对SubClassId+HostName唯一索引
1.1.10.数据字典表
存放系统使用的数据字典信息,该表数据数据一般较固定,一般在系统初始化时一次性生成所需数据,暂不在界面上提供数据更新功能。
createtabledata_dict_info
(
DictTypenumber(10)notnull,/*数据字典的类型*/
/*1=url关键字的分类方式
2=服务(端口和ip)的类型(1级)
3=URL地址的分类(1级)
5=服务(端口和ip)的类型(2级)
9=需要同步给FS的文件分类
100=省份代码
101=城市代码
102=开户地区代码
105=客户行业(从事行业)
106=客户职业(职业类别)
107=国家代码
108=知名服务提供商列表
201=小孩的爱好
202=用户的爱好
400=广告分类
*/
SubClassIdnumber(10)notnull,/*代码*/
DataNamevarchar2(40)notnull,/*数据的名称*/
ClassIdnumber(10)default0,/*相关联的父级代码*/
Paramvarchar2(20)null,/*对于开户地区,表示地区代码*/
Remarkvarchar2(40)null,/*备注*/
DataFlagnumber(10)notnull,/*标志:
0-全网数据1-本地数据*/
CreateOperatornumber(10)notnull,/*开户操作员号*/
CreateTimedatenotnull,/*创建日期*/
ModifyOperatornumber(10)default0,/*开户操作员号*/
ModifyTimedatedefaultsysdate/*修改日期*/
);
索引:
对DictType+SubClassId唯一索引
1.1.11.地址分类表
存放URL地址的二级和三级分类,地址的一级分类存放在数据字典表。
◆一个二级地址的分类可归为白或黑,也可既属于黑又属于白(ClassFlag=2)。
◆根据不同的分类标准和搜索算法,一个具体的URL地址也可能同属于多个地址分类。
◆对于一个特定的用户来说,可自由指定一种地址分类对该用户本身是黑(阻断)还是白(放行)方式。
createtableurl_class
(
SubClassIdnumber(10)notnull,/*地址二级或三级子类id*/
DictTypenumber(10)notnull,/*2:
二级分类3:
三级分类*/
GroupIdnumber(10)notnull,/*父类分级编号*/
ClassNamevarchar2(40)notnull,/*子类名称*/
Remarkvarchar2(512)notnull,/*说明*/
ClassFlagnumber(5)notnull,/*标志:
0-黑1-白2-ALL*/
CreateOperatornumber(10)notnull,/*开户操作员号*/
CreateTimedatenotnull,/*创建日期*/
ModifyOperatornumber(10)default0,/*开户操作员号*/
ModifyTimedate/*修改日期*/
);
索引:
对SubClassId唯一索引
对DictType+GroupId索引
1.1.12.安全级别定义表
createtablesecurity_class
(
SecurityClassIdnumber(10)notnull,/*安全级别*/
SecurityFlag number(5)notnull, /*服务标志:
0-绿色上网业务 1-互联特区业务 */
ClassNamevarchar2(80)notnull,/*级别名称*/
Remarkvarchar2(512)notnull,/*安全级别描述*/
DataFlagnumber(5)notnull,/*标志:
0-全网数据1-本地数据*/
Statusnumber(5)notnull,/*标志0-正常1-无效*/
CreateOperatornumber(10)notnull,/*开户操作员号*/
CreateTimedaten