人口普查民族校对工具用户手册.docx
《人口普查民族校对工具用户手册.docx》由会员分享,可在线阅读,更多相关《人口普查民族校对工具用户手册.docx(47页珍藏版)》请在冰豆网上搜索。
人口普查民族校对工具用户手册
第六次全国人口普查
民族校对工具用户手册
目录
第一章第六次全国人口普查民族校对工具简介1
1.1概述1
1.2程序功能说明1
1.3系统业务流程图2
第二章民族校对工具安装3
2.1服务器端安装3
2.2客户端安装3
2.3Oracle客户端组件安装4
第三章民族校对工具服务器端使用说明15
3.1服务器端初始化15
3.2设置共享文件夹15
第四章民族校对工具客户端使用说明17
4.1客户端访问服务器共享文件夹17
4.2识别程序18
4.3校对程序21
4.3.1数据库连接设置21
4.3.2进行三次校对22
4.3.3进行一次校对26
4.4校对结果的比对分析27
4.4.1查看置信度阈值识别率关系表27
4.4.2产生基础值与光电结果比较矩阵(数量)30
4.4.3产生基础值与光电结果比较矩阵(比率)31
4.4.4产生基础值与光电结果比较反向矩阵(比率)33
4.4.5产生基础值与光电结果不同资料表35
4.4.6查看各民族统计结果37
4.4.7工作流状态查看39
附录A:
快捷键说明41
第一章第六次全国人口普查民族校对工具简介
1.1概述
民族校对工具是对于人普手写民族汉字的识别、校对的评估工具,此工具包括三个主要模块:
识别模块、校对模块和数据比对模块。
本软件在光电数据软件上实现识别、校对、数据比对。
通过输出各种统计分析表,可以查看识别率阈值分布情况、各民族的识别率、校对率分布情况,以及民族与民族之间误识的情况。
该软件可以将利用本工具校对后的民族(基础值)与光电校验后的民族进行比较,并将不一致的民族信息保存下来,以供用户进行相应处理。
1.2程序功能说明
Ø识别模块:
识别模块对人普光电录入系统中的普查表图像中手写民族内容进行识别,提供了批量识别的功能。
Ø校对模块:
根据预先设置的置信度阈值,系统采用人工方式对低于置信度阈值的可疑结果进行校对,发现错误识别结果则手工纠正。
提供三次校对和单次校对的方式。
校对模块提供了对置信度阈值、识别率、校对率之间的关系进行分析的功能。
Ø数据比对模块:
数据比对模块包括人普数据库光电结果数据导入功能和校对结果与人普光电结果数据库比对功能。
比对功能将根据对应关系进行两数据库的比对和结果输出,需要输出不同民族间的识别率分布矩阵。
1.3系统业务流程图
第二章民族校对工具安装
2.1服务器端安装
双击安装包内的“民族校对工具服务器初始化工具.exe”,
点击【安装】按钮,安装民族校对工具的服务器端程序。
安装完成后,自动退出安装界面,同时在桌面创建
图标,用于启动初始化工具。
2.2客户端安装
客户端必须已经安装了“光电录入系统软件”客户端,才允许安装“民族校对工具”。
双击安装包内的“民族校对工具.exe”运行,运行客户端程序安装界面,如下图所示:
图21客户端软件安装界面
点击【安装】按钮,安装民族校对工具的客户端程序。
安装完成后,自动退出安装界面,同时在桌面创建
图标,用于启动识别和校对程序。
2.3Oracle客户端组件安装
在需要启动识别程序的客户端,需要安装“Oracle客户端组件”。
双击Oracle客户端组件安装包内的“oui.exe”,运行Oracle客户端组件安装界面,如下图所示:
图2.31Oracle客户端组件安装欢迎界面
点击【下一步】按钮,进入“选择要安装的产品”界面,如下图所示:
图2.32选择要安装的产品
点击【下一步】按钮,进入选择“安装位置”界面,如下图所示:
图2.33选择安装位置
点击【下一步】按钮,进入选择“可用产品组件”界面,如下图所示:
图2.34可用产品组件
点击【下一步】按钮,进入“OracleProviderforASP.NET”界面,如下图所示:
图2.35OracleProviderforASP.NET界面
点击【下一步】按钮,进入“OracleDeveloperToolsforVisalStudio.NET”界面,如下图所示:
图2.36OracleDeveloperToolsforVisalStudio.NET界面
点击【下一步】按钮,进入“OracleServiceforMicrosoftTransactionServer”界面,如下图所示:
图2.37OracleServiceforMicrosoftTransactionServer界面
点击【下一步】按钮,进入组件安装“概要”界面,如下图所示:
图2.38组件安装概要界面
点击【安装】按钮,进入“安装”界面,如下图所示:
图2.39安装过程界面
安装过程结束,弹出安装已成功界面,如下图所示:
图2.310安装结束界面
点击【退出】按钮,将弹出退出确认界面,如下图所示:
图2.311确认退出提示
点击【是】按钮,退出安装界面,完成Oracle客户端组件安装。
第三章民族校对工具服务器端使用说明
3.1服务器端初始化
双击服务器端桌面的
图标,运行初始化程序,该初始化程序完成对服务器端民族校对工具所对应数据库的创建和初始化工作。
程序运行界面,如下图所示:
图3.11民族校对工具数据库创建和初始化界面
点击【初始化】按钮,完成创建和初始化数据库的操作,初始化工作完成以后,弹出初始化成功提示。
点击【退出】按钮,退出初始化界面。
3.2设置共享文件夹
由于客户端识别的需要,所以要将“D:
/renpugd”文件夹设置为完全共享。
设置方法:
右键选择“D:
/renpugd”文件夹,在弹出菜单中选择“属性”,弹出属性界面,如下图所示:
3.21属性设置界面
选择“共享此文件夹”,点击【权限】按钮,弹出权限设置界面,如下图所示:
3.22权限设置界面
在“Administrator的权限(P)”中的“完全控制、更改、读写”都设置为“允许状态。
点击【确定】按钮,返回属性设置界面。
在属性设置界面,点击【确定】按钮,完成文件夹的共享设置。
第四章民族校对工具客户端使用说明
客户端包括识别程序和校对程序,这两个程序可以在同一台机器上同时运行,并且同一台机器上要求只启动一个识别或校对程序。
民族校对工具支持多台客户端同时进行识别和校对。
4.1客户端访问服务器共享文件夹
首先需要手动访问光电服务器保存光电图像的文件夹,此文件夹名为“renpugd”,如下图所示:
4.11访问光电服务器的图像文件夹
点击【确定】按钮,即可打开相应的文件夹。
打开后,就完成了对共享文件夹的访问,然
后,关闭此共享文件夹。
注:
客户端访问过一次共享文件夹后,以后就不需要再次访问。
4.2识别程序
双击客户端桌面
图标,运行识别程序,界面如下图所示:
图4.21识别程序界面
文字和按钮介绍:
Ø
进行光电录入的服务器IP地址;
Ø
选择需要进行识别的图像文件的范围;
Ø
针对以上参数进行测试:
是否能正常连接到数据库;
Ø
对光电服务器上的图像进行识别;
Ø
退出识别程序。
操作步骤:
1)在识别界面输入光电服务器IP地址,输入完成后,点击【测试连接】按钮,如果参数输入错误,测试不通过,系统会弹出对应的提示框,如下图所示:
图4.22连接失败提示
点击【确定】按钮,重新修改。
2)如果测试通过,系统会弹出“连接成功”提示,如下图所示:
图4.23连接成功提示
点击【确定】按钮,退出提示框;
3)如果不需要识别,点击【退出程序】或者
按钮,可以退出识别程序。
4)在识别界面,点击【请选择需要识别的地址】按钮,进入选择需要识别的地址范围界面,如下图所示:
图4.24选择需要识别的地址范围界面
选择需要识别的地址范围,可以选择地市级、县级或乡镇级,也可以只识别具体的普查区或普查小区。
选择需要识别的地址区域,点击【确定】按钮,返回识别界面。
5)在识别界面,点击【开始识别】按钮,开始对选中地址区域内的光电图像进行识别,识别完成后弹出提示,如下图所示:
图4.25识别完成
点击【确定】按钮,退出提示框,同时退出识别程序。
注:
1、对于已经识别过的普查小区,识别程序不会再次对它进行识别,而是直接弹出提示信息“识别已经完成”。
2、如果识别程序中断,必须在本机重新启动识别程序,才能识别中断识别的那个普查小区。
4.3校对程序
4.3.1数据库连接设置
双击客户端桌面
图标,运行校对程序,首先弹出数据库连接界面,如下图所示:
图4.31数据库连接设置界面
文字和按钮介绍:
Ø
需要进行民族汉字校对的服务器IP地址;
Ø
针对输入的IP地址进行测试,确定是否能正常连接到数据库;
Ø
进入民族校对工具程序界面;
Ø
取消连接相应的服务器,退出民族校对程序。
输入服务器IP地址,输入完成后,点击【测试】按钮。
如果IP地址输入不正确,测试不通过,弹出提示,如下图所示:
图4.32连接失败提示
如果IP地址输入正确,测试通过,弹出连接成功提示。
点击【开始】按钮,进入“民族校对工具”程序界面,如下图所示:
图4.33民族校对工具程序界面
注:
建议采用“进行一次校对”进行数据校对。
4.3.2进行三次校对
为保证基础值的准确性,可以对重新识别的结果进行三次校对。
三次校对的置信度阈值默认设置分别为60、30、100,也可以对三次校对的置信度阈值进行手动设置。
第三次校对针对前两次校对的差异部分进行再次100%校对,只有在前两次校对完成后,才能进行第三次校对。
民族汉字的校对采用批量校对方式。
操作步骤:
1)在“校对形式”处,选择“进行三次校对”,默认为“进行三次校对”中的“第一次校对”,如下图所示:
图4.34选择三次校对
2)选择“功能—>校对置信度阈值设置…”菜单,如下图所示:
图4.35选择“校对置信度阈值设”
3)弹出“设置校对置信度阈值”的界面,如下图所示:
图4.36校对置信度设置界面
默认“置信度阈值”为60。
如果需要使用其他值,重新输入,点击【确定】按钮,完成设置。
4)在“民族校对工具”界面,右侧“选择小区”中选择需要校对的小区,点击【校对】按钮,或者点击键盘【Alt+V】键,也可以直接双击需要校对的小区,进入校对界面,如下图所示:
图4.37民族汉字校对界面
左侧区域“识别结果”列表,第一列为民族内码,第二列民族名称,第三列为需要校对的民族汉字总个数。
中间区域“切图与识别结果”为批量校对区域,列出民族切图,切图下方是识别结果。
右侧区域“民族修改选项”为民族内码和民族名称列表,要修改识别结果时,可以选择对应的民族。
5)对于有错误的识别结果,先选中识别错误的切图或识别结果,在右侧选中正确的民族,即完成修改。
6)如果有多个识别错误的结果,并且都应改为相同的另一个民族,可以通过按住【Ctrl】键,用鼠标点选这些错误的切图或识别结果,即可选中多个错误切图。
在右侧选中正确的民族进行修改。
7)点击左侧某个民族汉字,在中间位置显示该民族的所有切图,切图数量超过1页时,可以通过【上一页】、【下一页】翻页来查看校对,也可以通过点击键盘【Alt+N】键向下翻页,点击键盘【Alt+P】键,向上翻页。
多页切图如果没有全部校对完成,不允许进入下一个民族的校对。
8)如果某一个民族有多页识别结果需要校对,通过鼠标框选可以全部选择该页所有民族,将该页民族修改为另一个民族。
9)如果切图看不清楚,可以双击切图浏览原图查看,通过查看原图或预填区域信息,来确定识别结果的正确性。
10)如果左侧列表有多个民族需要校对,可以通过点击键盘【Alt+L】键,选择下一个要校对的民族,也可以通过点击键盘【Alt+K】键,选择上一个要校对的民族。
11)左侧列表中的所有民族都校对完成后,点击【确定】按钮,完成校对,弹出是否保存校对结果的提示,如下图所示:
图4.38提示是否保存校对结果
12)如果点击【是】按钮,保存校对结果,退出校对界面,返回到“民族校对工具”界面。
如果点击【否】按钮,返回校对界面,继续进行校对。
13)返回到“民族校对工具”界面,刚刚校对完成的小区将在地址码树中自动删除,避免重复校对。
选择其他小区继续进行校对,所有的小区都校对完成,第一次校对完成。
14)选择第二次校对,需要对所有第一次校对的小区进行校对。
校对过程与第一次校对完全相同。
15)选择第三次校对,此次校对针对第一次和第二次校对有差异部分进行校对,校对过程与第一次校对完全相同。
4.3.3进行一次校对
操作步骤:
1)选择进行一次校对,选择“功能—>校对置信度阈值设置…”菜单,如下图所示:
图4.39选择“校对置信度阈值设”
2)弹出“设置校对置信度阈值”的界面,如下图所示:
图4.310校对置信度设置界面
默认的“置信度阈值”为50。
如果需要使用其他值,重新输入,点击【确定】按钮,完成设置。
软件会将置信度小于设定值的民族汉字提出校对,形成用于比对的基础值。
3)进行一次校对方法与进行三次校对的校对方法相同。
将所有的小区校对完成形成基础值。
注:
如果民族校对工具异常退出,必须在本机重新启动民族校对工具,才能继续校对中断的那个普查小区。
4.4校对结果的比对分析
4.4.1查看置信度阈值识别率关系表
点击“功能—>查看置信度阈值识别率关系表”菜单,如下图所示:
图4.41查看置信度阈值识别率关系表菜单选择
弹出“查看置信度阈值识别率关系表”界面,界面如下图所示:
图4.42查看置信度阈值识别率关系表界面
说明:
1、置信度:
对于普查表中的每个数据项,系统都会计算出一个值,用这个值衡量系统对于它的识别的可靠程度,这个值就是置信度。
当置信度为0的时候,表示系统认为识别结果完全错误。
当置信度为100的时候,表示系统认为识别结果完全正确;
2、置信度阈值:
阈值用来判断识别结果是“可疑”或“拒识”的一个参数。
当置信度大于或等于置信度阈值时,识别结果不需要进行人工校对;当置信度小于置信度阈值时,代表这个识别结果比较可疑,需要人工进行校对;
3、识别率:
非校对项中识别正确数/总识别项数;
4、校对率:
校对项数目/总识别项数。
4.4.2产生基础值与光电结果比较矩阵(数量)
点击“功能—>产生基础值与光电结果比较矩阵(数量)”菜单,如下图所示:
图4.43产生基础值与光电结果比较矩阵(数量)菜单选择
弹出对应矩阵结果保存窗口,如下图所示:
图4.44数量矩阵保存窗口
在“另存为”窗口,选择文件保存位置,输入要保存的数量矩阵名称,点击保存按钮。
弹出“产生基础值与光电结果比较矩阵(数量)”界面,该界面显示内容与保存的文件内容相同,界面如下图所示:
图4.45基础值与光电结果比较矩阵(数量)界面
界面说明:
1、使用民族校对工具对光电数据库中的民族汉字重新识别、校对获得基础值,对基础值进行统计获得基础值合计数。
基础值是指通过民族校对工具对民族进行校对后的值。
2、对光电数据库中民族汉字统计获得光电结果合计数;
3、民族校对工具校对结果与光电校对结果相同的数值;
4和5、民族校对工具中校对结果对应光电中校对结果的数值。
例如:
在上图中,“4”标注的数值为民族校对工具中“白”族在光电中被识别为“回”族的数量为1。
4.4.3产生基础值与光电结果比较矩阵(比率)
点击“功能—>产生基础值与光电结果比较矩阵(比率)”菜单,如下图所示:
图4.46产生基础值与光电结果比较矩阵(比率)菜单选择
弹出对应矩阵结果保存窗口,如下图所示:
图4.47比率矩阵保存窗口
在“另存为”窗口,选择文件保存位置,输入要保存的比率矩阵名称,点击保存按钮。
弹出“产生基础值与光电结果比较矩阵(比率)”界面,该界面显示内容与保存的文件内容相同,界面如下图所示:
图4.48基础值与光电结果比较矩阵(比率)界面
界面说明:
1、使用民族校对工具对光电数据库中的民族汉字重新识别、校对获得基础值,对基础值进行统计获得基础值合计数。
基础值是指通过民族校对工具对民族进行校对后的值。
2、对光电数据库中民族汉字统计获得合计数;
3、民族校对工具校对结果与光电校对结果相同的数值与基础值的比率;
4和5、民族校对工具中校对结果对应光电中校对结果的数值与基础值的比率。
例如:
在上图中,标注“4”的比率为民族校对工具中“白”族在光电中被识别为“回”族所占的比率。
即“产生基础值与光电结果比较矩阵(数量)”中的标注“4”所在位置数值“1”与白族的基础值“265”的比率即为1/265=0.3774%。
4.4.4产生基础值与光电结果比较反向矩阵(比率)
点击“功能—>产生基础值与光电结果比较反向矩阵(比率)”菜单,如下图所示:
图4.49产生基础值与光电结果比较反向矩阵(比率)菜单选择
弹出产生基础值与光电结果比较反向矩阵(比率)窗口,如下图所示:
图4.410比率反向矩阵保存窗口
在“另存为”窗口,选择文件保存位置,输入要保存的比率反向矩阵名称,点击保存按钮。
弹出“产生基础值与光电结果比较反向矩阵(比率)”界面,该界面显示内容与保存的文件内容相同,界面如下图所示:
图4.411基础值与光电结果比较反向矩阵(比率)界面
界面说明:
1、使用民族校对工具对光电数据库中的民族汉字重新识别、校对获得基础值,对基础值进行统计获得基础值合计数。
基础值是指通过民族校对工具对民族进行校对后的值。
2、对光电数据库中民族汉字统计获得合计数;
3、民族校对工具校对结果与光电校对结果相同的数值与光电结果的比率;
4和5、民族校对工具中校对结果对应光电中校对结果的数值与光电结果的比率。
例如:
在上图中,标注“4”的比率为在光电中识别为“回”族实际在民族校对工具中是“白”族的比率。
即“产生基础值与光电结果比较矩阵(数量)”中的标注“4”所在位置数量为“1”,该数值与光电结果中的回族个数“3703”的比率即为1/3703=0.0270%。
4.4.5产生基础值与光电结果不同资料表
点击“功能—>产生基础值与光电结果不同资料表”菜单,如下图所示:
图4.412产生基础值与光电结果不同资料表菜单选择
弹出产生基础值与光电结果不同资料表窗口,如下图所示:
图4.413产生基础值与光电结果不同资料表保存窗口
在“另存为”窗口,选择文件保存位置,输入要保存的产生基础值与光电结果不同资料表名称,点击保存按钮。
保存“产生基础值与光电结果不同资料表”,保存成功后弹出提示,如下图所示:
图4.414产生基础值与光电结果不同资料表保存成功提示
打开“产生基础值与光电结果不同资料表”,此表列出了使用民族校对工具对民族进行校对的结果与光电校对结果不一致的内容,如下图所示:
图4.415产生基础值与光电结果不同资料表显示内容
说明:
1、户内人编号:
本户内所有人的顺序编号,编号从“1”开始,本户有多少人,最大人编号就是多少;
2、表内人编号:
每一张普查表内,人的顺序编号。
编号从“0”开始,最大到“4”;
3、民族真值:
即民族基础值,通过民族校对工具校对后得到的民族码,该码为国家编码;
4、民族光电原值:
光电录入系统数据库中的民族码,该码为国家编码。
4.4.6查看各民族统计结果
点击“功能—>查看各民族统计结果”菜单,如下图所示:
图4.416查看各民族统计结果菜单选择
弹出查看各民族统计结果保存窗口,如下图所示:
图4.417各民族统计结果保存窗口
在“另存为”窗口,选择文件保存位置,输入要保存的查看各民族统计结果文件名称,点击保存按钮。
弹出“查看各民族统计结果”界面,该界面显示内容与保存的文件内容相同,界面如下图所示:
图4.418民族识别率关系表
说明:
1、识别数(置信度>10的错误数):
为非校对项中识别错误数,即识别结果中置信度大于10的数据项中,识别结果与基础值结果不同的个数;
2、误识率:
非校对项中识别错误项数/总识别项数;
3、光电校对结果错误数:
将基础值与光电结果相比,不一致的数据项个数;
4、错误率:
光电校对结果错误数/总识别项数;
5、校对数(置信度<=10):
需要校对的数据项个数;
6、校对率:
校对数/总识别项数。
4.4.7工作流状态查看
点击“功能—>工作流状态查看”菜单,菜单选择界面,如下图所示:
图4.419工作流状态查看菜单选择
弹出工作流状态查看窗口,如下图所示:
图4.420工作流状态查询界面
●对校对的普查小区状态查询
通过对窗口右下角的“状态选择”,可以对“识别中、识别完成、未开始校对、校对中、校对完成”的状态进行查询。
例如:
在“状态选择”中选“校对中”,点击【刷新】按钮,将查询到校对中的普查小区。
如下图所示:
图4.421校对中的普查小区查询
附录A:
快捷键说明
开始校对
Alt+V
选择多个连续校对项
鼠标框选
选择多个不连续校对项
Ctrl+鼠标单击
选择下一个民族进行校对
Alt+L
选择上一个民族进行校对
Alt+K
向下翻页
Alt+N
向上翻页
Alt+P
保存校对结果
Alt+S
在是否保存校对结果界面:
保存校对结果
Alt+Y
在是否保存校对结果界面:
不保存校对结果,返回校对界面
Alt+N