1、数据结构课程设计文本文件单词检索和计数数据结构课程设计-文本文件单词检索和计数(总15页)合肥学院计算机科学与技术系课程设计报告20172018学年 第二学期课程 数据结构与算法课程设计名称文本文件单词的检索与计数学生姓名陈映而 学号01专业班级16软件工程(1)班指导教师孙斐 文本文件单词的检索与计数一、问题分析和任务定义要求编程建立一个文本文件,每个单词不包含空格且不跨行,单词由字符序列构成且区分大小写;统计给定单词在文本文件中出现的总次数;检索输出某个单词出现在文本中的行号、在该行中出现的次数以及位置。(1)建立文本文件(2)给定单词的计数(3)检索单词出现在文本文件中的行号、次数及其位
2、置(4)主控菜单程序的结构二、数据结构的选择和概要设计数据结构:1.所有存储形式都用顺序存储 2.用矩阵检索单词出现的位置和次数概要设计:该设计要求可分为三个部分实现:1.对文件的操作,其中包括文本文档的建立,文件名由用户用键盘输入;以及读取文本文档内容并显示在屏幕上;2.给定单词的计数,输入一个不含空格的单词,统计输出该单词在文本中的出现次数;3.检索给定单词,输入一个单词,检索并输出该单词所在的行号、该行中出现的次数以及在该行中的相应位置。图2-1 课题目录图2-2 流程图图2-3 函数关系三、详细设计和编码1.头文件包含:#include#include#include2.功能细分(1)
3、创建自定义名字文档用字符数组filename存放特定的文件路径(D:Dev-Cpp课程设计数据)从键盘输入自定义的文档名字name,把name和“.txt”用strcat连接再用strcat把路径filename与文档名name连接起来打开文件时用变量(filename)表示文件名,若无该文件则创建图3-1 创建自定义名字文档编码(2)打开文件读取内容并输出输入文档名字,根据名字打开文件打开文件后,用fgets读取文档内容fgets读取一行输出一行,并用i记录行数fgets返回EOF(END OF FILE)表示文件结尾(3)写入文本输入文档名字,根据名字打开文档,若无该文档,则重新建立一个。
4、根据提示,从键盘输入字符,最后以0结束用字符变量ch接收字符,并用fputc()把字符输出到文本文档中图3-2 写入文档编码(4)单词的计数输入文档名字,根据名字打开文件根据提示输入单词用ch遍历文本文档把空格前的单词与给定单词比较,若相同则count+若不相同则重新开始比较(5)获取文件的行数输入单词获取文本行数:根据n判断,由于有些行是空行,无法算作一行,所以要判断n后一个字符是不是也是n 若是两个连续的n,则line-1; 若不是,则line+1;判断方法:当ch1为n时,把ch1赋值给ch2,ch1继续获取下一个字符,若ch1=ch2,则line-1;图3-3 获取文件行数编码(6)矩
5、阵存储单词检索输入单词边统计边判断统计:定义一个二维数组a,所有位置的初始值为-1 遍历文本文件时,在遇到第一个n前为第一行,遇到第一个空格前为第一个单词,即a00位置上的-1变为0,依次类推把每个单词与给定单词作比较,若该单词与给定单词相同,则该单词位置上的0的值变为1统计每一行值为1的数的个数,为给定单词在该行中出现的次数; 输出每一行为1的数的列的值,即为给定单词在该行中出现的位置;把行列数的值赋给矩阵的s,v;用循环,把数组中所有值为1的数的位置存储在矩阵的word(y,z)中,并且计算每行为1的总数count+;图3-4 矩阵的结构体类型图3-5 单词的位置、个数的输出四、上机调试过
6、程1.输出文档内容时,fgets()不能用EOF判断是否到达结尾,若把EOF换作null,但由于单词与单词之间有空格,无法正确显示。解决:用fgetc读取每个字符存放于ch中,当ch!=EOF的时候,就可以不断输出直到文件结尾,再用len记录行数,初始值为1,当遇到n时则+1。2.单词的计数出错,无法准确计算出文档有多少和给定的单词。解决:在循环中,判断ch为空格或转行符号时,要用&判断,不能用|,否则将在判断时出错在比较过程中,若下一个字符不符合就直接判断为错,从i=0重新开始,否则只要单词中包含给出的单词都表示正确在比较时还要主要标点符号,符号也会影响判断3.在计算文本文档行数的时候,若有
7、空行,也会计算成一行。解决:当两个连续的转行符号nn在一起时,line应该先+1再-1,即不变。 当一个转行符号n后不是转行符号,也不是文件结尾,line+14.标点符号后有空格,重复计算单词。解决:修改判断条件,若标点符号后是空格,则不计算单词5.调试过程中,完成输入点击“Enter”后,直接跳过程序进行下一步。解决:下一步进入该函数时,程序会自动获取该Enter键,导致函数直接结束。因此要用getchar()先获取该字符,才可以开始执行程序。五、测试结果及其分析图5-1 程序主菜单图5-2 功能1 子菜单1.创建文件图5-3 创建文件成功图5-4 文档成功出现在文件夹中2.文档内容显示图5
8、-5 文档内容图5-6 文档内容显示在屏幕上3.单词计数(1)测试数据1文档:给定单词:you正确数据:9个检验数据:9个图5-7 中you的单词总数(2)测试数据2文档:给定单词:You(与you区分大小写)正确数据:4个检验数据:4个图5-7 中You的单词总数(3)测试数据3文档:给定单词:it正确数据:3个检验数据:3个图5-8 中it的单词总数(4)测试数据4文档:给定单词:is正确数据:4个检验数据:4个图5-9 中is的单词总数4.单词定位(1)测试数据1文档:给定单词:you(共9个)图5-10 中you所在的位置和个数(2)测试数据2文档:给定单词:is(共4个)图5-10
9、中is所在的位置和个数5.时间性能分析程序中对数据进行顺序存储的时间性能为O(n);但是用矩阵记录单词的坐标和个数用了两层for循环,其时间性能为O(n*n);在对文本文档进行遍历并输出,只需要while控制的一层循环,所以其时间性能为O(n);在计算文本文档的行数和单词的个数的时候,用了多个if-else的判断,但是仍然只有一层while控制的循环,所以其时间性能为O(n);总结:该程序的时间性能为O(n*n);六、用户使用说明1.功能叙述创建文本文档 显示文本文档的内容统计给定单词在文本文档中出现的次数检索给定单词,并输出其所在的行、列和每行总共出现的次数2.操作说明由数字0-9可以选择不
10、同的功能,以及板块的退出除数字以外的符号可以结束程序(空格键和n除外)3.输入说明本程序涉及文件名字的输入和单词的输入。输入文件名:文件名由数字0-9、26个英文字母以及符号-组成;单词的输入:字符间不可出现空格,只能用26个英文字母组成,且区分大小写七、参考文献1 王昆仑,李红. 数据结构与算法. 北京:中国铁道出版社,2006年5月。八、附录#include#include#include#define?Max?100voidFileOperation();voidCreateFile();voidShow();voidWordCount();voidExplor();typedefstr
11、uct int?y,z;node;typedef?struct int?s,v; intcountMax; nodewordMax;SeqMatrix; intmain()件操作n);printf(2.单词计数n);printf(3.单词定位n);printf(4.退出程序n);printf(*n);printf(n请输入功能序号:);scanf(%d,&number);switch(number)case1:FileOperation();case2:WordCount();case3:Explor();default:exit(0);return0;voidFileOperation()建
12、文件n);入文件n);printf(2.显示内容n);printf(3.返回n);printf(*n);printf(n请输入功能序号:);scanf(%d,&number);switch(number)case1:CreateFile();case2:Show();case3:system(CLS);main();default:exit(0);voidCreateFile()xt);nnSheiskind,caring,nurturing,andloving.n);printf(创建成功!);fclose(fp);charch;printf(n任意值退出,0返回:);ch=getchar(
13、);if(ch=0) FileOperation();else exit(0);voidShow()xt);xt);strcat(filename,name);if(fp=fopen(filename,r)=NULL) printf(找不到该文件n); main();printf(n请输入要计数的单词:);gets(character);len=strlen(character);&ch!=&ch!=!) if(ch=characteri)xt);strcat(filename,name);if(fp=fopen(filename,r)=NULL) printf(找不到该文件n); main(
14、);printf(n请输入要计数的单词:);gets(character);len=strlen(character);&ch!=&ch!=!&ch!=:) |ch=|ch=!|ch=:) ch=fgetc(fp); if(ch=) aij=0; ch=fgetc(fp); else aij=0; if(k=len&k=x) aij=1; k=0;x=0; j+; elseif(ch=n) ch2=ch; ch=fgetc(fp); if(ch=ch2) =i;k.z=j;printf(%d,k.z+1);i+;k+;/printf(%d,aij);printf(共%d个n,i);printf(n);fclose(fp);printf(n任意值结束,0返回:);c=getchar();if(c=0) system(CLS); main();else exit(0);2018 年 2月
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1