信息论与编码.docx
《信息论与编码.docx》由会员分享,可在线阅读,更多相关《信息论与编码.docx(18页珍藏版)》请在冰豆网上搜索。
![信息论与编码.docx](https://file1.bdocx.com/fileroot1/2023-2/2/40425038-88cd-446b-9ff2-262871721e3b/40425038-88cd-446b-9ff2-262871721e3b1.gif)
信息论与编码
信息论
---课程设计报告
班级:
192081-12
指导老师:
余林琛
姓名:
熊松
学号:
20081002220
实习地点:
信息楼810
实习日期:
2010年10月
一、唯一可译码
1、问题描述:
在我们学习使用了克拉夫特不等式之后,知道唯一可以码必须满足克拉夫特不等式。
但是克拉夫特不等式仅仅是存在性的判定定理,即该定理不能作为判断一种码是否为唯一可译码的依据。
也就是说当码字长度和码符号数满足克拉夫特不等式时,则必可以构造出唯一可译码,否则不能构造出唯一可译码。
因此我们必须找到一种能够判断一种码是否为唯一可译码的方法---Sardinas-Patterson算法。
2、需求分析:
Sardinas-Patterson算法描述:
设C为码字集合,按以下步骤构造此码的尾随后缀集合F:
(1)考查C中所有的码字,若Wi是Wj的前缀,则将相应的后缀作为一个尾随后缀放入集合F0中;
(2)考查C和Fi两个集合,若Wj∈C是Wi∈Fi的前缀或Wi∈Fi是Wj∈C的前缀,则将相应的后缀作为尾随后缀码放入集合Fi+1中;
(3)F=∪Fi即为码C的尾随后缀集合;
(4)若F中出现了C中的元素,则算法终止,返回假(C不是唯一可译码);否则若F中没有出现新的元素,则返回真。
在我们设计的算法中,需要注意的是我们需要的是先输出所有尾随后缀的集合,然后再判断该码是否是唯一可译码,即如F中出现了C中的元素,则C不是唯一可译码,否则若F中没有出现新的元素,则C为唯一可译码。
而不是F中出现C中的元素就终止,这也是在本题的要求中需要注意的问题。
3、概要设计:
由于需要判断尾随后缀,所以我们需要反复的比较C和F中的码字。
1)首先我们用一个b[30][30]的数组来存放所有的尾随后缀的集合;用Q记录所有尾随后缀的个数;
2)用数组a[30][30]来存放输入的码字,L[30]来存放码字的长度;
通过一个双重循环并调用houzhui(a[i],a[j],L[i],L[j])函数来找到a[30][30]中的为随后缀,即:
for(i=0;i{
for(j=0;j{
if(i!
=j&&L[i]HuoZhui(a[i],a[j],L[i],L[j]);
}
}
3)通过判断Q是否大于0,如果不大于0,即b[30][30]中没有码字,也就是不存在尾随后缀,那么可判断a[30][30]是唯一可译码,否则进行如下操作;
4)计算b[30][30]中尾随后缀的长度,用k1表示;并调用HuoZhui(b[i],a[j],k1,L[j])其中k1for(i=0;i{
k1=strlen(b[i]);
for(j=0;j{
if(k1HuoZhui(b[i],a[j],k1,L[j]);
}
}
5)寻找b[30][30]中的尾随后缀;用k2表示b[30][30]中码字的长度,并调用HuoZhui(a[i],b[j],L[i],k2)来实现,其中k2>L[j];通过循环调用即可找到b[30][30]中的所有尾随后缀,最后再将他们分别存放在b[30][30]中;即通过
for(i=0;i{
for(j=0;j{
k2=strlen(b[j]);
if(k2>L[i])
{
HuoZhui(a[i],b[j],L[i],k2);
}
}
}
6)在反复调用HuoZhui(a[i],a[j],L[i],L[j])函数中如果b[30][30]中有重复出现的,即尾随后缀相同的不用再次放入b[30][30]中。
7)在调用函数中所需要注意的问题就是一个比较的问题,也就是实现6)中所提到的。
4详细设计如下:
#include
#include
charb[30][30];
intQ;
voidHuoZhui(charc[],chard[],intL1,intL2)
{
inti,j,temp=0;
charm[30];
for(i=0;i{
if(c[i]==d[i])continue;
elsebreak;
}
if(i==L1)
{
for(j=0;jm[j]=d[L1+j];
m[j]='\0';
for(i=0;i{
if(strcmp(b[i],m)==0)
{
temp=1;
break;
}
}
if(temp!
=1)
{
strcpy(b[Q],m);
Q++;
}
}
}
voidmain()
{
inti,j,k,k1,k2,n;
chara[30][30];
intL[30];
inttemp=1;
intmm=0;
printf("请输入码字个数:
");
scanf("%d",&n);
printf("请分别输入码字:
\n");
for(i=0;i{
scanf("%s",&a[i]);
L[i]=strlen(a[i]);
}
for(i=0;i{
for(j=0;j{
if(i!
=j&&L[i]HuoZhui(a[i],a[j],L[i],L[j]);
}
}
if(Q>0)
{
for(i=0;i{
k1=strlen(b[i]);
for(j=0;j{
if(k1HuoZhui(b[i],a[j],k1,L[j]);
}
for(k=0;k{
for(j=0;j{
k2=strlen(b[j]);
if(k2>L[k])
{
HuoZhui(a[k],b[j],L[k],k2);
}
}
}
}
printf("尾随后缀集合为:
");
for(i=0;iprintf("%s",b[i]);
for(i=0;i=0;i++)
{
for(j=0;j{
if(strcmp(a[i],b[j])==0)
{
temp=0;
break;
}
elsecontinue;
}
}
printf("\n");
if(temp==0)printf("该码不是唯一可译码!
\n");
elseprintf("该码是唯一可译码!
\n");
}
elseprintf("该码组是唯一可译码!
");
mm++;
printf("\n");
}
5测试结果截图如下:
6、需要注意的问题:
主要就是反复调用,稍不注意就会漏掉一些尾随后缀,还有就是在编码是一定要注意,变量的值,就像我在设计该程序时,i的值保留了前面两次循环后的值,导致最后输出尾随后缀时输出不全。
二、香农码
1、算法思想:
主要就是按照老师上课讲的思想,即按以下步骤即可求得香农码:
1)、将信源发出的N个消息符号按其概率的递减次序依次排列。
2)、按下式计算第i个消息的二进制代码组的码长,并取整。
3)、为了编成唯一可译码,首先计算第i个消息的累加概率
4)、将累加概率Pi(为小数)变成二进制数
5)、去除小数点,并根据码长li,取小数点后li位数作为第i个消息的码字。
2、概要设计:
1)、其实这主要就是用到一个排序,我用的是冒泡排序算法;
2)、求对数的时候需要转换一下;
3)、其余的按上述步骤就可得到。
4、详细设计如下:
#include
#include
voidmain()
{
intn,i,j;
floatt;
floata[10];//符号概率;
floatb[10];//累加概率;
floatc[10];//-log(a[i]);
intd[10];//码字长度;
intm[10][10];//存码字;
printf("请输入消息符号个数:
");
scanf("%d",&n);
printf("请输入各个消息符号所对应的概率:
\n");
for(i=0;i{
scanf("%f",&a[i]);
}
printf("\n");
/*排序*/
for(j=0;jfor(i=0;iif(a[i]{
t=a[i];
a[i]=a[i+1];
a[i+1]=t;
}
printf("按概率从大到小排序后为:
\n");
for(i=0;iprintf("%f",a[i]);
printf("\n");
printf("\n");
/*请累加概率*/
for(i=0;i{
b[0]=0;
b[i+1]=a[i]+b[i];
}
printf("累加概率为:
");
for(i=0;iprintf("%f",b[i]);
printf("\n");
for(i=0;i{
c[i]=(float)(-1)*log((float)a[i])/log((float)2);
printf("%f",c[i]);
}
printf("\n\n");
for(i=0;i{
d[i]=(int)c[i]+1;
}
printf("码字长度分别为:
");
for(i=0;iprintf("%d",d[i]);
printf("\n\n");
printf("码字为:
\n");
for(i=0;i{
for(j=0;j{
b[i]=b[i]*2;
m[i][j]=(int)(b[i]);
if(m[i][j]==1)
b[i]=b[i]-1;
printf("%d",m[i][j]);
}
printf("");
}
printf("\n");
}
5、测试截图如下:
6、需要注意问题:
本题比较简单,所以只要注意一下细节就可以了。
三、费诺码
1、算法思想:
也就是根据老师上课所讲的步骤就可以了;步骤如下:
1)、将信源发出的N个消息符号按其概率的递减次序依次排列。
2)、将依次排列的信源符号依概率分成两组,使两个组的概率和近于相同,并对各组赋予一个二进制代码符号“0”和“1”(编m进制码就分成m组)。
3)、将每一个大组的信源符号进一步再分成两组,使划分后的两个组的概率和近于相同,并又分别赋予两组一个二进制符号“0”和“1”
4)、如此重复,直至每组值只剩下一个信源符号为止
5)、信源符号所对应的码符号序列即为费诺码
2、概要设计
1)、首先是有一个排序问题,我用的是直接插入排序;
2)、这个算法的核心是分组问题,我是通过一个递归实现的,主要分株思想就是首先计算出所有输入概率的总和的一半;由于排序后的概率是从高到低的,所以用一个逐渐累加求和与总和一半的差,求得差最小的那一个位置,即可得到分组,再通过递归调用即可实现所有的分组,最后得到费诺码。
核心分组算法如下:
voidBlock(intp,intq,intL)
{
inti,j,r,t1;
floatsum1=0,sum2=0,sum3,temp,cz=3;
for(i=p;i<=q;i++)
sum1+=a[i];
temp=sum1/2;
for(i=p;i<=q;i++)
{
sum2+=a[i];
sum3=sum2-temp;//求差
if(sum3>=0)sum3=sum3*1;
elsesum3=sum3*(-1);//这两行相当于求差的绝对值
if(sum3elsebreak;
}
……
}
3、详细设计:
#include
floata[10];
intb[20][20];
voidBlock(intp,intq,intL)
{
inti,j,r,t1;
floatsum1=0,sum2=0,sum3,temp,cz=3;
for(i=p;i<=q;i++)
sum1+=a[i];
temp=sum1/2;
for(i=p;i<=q;i++)
{
sum2+=a[i];
sum3=sum2-temp;
if(sum3>=0)sum3=sum3*1;
elsesum3=sum3*(-1);
if(sum3elsebreak;
}
for(r=p;r
b[p][L]=0;
if(i-p==1)
{
for(j=0;j<=L;j++)
printf("%d",b[p][j]);
printf("");
}
elseBlock(p,i-1,L+1);
for(t1=i;t1<=q;t1++)
b[t1][L]=1;
if(i==q)
{
for(j=0;j<=L;j++)
printf("%d",b[i][j]);
printf("");
}
elseBlock(i,q,L+1);
}
voidmain()
{
inti,j,n,num=0,k1=0;
floattemp,k=1;
printf("请输入码字个数:
");
scanf("%d",&n);
printf("请分别输入各码字:
\n");
for(i=0;iscanf("%f",&a[i]);
printf("按概率从大到小排序后为:
\n");
//排序(直接插入排序);
for(i=0;i{
temp=a[i+1];
j=i;
while(j>-1&&temp>a[j])
{
a[j+1]=a[j];
j--;
}
a[j+1]=temp;
}
for(i=0;iprintf("%f",a[i]);
printf("\n");
printf("费诺码为:
");
Block(0,n-1,0);
printf("\n");
}
4、运行截图如下:
5、需要注意的问题:
本题中需要注意的问题就是分组时候需要注意,不要分错了,我觉得虽然在本题中递归很重要,但最重要的应该是分组。
还有我所遇到的问题就是传递参数L的时候需要特别注意,就是由于这个问题还花费了两个小时去调试,这个问题导致调试时间比写代码的时间更长。
所以传递参数时一定要特别注意。