信息论与编码.docx

资源描述

信息论与编码.docx

《信息论与编码.docx》由会员分享，可在线阅读，更多相关《信息论与编码.docx（18页珍藏版）》请在冰豆网上搜索。

信息论与编码.docx

信息论与编码

信息论

---课程设计报告

班级：

192081-12

指导老师：

余林琛

姓名：

熊松

学号：

20081002220

实习地点：

信息楼810

实习日期：

2010年10月

一、唯一可译码

1、问题描述：

在我们学习使用了克拉夫特不等式之后，知道唯一可以码必须满足克拉夫特不等式。

但是克拉夫特不等式仅仅是存在性的判定定理，即该定理不能作为判断一种码是否为唯一可译码的依据。

也就是说当码字长度和码符号数满足克拉夫特不等式时，则必可以构造出唯一可译码，否则不能构造出唯一可译码。

因此我们必须找到一种能够判断一种码是否为唯一可译码的方法---Sardinas－Patterson算法。

2、需求分析：

Sardinas－Patterson算法描述：

设C为码字集合，按以下步骤构造此码的尾随后缀集合F：

（1）考查C中所有的码字，若Wi是Wj的前缀，则将相应的后缀作为一个尾随后缀放入集合F0中；

（2）考查C和Fi两个集合，若Wj∈C是Wi∈Fi的前缀或Wi∈Fi是Wj∈C的前缀，则将相应的后缀作为尾随后缀码放入集合Fi+1中；

（3）F=∪Fi即为码C的尾随后缀集合；

（4）若F中出现了C中的元素，则算法终止，返回假（C不是唯一可译码）；否则若F中没有出现新的元素，则返回真。

在我们设计的算法中，需要注意的是我们需要的是先输出所有尾随后缀的集合，然后再判断该码是否是唯一可译码，即如F中出现了C中的元素，则C不是唯一可译码，否则若F中没有出现新的元素，则C为唯一可译码。

而不是F中出现C中的元素就终止，这也是在本题的要求中需要注意的问题。

3、概要设计：

由于需要判断尾随后缀，所以我们需要反复的比较C和F中的码字。

1）首先我们用一个b[30][30]的数组来存放所有的尾随后缀的集合；用Q记录所有尾随后缀的个数；

2）用数组a[30][30]来存放输入的码字，L[30]来存放码字的长度；

通过一个双重循环并调用houzhui（a[i],a[j],L[i],L[j]）函数来找到a[30][30]中的为随后缀，即：

for（i=0;i

{

for（j=0;j

{

if（i!

=j&&L[i]

HuoZhui（a[i],a[j],L[i],L[j]）;

}

3）通过判断Q是否大于0，如果不大于0，即b[30][30]中没有码字，也就是不存在尾随后缀，那么可判断a[30][30]是唯一可译码，否则进行如下操作；

4）计算b[30][30]中尾随后缀的长度，用k1表示；并调用HuoZhui（b[i],a[j],k1,L[j]）其中k1

for（i=0;i

{

k1=strlen（b[i]）;

for（j=0;j

{

if（k1

HuoZhui（b[i],a[j],k1,L[j]）;

}

5）寻找b[30][30]中的尾随后缀；用k2表示b[30][30]中码字的长度，并调用HuoZhui（a[i],b[j],L[i],k2）来实现，其中k2>L[j];通过循环调用即可找到b[30][30]中的所有尾随后缀，最后再将他们分别存放在b[30][30]中；即通过

for（i=0;i

{

for（j=0;j

{

k2=strlen（b[j]）;

if（k2>L[i]）

{

HuoZhui（a[i],b[j],L[i],k2）;

}

6）在反复调用HuoZhui（a[i],a[j],L[i],L[j]）函数中如果b[30][30]中有重复出现的，即尾随后缀相同的不用再次放入b[30][30]中。

7）在调用函数中所需要注意的问题就是一个比较的问题，也就是实现6）中所提到的。

4详细设计如下：

#include

charb[30][30];

intQ;

voidHuoZhui（charc[],chard[],intL1,intL2）

{

inti,j,temp=0;

charm[30];

for（i=0;i

{

if（c[i]==d[i]）continue;

elsebreak;

}

if（i==L1）

{

for（j=0;j

m[j]=d[L1+j];

m[j]='\0';

for（i=0;i

{

if（strcmp（b[i],m）==0）

{

temp=1;

break;

}

if（temp!

=1）

{

strcpy（b[Q],m）;

Q++;

}

voidmain（）

{

inti,j,k,k1,k2,n;

chara[30][30];

intL[30];

inttemp=1;

intmm=0;

printf（"请输入码字个数：

"）;

scanf（"%d",&n）;

printf（"请分别输入码字:

\n"）;

for（i=0;i

{

scanf（"%s",&a[i]）;

L[i]=strlen（a[i]）;

}

for（i=0;i

{

for（j=0;j

{

if（i!

=j&&L[i]

HuoZhui（a[i],a[j],L[i],L[j]）;

}

if（Q>0）

{

for（i=0;i

{

k1=strlen（b[i]）;

for（j=0;j

{

if（k1

HuoZhui（b[i],a[j],k1,L[j]）;

}

for（k=0;k

{

for（j=0;j

{

k2=strlen（b[j]）;

if（k2>L[k]）

{

HuoZhui（a[k],b[j],L[k],k2）;

}

printf（"尾随后缀集合为:

"）;

for（i=0;i

printf（"%s",b[i]）;

for（i=0;i

=0;i++）

{

for（j=0;j

{

if（strcmp（a[i],b[j]）==0）

{

temp=0;

break;

}

elsecontinue;

}

printf（"\n"）;

if（temp==0）printf（"该码不是唯一可译码!

\n"）;

elseprintf（"该码是唯一可译码!

\n"）;

}

elseprintf（"该码组是唯一可译码!

"）;

mm++;

printf（"\n"）;

}

5测试结果截图如下：

6、需要注意的问题：

主要就是反复调用，稍不注意就会漏掉一些尾随后缀，还有就是在编码是一定要注意，变量的值，就像我在设计该程序时，i的值保留了前面两次循环后的值，导致最后输出尾随后缀时输出不全。

二、香农码

1、算法思想：

主要就是按照老师上课讲的思想，即按以下步骤即可求得香农码：

1）、将信源发出的N个消息符号按其概率的递减次序依次排列。

2）、按下式计算第i个消息的二进制代码组的码长，并取整。

3）、为了编成唯一可译码，首先计算第i个消息的累加概率

4）、将累加概率Pi（为小数）变成二进制数

5）、去除小数点，并根据码长li，取小数点后li位数作为第i个消息的码字。

2、概要设计：

1）、其实这主要就是用到一个排序，我用的是冒泡排序算法；

2）、求对数的时候需要转换一下；

3）、其余的按上述步骤就可得到。

4、详细设计如下：

#include

voidmain（）

{

intn,i,j;

floatt;

floata[10];//符号概率;

floatb[10];//累加概率;

floatc[10];//-log（a[i]）;

intd[10];//码字长度；

intm[10][10];//存码字；

printf（"请输入消息符号个数:

"）;

scanf（"%d",&n）;

printf（"请输入各个消息符号所对应的概率:

\n"）;

for（i=0;i

{

scanf（"%f",&a[i]）;

}

printf（"\n"）;

/*排序*/

for（j=0;j

for（i=0;i

if（a[i]

{

t=a[i];

a[i]=a[i+1];

a[i+1]=t;

}

printf（"按概率从大到小排序后为:

\n"）;

for（i=0;i

printf（"%f",a[i]）;

printf（"\n"）;

/*请累加概率*/

for（i=0;i

{

b[0]=0;

b[i+1]=a[i]+b[i];

}

printf（"累加概率为:

"）;

for（i=0;i

printf（"%f",b[i]）;

printf（"\n"）;

for（i=0;i

{

c[i]=（float）（-1）*log（（float）a[i]）/log（（float）2）;

printf（"%f",c[i]）;

}

printf（"\n\n"）;

for（i=0;i

{

d[i]=（int）c[i]+1;

}

printf（"码字长度分别为:

"）;

for（i=0;i

printf（"%d",d[i]）;

printf（"\n\n"）;

printf（"码字为:

\n"）;

for（i=0;i

{

for（j=0;j

{

b[i]=b[i]*2;

m[i][j]=（int）（b[i]）;

if（m[i][j]==1）

b[i]=b[i]-1;

printf（"%d",m[i][j]）;

}

printf（""）;

}

printf（"\n"）;

}

5、测试截图如下：

6、需要注意问题：

本题比较简单，所以只要注意一下细节就可以了。

三、费诺码

1、算法思想：

也就是根据老师上课所讲的步骤就可以了；步骤如下：

1）、将信源发出的N个消息符号按其概率的递减次序依次排列。

2）、将依次排列的信源符号依概率分成两组，使两个组的概率和近于相同，并对各组赋予一个二进制代码符号“0”和“1”（编m进制码就分成m组）。

3）、将每一个大组的信源符号进一步再分成两组，使划分后的两个组的概率和近于相同，并又分别赋予两组一个二进制符号“0”和“1”

4）、如此重复，直至每组值只剩下一个信源符号为止

5）、信源符号所对应的码符号序列即为费诺码

2、概要设计

1）、首先是有一个排序问题，我用的是直接插入排序；

2）、这个算法的核心是分组问题，我是通过一个递归实现的，主要分株思想就是首先计算出所有输入概率的总和的一半；由于排序后的概率是从高到低的，所以用一个逐渐累加求和与总和一半的差，求得差最小的那一个位置，即可得到分组，再通过递归调用即可实现所有的分组，最后得到费诺码。

核心分组算法如下：

voidBlock（intp,intq,intL）

{

inti,j,r,t1;

floatsum1=0,sum2=0,sum3,temp,cz=3;

for（i=p;i<=q;i++）

sum1+=a[i];

temp=sum1/2;

for（i=p;i<=q;i++）

{

sum2+=a[i];

sum3=sum2-temp;//求差

if（sum3>=0）sum3=sum3*1;

elsesum3=sum3*（-1）;//这两行相当于求差的绝对值

if（sum3

elsebreak;

}

……

}

3、详细设计：

#include

floata[10];

intb[20][20];

voidBlock（intp,intq,intL）

{

inti,j,r,t1;

floatsum1=0,sum2=0,sum3,temp,cz=3;

for（i=p;i<=q;i++）

sum1+=a[i];

temp=sum1/2;

for（i=p;i<=q;i++）

{

sum2+=a[i];

sum3=sum2-temp;

if（sum3>=0）sum3=sum3*1;

elsesum3=sum3*（-1）;

if（sum3

elsebreak;

}

for（r=p;r

b[p][L]=0;

if（i-p==1）

{

for（j=0;j<=L;j++）

printf（"%d",b[p][j]）;

printf（""）;

}

elseBlock（p,i-1,L+1）;

for（t1=i;t1<=q;t1++）

b[t1][L]=1;

if（i==q）

{

for（j=0;j<=L;j++）

printf（"%d",b[i][j]）;

printf（""）;

}

elseBlock（i,q,L+1）;

}

voidmain（）

{

inti,j,n,num=0,k1=0;

floattemp,k=1;

printf（"请输入码字个数:

"）;

scanf（"%d",&n）;

printf（"请分别输入各码字:

\n"）;

for（i=0;i

scanf（"%f",&a[i]）;

printf（"按概率从大到小排序后为:

\n"）;

//排序（直接插入排序）;

for（i=0;i

{

temp=a[i+1];

j=i;

while（j>-1&&temp>a[j]）

{

a[j+1]=a[j];

j--;

}

a[j+1]=temp;

}

for（i=0;i

printf（"%f",a[i]）;

printf（"\n"）;

printf（"费诺码为：

"）;

Block（0,n-1,0）;

printf（"\n"）;

}

4、运行截图如下：

5、需要注意的问题：

本题中需要注意的问题就是分组时候需要注意，不要分错了，我觉得虽然在本题中递归很重要，但最重要的应该是分组。

还有我所遇到的问题就是传递参数L的时候需要特别注意，就是由于这个问题还花费了两个小时去调试，这个问题导致调试时间比写代码的时间更长。

所以传递参数时一定要特别注意。

展开阅读全文