3哈夫曼编译器.docx

资源描述

3哈夫曼编译器.docx

《3哈夫曼编译器.docx》由会员分享，可在线阅读，更多相关《3哈夫曼编译器.docx（21页珍藏版）》请在冰点文库上搜索。

3哈夫曼编译器.docx

3哈夫曼编译器

数据结构课程设计

实验题目：

赫夫曼编码/译码器

班级网络一班

姓名

学号

指导老师

成绩

一、需求分析

利用赫夫曼编码进行通信可以大大提高信道利用率，缩短信息传输时间，降低传输成本。

这要求在发送端通过一个编码系统对待传输数据预先编码，在接收端将传来的数据进行译码（复原）。

对于双工信道（即可以双向传输信息的信道），每端都需要一个完整的编/译码系统。

试为这样的信息收发站编写一个赫夫曼码的编/译码系统。

二、基本要求

1.基本要求

一个完整的系统应具有以下功能：

（1）I：

初始化（Initialization）。

从终端读入字符集大小n，以及n个字符和n个权值，建立赫夫曼树，并将它存于文件hfmTree中。

（2）E：

编码（Encoding）。

利用已建好的赫夫曼树（如不在内存，则从文件hfmTree中读入），对文件ToBeTran中的正文进行编码，然后将结果存入文件CodeFile中。

（3）D：

译码（Decoding）。

利用已建好的赫夫曼树将文件CodeFile中的代码进行译码，结果存入文件Textfile中。

2.测试要求

（1）利用教科书例6-2的数据调试程序：

已知某系统在通信联络中只可能出现八种字符，其频率分别0.05,0.29,0.07,0.08,0.14,0.23,0.03,0.11，试设计赫夫曼编码。

（2）用下表给出的字符集和频度的实际统计数据建立赫夫曼树，并实现以下报文的编码和译码：

“THISPROGRAMEISMYFAVORITE”。

字符

频度

186

103

字符

频度

3.实现提示

（1）编码结果以文本方式存储在文件Codefile中。

（2）用户界面可以设计为“菜单”方式：

显示上述功能符号，再加上“Q”，表示退出运行Quit。

请用户键入一个选择功能符。

此功能执行完毕后再显示此菜单，直至某次用户选择了“Q”为止。

（3）在程序的一次执行过程中，第一次执行I，D或C命令之后，赫夫曼树已经在内存了，不必再读入。

每次执行中不一定执行I命令，因为文件hfmTree可能早已建好。

三、概要设计

程序主要分为五部分，哈夫曼节点的定义，哈夫曼编码的定义，Select函数选择出权值最小的节点，Initialization函数生成哈夫曼树，主函数。

四、详细设计

1.数据存储结构设计

（1）哈夫曼节点

哈夫曼节点数据类型如下，包含字符，权值，父节点，左右孩子：

typedefstruct{

charch;

unsignedintweight;

unsignedintparent,lchild,rchild;

}HTNode,*HfmTree;

（2）哈夫曼编码

哈夫曼编码用二级指针存储，动态分配空间:

typedefchar**HfmCode;

2.算法的设计思想

（1）Select函数

voidSelect（HfmTreeHT,inta,int&s1,int&s2）{

//选择出parent为0的两个权值最小的两个节点，s1节点权值小于s2节点

inti,temp;

i=0;

while（HT[++i].parent!

=0）;

s1=i;

while（HT[++i].parent!

=0）;

s2=i++;

if（HT[s1].weight>HT[s2].weight）{

temp=s1;

s1=s2;

s2=temp;

}

for（;i<=a;i++）{

if（HT[i].parent==0）

if（HT[i].weight

elseif（HT[i].weight

}

}//选出权值最小且无父节点的节点，选择范围为i-a;

（2）Initialization函数

voidInitialization（HfmTree&HT,HfmCode&HC,intn,stringch,int*w）

{

inti,m,s1,s2,start,c,f;

//iHTNode位置，m为哈夫曼树节点数，s1s2选择节点，start开始点，c当前节点，f父节点

char*cd;

if（n<=1）return;

m=2*n-1;

HT=（HfmTree）malloc（（m+1）*sizeof（HTNode））;//0号单元使用

for（i=1;i<=n;i++）{

HT[i].ch=ch[i-1];

HT[i].weight=w[i-1];

HT[i].parent=0;

HT[i].lchild=0;

HT[i].rchild=0;

}//初始化叶子节点

for（;i<=m;i++）{

HT[i].ch='0';

HT[i].weight=0;

HT[i].parent=0;

HT[i].lchild=0;

HT[i].rchild=0;

}//----------------为什么不能批量赋值----------！

！

for（i=n+1;i<=m;i++）{//建立哈夫曼树

Select（HT,i-1,s1,s2）;

HT[s1].parent=i;

HT[s2].parent=i;

HT[i].lchild=s1;

HT[i].rchild=s2;

HT[i].weight=HT[s1].weight+HT[s2].weight;

}

HC=（HfmCode）malloc（（n+1）*sizeof（char*））;

cd=（char*）malloc（n*sizeof（char））;

cd[n-1]='\0';

for（i=1;i<=n;i++）{

start=n-1;

for（c=i,f=HT[i].parent;f!

=0;c=f,f=HT[f].parent）{

if（HT[f].lchild==c）{

cd[--start]='0';

}else{

cd[--start]='1';

}

HC[i]=（char*）malloc（（n-start）*sizeof（char））;

strcpy（HC[i],&cd[start]）;

}

free（cd）;

cout<<"生成成功！

cout<<"ID\tchar\t"<<"weight"<<"\t"<<"parent"<<"\t"<<"lchild"<<"\t"<<"rchild"<<"\t"<

for（i=1;i<2*n;i++）{

cout<

}

cout<<"char\t"<<"Code\t"<

for（i=1;i<=n;i++）{

cout<

}

//生成，前半部分为生成哈夫曼树，调用Select得出权值最小的两项，计算权值

//后半部分为哈夫曼编码生成，从后到前生成，动态分配空间大小

3.源程序

#include

usingnamespacestd;

typedefstruct{

charch;

unsignedintweight;

unsignedintparent,lchild,rchild;

}HTNode,*HfmTree;

typedefchar**HfmCode;

voidSelect（HfmTreeHT,inta,int&s1,int&s2）{

//选择出parent为0的两个权值最小的两个节点，s1节点权值小于s2节点

inti,temp;

i=0;

while（HT[++i].parent!

=0）;

s1=i;

while（HT[++i].parent!

=0）;

s2=i++;

if（HT[s1].weight>HT[s2].weight）{

temp=s1;

s1=s2;

s2=temp;

}

for（;i<=a;i++）{

if（HT[i].parent==0）

if（HT[i].weight

elseif（HT[i].weight

}

voidInitialization（HfmTree&HT,HfmCode&HC,intn,stringch,int*w）

{

inti,m,s1,s2,start,c,f;

//iHTNode位置，m为哈夫曼树节点数，s1s2选择节点，start开始点，c当前节点，f父节点

char*cd;

if（n<=1）return;

m=2*n-1;

HT=（HfmTree）malloc（（m+1）*sizeof（HTNode））;//0号单元使用

for（i=1;i<=n;i++）{

HT[i].ch=ch[i-1];

HT[i].weight=w[i-1];

HT[i].parent=0;

HT[i].lchild=0;

HT[i].rchild=0;

}//初始化叶子节点

for（;i<=m;i++）{

HT[i].ch='0';

HT[i].weight=0;

HT[i].parent=0;

HT[i].lchild=0;

HT[i].rchild=0;

}//----------------为什么不能批量赋值----------

for（i=n+1;i<=m;i++）{//建立哈夫曼树

Select（HT,i-1,s1,s2）;

HT[s1].parent=i;

HT[s2].parent=i;

HT[i].lchild=s1;

HT[i].rchild=s2;

HT[i].weight=HT[s1].weight+HT[s2].weight;

}

HC=（HfmCode）malloc（（n+1）*sizeof（char*））;

cd=（char*）malloc（n*sizeof（char））;

cd[n-1]='\0';

for（i=1;i<=n;i++）{

start=n-1;

for（c=i,f=HT[i].parent;f!

=0;c=f,f=HT[f].parent）{

if（HT[f].lchild==c）{

cd[--start]='0';

}else{

cd[--start]='1';

}

HC[i]=（char*）malloc（（n-start）*sizeof（char））;

strcpy（HC[i],&cd[start]）;

}

free（cd）;

cout<<"生成成功！

cout<<"ID\tchar\t"<<"weight"<<"\t"<<"parent"<<"\t"<<"lchild"<<"\t"<<"rchild"<<"\t"<

for（i=1;i<2*n;i++）{

cout<

}

cout<<"char\t"<<"Code\t"<

for（i=1;i<=n;i++）{

cout<

}

intmain（）{

ifstreaminput_file;

ofstreamoutput_file;

charaction;

stringtoBeTranSource,textFileSource;

stringcharsIn,code;

inti,j,c,n,w[100];

HfmTreeHT;

HfmCodeHC;

while（action!

='Q'）{

cout<

cout<<"*哈夫曼编码/译码器*"<

cout<<"**"<

cout<<"*I.初始化E.编码D.译码/P.印码/T.印树*"<

cout<<"*C.清屏*"<

cout<<"*Codebywhocaresu16/12/2010*"<

cout<<"**********************************************"<

cout<

cin>>action;

action=toupper（action）;

switch（action）{

case'I':

//输入信息

cout<<"请输入字符数：

cin>>n;

cout<<"请输入字符组（紧密输入不用空格区分）：

getline（cin,charsIn）;

cout<<"输入各个权重（中间空格）：

for（i=1;i<=n;i++）{

cin>>w[i-1];

}

Initialization（HT,HC,n,charsIn,w）;

//输出备份到文件

cout<<"正在输出备份到hfmTree.txt..."<

output_file.open（"hfmTree.txt"）;

if（!

output_file）{

system（"cls"）;

cout<<"Can'topenfile!

}

output_file<

for（i=0;i

output_file<

}

output_file<<"--------以下为具体编码信息--------"<

output_file<<"Char\tCode\t"<

for（i=1;i<=n;i++）{

output_file<

}

output_file.close（）;

cout<<"备份到hfmTree.txt成功！

;break;

case'E':

//判断内存中是否有生成哈夫曼树，没有的话从文件读入

if（sizeof（HC）<5）{

cout<<"内存中不存在哈夫曼树，从hfmTree.txt读入！

input_file.open（"hfmTree.txt"）;

if（!

input_file）{

system（"cls"）;

cout<<"Can'topenfile!

}

input_file>>n;

getline（input_file,charsIn）;

for（i=1;i<=n;i++）{

input_file>>w[i-1];

}

input_file.close（）;

Initialization（HT,HC,n,charsIn,w）;

}

input_file.open（"ToBeTran.txt"）;

if（!

input_file）{

system（"cls"）;

cout<<"Can'topenfile!

}

cout<<"-------从ToBetTran.txt读取数据为--------"<

getline（input_file,toBeTranSource）;

cout<

input_file.close（）;

cout<<"----------------------------------------"<

output_file.open（"CodeFile.txt"）;

if（!

output_file）{

system（"cls"）;

cout<<"Can'topenfile!

}

cout<<"------编译的密文（输出到CodeFile.txt）----"<

for（i=0;i<=toBeTranSource.length（）;i++）{

for（j=1;j<=n;j++）{

if（toBeTranSource[i]==HT[j].ch）{

cout<

output_file<

}

output_file.close（）;

cout<

;break;

case'D':

//译码

input_file.open（"CodeFile.txt"）;

if（!

output_file）{

system（"cls"）;

cout<<"Can'topenfile!

return1;

}

cout<<"------------读取的编码为----------------------"<

getline（input_file,code）;

cout<

input_file.close（）;

cout<<"----------------译码为--------------------"<

c=2*n-1;

output_file.open（"TextFile.txt"）;

for（i=0;i<=code.length（）;i++）{

if（HT[c].lchild==0）{

cout<

c=2*n-1;

}

if（code[i]=='0'）c=HT[c].lchild;

elsec=HT[c].rchild;

}

cout<

cout<<"-------------------------------------------"<

;break;

case'C':

system（"cls"）;

break;

default:

cout<

}

system（"pause"）;

return0;

}

五、调试分析

1.测试数据列表：

（1）利用教科书例6-2的数据调试程序：

0.05,0.29,0.07,0.08,0.14,0.23,0.03,0.11

（2）用下表给出的字符集和频度的实际统计数据建立赫夫曼树，并实现以下报文的编码和译码：

“THISPROGRAMEISMYFAVORITE”。

abcdefghijklmnopqrstuvwxyz

18664132232103211547571532205763151485180238181161

2.测试数据运行结果

以下是程序运行的界面截图，显示了运行的一些主要过程。

程序运行主界面

Test1:

-----------------------------------------------例6-2数据测试---------------------------------------------

测试数据截图

Test2：

基本功能测试

-----------------------------------------------I.初始化测试----------------------------------------------

27abcdefghijklmnopqrstuvwxyz

18664132232103211547571532205763151485180238181161

生成树信息反馈截图

hfmTree.txt中信息得到保存

生成的哈夫曼编码截图

初始化测试完毕-

-----------------------------------------E.编码测试-------------------------------------------------------------

读入hfmTree.txt中的信息生成哈夫曼树

生成哈夫曼树的相关信息见I.初始化测试

编译信息成功输出到CodeFile.txt

Codefile.txt

编码测试结束

-----------------------------------------------------D.译码测试-----------------------------------------------

译码测试结束

测试结束

六、课程设计总结及心得体会

不得不说，这个是目前做到的最复杂的一个程序，与停车场相比，它的函数，数据存储结构的定义少了不少，但是其复杂度却比停车场有过之无不及，文件操作比较复杂，为此我查阅了相关资料，做到了基本能够实现文件的读取和写入，程序中依然存在一个问题，那就是它只能读取一段文字，遇到回车会终止读入，这也局限了程序的使用面。

在开发哈夫曼编译器的时候，发现一个整体概念很重要，要很清晰地知道它具体是怎么运作的。

双亲结点，

展开阅读全文