3哈夫曼编译器.docx
《3哈夫曼编译器.docx》由会员分享,可在线阅读,更多相关《3哈夫曼编译器.docx(21页珍藏版)》请在冰点文库上搜索。
3哈夫曼编译器
数据结构课程设计
实验题目:
赫夫曼编码/译码器
班级网络一班
姓名
学号
指导老师
成绩
一、需求分析
利用赫夫曼编码进行通信可以大大提高信道利用率,缩短信息传输时间,降低传输成本。
这要求在发送端通过一个编码系统对待传输数据预先编码,在接收端将传来的数据进行译码(复原)。
对于双工信道(即可以双向传输信息的信道),每端都需要一个完整的编/译码系统。
试为这样的信息收发站编写一个赫夫曼码的编/译码系统。
二、基本要求
1.基本要求
一个完整的系统应具有以下功能:
(1)I:
初始化(Initialization)。
从终端读入字符集大小n,以及n个字符和n个权值,建立赫夫曼树,并将它存于文件hfmTree中。
(2)E:
编码(Encoding)。
利用已建好的赫夫曼树(如不在内存,则从文件hfmTree中读入),对文件ToBeTran中的正文进行编码,然后将结果存入文件CodeFile中。
(3)D:
译码(Decoding)。
利用已建好的赫夫曼树将文件CodeFile中的代码进行译码,结果存入文件Textfile中。
2.测试要求
(1)利用教科书例6-2的数据调试程序:
已知某系统在通信联络中只可能出现八种字符,其频率分别0.05,0.29,0.07,0.08,0.14,0.23,0.03,0.11,试设计赫夫曼编码。
(2)用下表给出的字符集和频度的实际统计数据建立赫夫曼树,并实现以下报文的编码和译码:
“THISPROGRAMEISMYFAVORITE”。
字符
A
B
C
D
E
F
G
H
I
J
K
L
M
频度
186
64
13
22
32
103
21
15
47
57
1
5
32
20
字符
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
频度
57
63
15
1
48
51
80
23
8
18
1
16
1
3.实现提示
(1)编码结果以文本方式存储在文件Codefile中。
(2)用户界面可以设计为“菜单”方式:
显示上述功能符号,再加上“Q”,表示退出运行Quit。
请用户键入一个选择功能符。
此功能执行完毕后再显示此菜单,直至某次用户选择了“Q”为止。
(3)在程序的一次执行过程中,第一次执行I,D或C命令之后,赫夫曼树已经在内存了,不必再读入。
每次执行中不一定执行I命令,因为文件hfmTree可能早已建好。
三、概要设计
程序主要分为五部分,哈夫曼节点的定义,哈夫曼编码的定义,Select函数选择出权值最小的节点,Initialization函数生成哈夫曼树,主函数。
四、详细设计
1.数据存储结构设计
(1)哈夫曼节点
哈夫曼节点数据类型如下,包含字符,权值,父节点,左右孩子:
typedefstruct{
charch;
unsignedintweight;
unsignedintparent,lchild,rchild;
}HTNode,*HfmTree;
(2)哈夫曼编码
哈夫曼编码用二级指针存储,动态分配空间:
typedefchar**HfmCode;
2.算法的设计思想
(1)Select函数
voidSelect(HfmTreeHT,inta,int&s1,int&s2){
//选择出parent为0的两个权值最小的两个节点,s1节点权值小于s2节点
inti,temp;
i=0;
while(HT[++i].parent!
=0);
s1=i;
while(HT[++i].parent!
=0);
s2=i++;
if(HT[s1].weight>HT[s2].weight){
temp=s1;
s1=s2;
s2=temp;
}
for(;i<=a;i++){
if(HT[i].parent==0)
if(HT[i].weightelseif(HT[i].weight}
}//选出权值最小且无父节点的节点,选择范围为i-a;
(2)Initialization函数
voidInitialization(HfmTree&HT,HfmCode&HC,intn,stringch,int*w)
{
inti,m,s1,s2,start,c,f;
//iHTNode位置,m为哈夫曼树节点数,s1s2选择节点,start开始点,c当前节点,f父节点
char*cd;
if(n<=1)return;
m=2*n-1;
HT=(HfmTree)malloc((m+1)*sizeof(HTNode));//0号单元使用
for(i=1;i<=n;i++){
HT[i].ch=ch[i-1];
HT[i].weight=w[i-1];
HT[i].parent=0;
HT[i].lchild=0;
HT[i].rchild=0;
}//初始化叶子节点
for(;i<=m;i++){
HT[i].ch='0';
HT[i].weight=0;
HT[i].parent=0;
HT[i].lchild=0;
HT[i].rchild=0;
}//----------------为什么不能批量赋值----------!
!
for(i=n+1;i<=m;i++){//建立哈夫曼树
Select(HT,i-1,s1,s2);
HT[s1].parent=i;
HT[s2].parent=i;
HT[i].lchild=s1;
HT[i].rchild=s2;
HT[i].weight=HT[s1].weight+HT[s2].weight;
}
HC=(HfmCode)malloc((n+1)*sizeof(char*));
cd=(char*)malloc(n*sizeof(char));
cd[n-1]='\0';
for(i=1;i<=n;i++){
start=n-1;
for(c=i,f=HT[i].parent;f!
=0;c=f,f=HT[f].parent){
if(HT[f].lchild==c){
cd[--start]='0';
}else{
cd[--start]='1';
}
HC[i]=(char*)malloc((n-start)*sizeof(char));
strcpy(HC[i],&cd[start]);
}
}
free(cd);
cout<<"生成成功!
"<cout<<"ID\tchar\t"<<"weight"<<"\t"<<"parent"<<"\t"<<"lchild"<<"\t"<<"rchild"<<"\t"<for(i=1;i<2*n;i++){
cout<
}
cout<<"char\t"<<"Code\t"<for(i=1;i<=n;i++){
cout<}
}
//生成,前半部分为生成哈夫曼树,调用Select得出权值最小的两项,计算权值
//后半部分为哈夫曼编码生成,从后到前生成,动态分配空间大小
3.源程序
#include
#include
#include
usingnamespacestd;
typedefstruct{
charch;
unsignedintweight;
unsignedintparent,lchild,rchild;
}HTNode,*HfmTree;
typedefchar**HfmCode;
voidSelect(HfmTreeHT,inta,int&s1,int&s2){
//选择出parent为0的两个权值最小的两个节点,s1节点权值小于s2节点
inti,temp;
i=0;
while(HT[++i].parent!
=0);
s1=i;
while(HT[++i].parent!
=0);
s2=i++;
if(HT[s1].weight>HT[s2].weight){
temp=s1;
s1=s2;
s2=temp;
}
for(;i<=a;i++){
if(HT[i].parent==0)
if(HT[i].weightelseif(HT[i].weight}
}
voidInitialization(HfmTree&HT,HfmCode&HC,intn,stringch,int*w)
{
inti,m,s1,s2,start,c,f;
//iHTNode位置,m为哈夫曼树节点数,s1s2选择节点,start开始点,c当前节点,f父节点
char*cd;
if(n<=1)return;
m=2*n-1;
HT=(HfmTree)malloc((m+1)*sizeof(HTNode));//0号单元使用
for(i=1;i<=n;i++){
HT[i].ch=ch[i-1];
HT[i].weight=w[i-1];
HT[i].parent=0;
HT[i].lchild=0;
HT[i].rchild=0;
}//初始化叶子节点
for(;i<=m;i++){
HT[i].ch='0';
HT[i].weight=0;
HT[i].parent=0;
HT[i].lchild=0;
HT[i].rchild=0;
}//----------------为什么不能批量赋值----------
for(i=n+1;i<=m;i++){//建立哈夫曼树
Select(HT,i-1,s1,s2);
HT[s1].parent=i;
HT[s2].parent=i;
HT[i].lchild=s1;
HT[i].rchild=s2;
HT[i].weight=HT[s1].weight+HT[s2].weight;
}
HC=(HfmCode)malloc((n+1)*sizeof(char*));
cd=(char*)malloc(n*sizeof(char));
cd[n-1]='\0';
for(i=1;i<=n;i++){
start=n-1;
for(c=i,f=HT[i].parent;f!
=0;c=f,f=HT[f].parent){
if(HT[f].lchild==c){
cd[--start]='0';
}else{
cd[--start]='1';
}
HC[i]=(char*)malloc((n-start)*sizeof(char));
strcpy(HC[i],&cd[start]);
}
}
free(cd);
cout<<"生成成功!
"<cout<<"ID\tchar\t"<<"weight"<<"\t"<<"parent"<<"\t"<<"lchild"<<"\t"<<"rchild"<<"\t"<for(i=1;i<2*n;i++){
cout<
}
cout<<"char\t"<<"Code\t"<for(i=1;i<=n;i++){
cout<}
}
intmain(){
ifstreaminput_file;
ofstreamoutput_file;
charaction;
stringtoBeTranSource,textFileSource;
stringcharsIn,code;
inti,j,c,n,w[100];
HfmTreeHT;
HfmCodeHC;
while(action!
='Q'){
cout<cout<<"*哈夫曼编码/译码器*"<cout<<"**"<cout<<"*I.初始化E.编码D.译码/P.印码/T.印树*"<cout<<"*C.清屏*"<cout<<"*Codebywhocaresu16/12/2010*"<cout<<"**********************************************"<cout<";
cin>>action;
action=toupper(action);
switch(action){
case'I':
//输入信息
cout<<"请输入字符数:
";
cin>>n;
cout<<"请输入字符组(紧密输入不用空格区分):
";
getline(cin,charsIn);
getline(cin,charsIn);
cout<<"输入各个权重(中间空格):
";
for(i=1;i<=n;i++){
cin>>w[i-1];
}
Initialization(HT,HC,n,charsIn,w);
//输出备份到文件
cout<<"正在输出备份到hfmTree.txt..."<output_file.open("hfmTree.txt");
if(!
output_file){
system("cls");
cout<<"Can'topenfile!
"<}
output_file<output_file<for(i=0;ioutput_file<}
output_file<<"--------以下为具体编码信息--------"<output_file<<"Char\tCode\t"<for(i=1;i<=n;i++){
output_file<}
output_file.close();
cout<<"备份到hfmTree.txt成功!
"<;break;
case'E':
//判断内存中是否有生成哈夫曼树,没有的话从文件读入
if(sizeof(HC)<5){
cout<<"内存中不存在哈夫曼树,从hfmTree.txt读入!
"<input_file.open("hfmTree.txt");
if(!
input_file){
system("cls");
cout<<"Can'topenfile!
"<}
input_file>>n;
getline(input_file,charsIn);
for(i=1;i<=n;i++){
input_file>>w[i-1];
}
input_file.close();
Initialization(HT,HC,n,charsIn,w);
}
input_file.open("ToBeTran.txt");
if(!
input_file){
system("cls");
cout<<"Can'topenfile!
"<}
cout<<"-------从ToBetTran.txt读取数据为--------"<getline(input_file,toBeTranSource);
cout<input_file.close();
cout<<"----------------------------------------"<output_file.open("CodeFile.txt");
if(!
output_file){
system("cls");
cout<<"Can'topenfile!
"<}
cout<<"------编译的密文(输出到CodeFile.txt)----"<for(i=0;i<=toBeTranSource.length();i++){
for(j=1;j<=n;j++){
if(toBeTranSource[i]==HT[j].ch){
cout<output_file<}
}
}
output_file.close();
cout<;break;
case'D':
//译码
input_file.open("CodeFile.txt");
if(!
output_file){
system("cls");
cout<<"Can'topenfile!
"<return1;
}
cout<<"------------读取的编码为----------------------"<getline(input_file,code);
cout<input_file.close();
cout<<"----------------译码为--------------------"<c=2*n-1;
output_file.open("TextFile.txt");
for(i=0;i<=code.length();i++){
if(HT[c].lchild==0){
cout<c=2*n-1;
}
if(code[i]=='0')c=HT[c].lchild;
elsec=HT[c].rchild;
}
cout<cout<<"-------------------------------------------"<;break;
case'C':
system("cls");
break;
default:
cout<"<}
}
system("pause");
return0;
}
五、调试分析
1.测试数据列表:
(1)利用教科书例6-2的数据调试程序:
0.05,0.29,0.07,0.08,0.14,0.23,0.03,0.11
(2)用下表给出的字符集和频度的实际统计数据建立赫夫曼树,并实现以下报文的编码和译码:
“THISPROGRAMEISMYFAVORITE”。
abcdefghijklmnopqrstuvwxyz
18664132232103211547571532205763151485180238181161
2.测试数据运行结果
以下是程序运行的界面截图,显示了运行的一些主要过程。
程序运行主界面
Test1:
-----------------------------------------------例6-2数据测试---------------------------------------------
测试数据截图
Test2:
基本功能测试
-----------------------------------------------I.初始化测试----------------------------------------------
27abcdefghijklmnopqrstuvwxyz
18664132232103211547571532205763151485180238181161
生成树信息反馈截图
hfmTree.txt中信息得到保存
生成的哈夫曼编码截图
初始化测试完毕-
-----------------------------------------E.编码测试-------------------------------------------------------------
读入hfmTree.txt中的信息生成哈夫曼树
生成哈夫曼树的相关信息见I.初始化测试
编译信息成功输出到CodeFile.txt
Codefile.txt
编码测试结束
-----------------------------------------------------D.译码测试-----------------------------------------------
译码测试结束
测试结束
六、课程设计总结及心得体会
不得不说,这个是目前做到的最复杂的一个程序,与停车场相比,它的函数,数据存储结构的定义少了不少,但是其复杂度却比停车场有过之无不及,文件操作比较复杂,为此我查阅了相关资料,做到了基本能够实现文件的读取和写入,程序中依然存在一个问题,那就是它只能读取一段文字,遇到回车会终止读入,这也局限了程序的使用面。
在开发哈夫曼编译器的时候,发现一个整体概念很重要,要很清晰地知道它具体是怎么运作的。
双亲结点,