huffman编码的matlab实现Word格式.doc
《huffman编码的matlab实现Word格式.doc》由会员分享,可在线阅读,更多相关《huffman编码的matlab实现Word格式.doc(3页珍藏版)》请在冰点文库上搜索。
pleaseinputanumber:
'
)%提示输入界面
n=length(p);
fori=1:
n
ifp(i)<
fprintf('
\nTheprobabilitiesinhuffmancannotlessthan0!
\n'
);
p=input('
)%如果输入的概率数组中有小于0的值,则重新输入概率数组
end
end
ifabs(sum(p)-1)>
fprintf('
\nThesumoftheprobabilitiesinhuffmancanmorethan1!
p=input('
)%如果输入的概率数组总和大于1,则重新输入概率数组
end
q=p;
a=zeros(n-1,n);
%生成一个n-1行n列的数组
n-1
[q,l]=sort(q)%对概率数组q进行从小至大的排序,并且用l数组返回一个数组,该数组表示概率数组q排序前的顺序编号
a(i,:
)=[l(1:
n-i+1),zeros(1,i-1)]%由数组l构建一个矩阵,该矩阵表明概率合并时的顺序,用于后面的编码
q=[q
(1)+q
(2),q(3:
n),1];
%将排序后的概率数组q的前两项,即概率最小的两个数加和,得到新的一组概率序列
end
c(i,1:
n*n)=blanks(n*n);
%生成一个n-1行n列,并且每个元素的的长度为n的空白数组,c矩阵用于进行huffman编码,并且在编码中与a矩阵有一定的对应关系
c(n-1,n)='
0'
;
%由于a矩阵的第n-1行的前两个元素为进行huffman编码加和运算时所得的最
c(n-1,2*n)='
1'
后两个概率,因此其值为0或1,在编码时设第n-1行的第一个空白字符为0,第二个空白字符1。
fori=2:
c(n-i,1:
n-1)=c(n-i+1,n*(find(a(n-i+1,:
)==1))-(n-2):
n*(find(a(n-i+1,:
)==1)))%矩阵c的第n-i的第一个元素的n-1的字符赋值为对应于a矩阵中第n-i+1行中值为1的位置在c矩阵中的编码值
c(n-i,n)='
%根据之前的规则,在分支的第一个元素最后补0
c(n-i,n+1:
2*n-1)=c(n-i,1:
n-1)%矩阵c的第n-i的第二个元素的n-1的字符与第n-i行的第一个元素的前n-1个符号相同,因为其根节点相同
c(n-i,2*n)='
%根据之前的规则,在分支的第一个元素最后补1
forj=1:
i-1
c(n-i,(j+1)*n+1:
(j+2)*n)=c(n-i+1,n*(find(a(n-i+1,:
)==j+1)-1)+1:
n*find(a(n-i+1,:
)==j+1))%矩阵c中第n-i行第j+1列的值等于对应于a矩阵中第n-i+1行中值为j+1的前面一个元素的位置在c矩阵中的编码值
end
end%完成huffman码字的分配
n
h(i,1:
n)=c(1,n*(find(a(1,:
)==i)-1)+1:
find(a(1,:
)==i)*n)%用h表示最后的huffman编码,矩阵h的第i行的元素对应于矩阵c的第一行的第i个元素
ll(i)=length(find(abs(h(i,:
))~=32))%计算每一个huffman编码的长度
l=sum(p.*ll);
%计算平均码长
\nhuffmancode:
h
hh=sum(p.*(-log2(p)));
%计算信源熵
fprintf('
\nthehuffmaneffciency:
t=hh/l%计算编码效率
2、程序运行结果
三、结论
Huffman编码的特殊之处在于,它是根据每一个源字符出现的估算概率而建立起来的,就是说出现概率高的字符使用较短的编码,反之出现概率低的则使用较长的编码,这便使编码之后的字符串的平均期望长度降低,从而达到无损压缩数据的目的。
四、练习
一、
P473.1
(1)3.3只算二进制huffman码
二
译码的实现
二、
可视化页面的生成