登录
2018-06-15 00:06:10

无损数据压缩 费编辑 添加义项名

B 添加义项
?
义项指言太多义词的不同概念,如李娜的义项:网球运动员、歌手等;来自诚勿扰的义项:冯小刚执导电影360百科、江苏卫视交友节目等。 查看详细规范>>
所属类别 :
生活日用品
生活日用品
编辑分类

无损数据压缩(Lossless Data Compression) 是指使用压缩后的数据进行重构(或者叫做还原、解压缩),重构后的数据与原来的数据完全相同。

基本信息

  • 中文名

    无损数据压缩

  • 外文名

    Lossless Data Compression

  • 特点

    压缩比小于有损数据压缩的压缩比

  • 程度

    1/2~1/4

号编引雷古动亮两卷含措折叠 编辑本段 定义与特点

无损压简愿顾上用于要求重构的信号与原始信号完全一致的场合。也就季依编洲去目是说数据经过压缩后信息不受损失,还能完全恢复到压缩前的原样。它有损数据压缩相对。这种压缩每分体宽式这推占管阶认通常压缩比小于有损数据压缩的压色批皇源帮保红林缩比。

一个很常见的例子是磁盘文件的压缩。根据目前的技术水平,无损压缩算法一般可以把普通文件的数据压缩原来的1/2~1/4。一些常用的无损压缩算法有霍夫曼(Huffman)算法和LZW(Lenpel-Ziv & Welch)压缩算法。

折叠 编辑本段 编码技术

观头程香农-范诺编码

最早阐述和实现这种编码的是Shannon(1948年)和Fano(194品社儿肉需革校9年),因此被称为香农-范诺(S余除见觉营最短盐hannon-Fano)算法。

这种方法采用从上到船龙余省景告分王球易质下的方法进行编码。首先按照符号出现的频度或概率排序,见克标满迫除例如,A、B、C、D氧八物和E,如表1所示。然后使用递归方法分成两个部分,每一部分具有近似相同的次数。按照这种方法进行编码得到的总位数为91。压缩比约为1.3 : 1。

表1 Shannon-Fano合事亮宁结算法举例表

符号

出现的次数(Pi)

log2(1/P)

分配的代码

需要的位数

A

15 (0.375)

1.415取最名什较里夜才状受0

00

30

B

7 (0.175)

2.5145

01

14

C

7 (0.175控般)

2.5145

10

14

D

6 (0.150)

2.7369

110

范无础本父医18

E

5 (0.125)

3.0000

111

15

霍夫曼编码

霍夫曼(Huffman)在1952年提出了另一种编码方法,即从下到上的编码方法。现仍以一个具体的例子说明它的编码步骤:

  1. 初始化,根据符号概率的大小按由大到小顺序对符号进行排序。
  2. 把概率最小的两个符号组成一个节点,如D和E组成节点P1。
  3. 重复步骤2,得到节点P2、P3和P4,形成一棵"树",其中的P4称为根节点。
  4. 从根节点P4开始到相应于每个符号的"树叶",从上到下标上"0"(上枝)或者"1"(下枝),至于哪个为"1"哪个为"0"则无关紧要,最后的结果仅仅是分配的代码不同,而代码的平均长度是相同的。
  5. 从根节点P4开始顺着树枝到每个叶子分别写出每个符号的代码,如表2所示。

名烈充2 霍夫曼编码举例

符号

出现的次数

log2(1/pi)

分配的代码

需要的位数

A

15(0.3846业首非零业略注使维速海)

1.38

0

15

B

7(0.1795)

2.48

100

21

C

6(0.1538)

2.70

101

18

D

6(0.1538)

2.70

110

18

E

5(0.1282)

2.96

111

15

霍夫曼码的实鲁图码长虽然是可变的,但却不需要另外附加同步代码。例如,码串中的第1位为0,那肯定是符号A,因为表示其他符号的代码没有一个是以0开始的,因此下一位就表示下一个符号代码的第1位。同样,如果出现"110",那么它就代表符号D杀屋呢毛烈落采最。如果事先编写出一本解释各种代码意义的"词典",他消作细火包专确即码簿,那么就可以根据码簿逐个码进行译码

术编码

算术编码在图像数据压缩标准(如JPEG、JB增变沙般油IG)中扮演了重要的角色。在算术编码中,消息用0到1之间的实数进行编码,算术编码用到两个基本的参数:符号的概率和它的编码间隔。易是符号的概率决定压缩编码的效率,也决定编码过程中信源符号的间隔,而这些间隔包含在0到1之间。编码过程中的间隔决定了符号压缩后的守排听资规输出。

RLE编码

现实中有许多这样的图像,在一幅图像中具有许多颜色相同的图块。在这些图块中,许多行上都具有相同的颜色,或者在一行上有许多进么破胶喜倍守福景连续的象素都具有相同的颜色值。在这种情况下就不需要存储每一个象素的颜色值,而仅仅存储一个象素的颜色值,以及具有相同颜色的象素数目就可以,或者存储一个象素的颜色值,收鲁以及具有相同颜色值的行数。这种压缩编码称为行程编码,常用(岩风源它run length encoding,R家道鱼卷基哥欢集LE)表示,具有相同费钢另硫逐言技颜色并且是连续的象素频川买老触数目称为行程长度

词典编码

词典编码(dictionary encoding)的根据是数据本身包含有重复代码这个特性。例如文本文件和光栅图像就叶德国交径朝管育后助具有这种特性。词典编码法的种类很多,归纳起来大致有两类。

第一类词典法的想法是企图查找正在压缩的字符序列是否在以前输入的数据中出现过,然后用已经出现过的字符串替代重复的部分,它的输出仅仅是指向早期出现过的字符串的"指针"。这里所指的"词典"是指用以前处理过的数据来表示编码过程中遇到的重复部分。这类编码中的所有算法都是以Abraham LempelJakob Ziv在1977年开发和发表的称为LZ77算法为基础的,例如1982年由Storer和Szyman停施婷失波搞移钱也少ski改进的称为LZSS算法就是属投缺火只孩斯继包据杆举于这种情况。

第二类算法的想法是企图从输入的数据中创建一个"短语词典(dictionary of the phrases)",这种短语不一定是像"严体烈的转权她声严谨勤奋求实创新"和"国泰民安是坐稳总统宝座的根本"这类具有具体含义的短语,它可以是任意字符的组合。编码数据过程中当遇到已经在词典中出现的"短语"时,编码器就输出这个词典中的短语的"索引号",而不是短语本身。

折叠 编辑本段 常见格式

图片格式

  • Gif
  • PNG
  • TIFF

音频格式

  • Ape
  • Flac
  • TTA
  • 被之WV

视频格式

  • Huffyuv

阅读全文

热点资讯

我的关注