DATA COMPRESSING AND DECOMPRESSING METHOD, PROGRAM, STORAGE MEDIUM, AND ELECTRONIC PRODUCT

Title:

DATA COMPRESSING AND DECOMPRESSING METHOD, PROGRAM, STORAGE MEDIUM, AND ELECTRONIC PRODUCT

Document Type and Number:

WIPO Patent Application WO/2013/033895

Kind Code:

A1

Abstract:

A data compressing and decompressing method, a program, a storage medium, and an electronic product. The data compressing method in the present invention comprises the steps of: analyzing an initial character string of data so as to select a transform algorithm applicable to the initial character string, the transform algorithm being an algorithm that can extend a run length of a character string; applying the selected algorithm to the initial character string so as to obtain a new character string with a greater run length; adding a character for recoding the transform algorithm to the new character string; and obtaining a run length of the new character string by performing run length encoding on the new character string, so as to obtain compressed data.

Inventors:

CUI JUN (CN)

Application Number:

PCT/CN2011/079417

Publication Date:

March 14, 2013

Filing Date:

September 07, 2011

Export Citation:

Click for automatic bibliography generation Help

Assignee:

SQUYA INC (US)
CUI JUN (CN)

International Classes:

H03M7/30

Foreign References:

CN101198056A	2008-06-11
US20100117875A1	2010-05-13
CN101039374A	2007-09-19

Attorney, Agent or Firm:

ZHONGZI LAW OFFICE (CN)
北京市中咨律师事务所 (CN)

Download PDF:

View/Download PDF PDF Help

Claims:

权利要求

1. 一种数据压缩方法，包括以下步骤：

对数据的初始字符序列进行分析，以选择适用于所述初始字符序列的变换算法，所述变换算法为通过一定的变换可以使字符序列的游程长度变长的算法；将选出的变换算法用于所述初始字符序列，从而获得具有长游程长度的新字符序列；对所述新字符序列添加用于记录所述变换算法的字程序列，从而获得压缩数据。

2.根据权利要求 1的方法，所述初始字符序列为二进制数，所述变换算法包括以下一种算法或几种算法的组合：

将初始字符序列在规律数位的字符进行反相；

将初始字符序列的相邻的 n位字符整体交换， n为大于等于 2的整数; 以及

对初始字符序列中的固定字符组合进行约定替换。

3.根据权利要求 2的方法，所述将初始字符序列在规律数位的字符进的位进行反相。

4.根据权利要求 1或 2的方法，所述变换算法是对同样的字符序列连续进行多个不同变换的多个不同算法的组合或者是用于初始字符序列中的不同字段的字符序列的多个不同算法的组合。

5.根据权利要求 1或 2的方法，其中对数据的初始字符序列进行分析包括对所述初始字符序列穷举应用多种变换算法，并比较各个变换算法能够获得的压缩比，以获得使数据压缩比最优的变换算法。

6.根据权利要求 1或 2的方法，其中对数据的初始字符序列进行分析包括在所述初始字符序列中搜索特定变换算法所针对的特定的字符型，并比较各个变换算法的搜索结果，从而确定适用的变换算法。

7. 一种数据解压缩方法，包括：对于根据权利要求 1-6中任一项所述的方法获得的压缩数据，通过游程编码的逆运算从所述压缩数据的游程序列获得所述新字符序列，获取记录的所述变换算法，对所述新字符序列应用所述变换算法的逆运算，从而获得所述数据的初始字符序列。

8. 一种计算机程序，所述程序包括适合于使数据处理装置执行根据权利要求 1-6中任一项的数据压缩方法和 /或根据权利要求 7的数据解压缩方法的指令。

9. 一种包含计算积序的存储介质，其中所述程序使得，当向该存储介质存储初始数据时，对所述初始数据执行根据权利要求 1-6中任一项的数据压缩方法，从而获得该初始数据的压缩数据；当从该存储介质向外部复制所述初始数据时，对所述压缩数据执行根据权利要求 7所述的数据解压缩方法，从而将所述压缩数据解压缩为所述初始数据。

10. 一种电子产品，其包括根据权利要求 9的存储介质。

Description:

数据压缩和解压缩方法、程序、存储介质及电子产品技术领域

本发明涉及对数据的压缩、解压缩方法，以及相关的程序、存储介质以及电子产品，本发明尤其涉及对压缩数据的无损再压缩。背景技术

随着计算机、互联网的迅 ii ，数据存储和网上数据传输量剧增，而视频流量将会占到网络流量的 90%，网络拥挤和堵塞日趋严重。依靠加大带宽和传输提速是目前解决网^ 输问题的推动方案。这些方案需要巨大的投资和时间来实现。发明一种对数据、特别是对已压缩的数据进行高速、压缩比较优的无损压缩技术，将会对 IT领域产生重大影响，实现在现有条件下极大地增强数据存储和网络传输数据的能力、减小投资和节省时间、提高数据传输的品质的目的。发明内容

本发明提供一种对数据 (包括各种格式的已压缩文件）进行压缩的方法，包括以下步骤：对数据的初始字符序列进行分析，以选择适用于所述初始字符序列的变换算法，所述变换算法为通过一定的变换可以使字符序列的游程长度变长的算法；将选出的变换算法用于所述初始字符序列，从而获得具有较长游程长度的新字符序列；对所述新字符序列添加用于记录所述变换算法的字符；以及通过对所述新字符序列进行游程编码而获得所述新字符序列的游程序列，从而获得压缩数据。

根据本发明的优选方法，所述初始字符序列为二进制数，所述变换算法包括以下一种算法或几种算法的组合：将初始字符序列在规律数位的字符进行反相，其可以为将初始字符序列的偶数位反相或者将初始字符序列的每间隔两位的位进行反相等；将初始字符序列的相邻的 n位字符整体交换， n为大于等于 2的整数；以及对初始字符序列中的固定字符组合进行约定替换。

根据本发明的优选方法，所述变换算法是对同样的字符序列连续进行多个不同变换的多个不同算法的组合或者是用于初始字符序列中的不同字段的字符序列的多个不同算法的组合。

根据本发明的优选方法，其中对数据的初始字符序列进行分析包括：对所述初始字符序列穷举应用多种变换算法，并比较各个变换算法能够获得的压缩比，以获得使数据压缩比最佳的变换算法，或者在所述初始字符序列中搜索特定的字符型，并比较各个变换算法的搜索结果，从而确定适用的变换算法。其中对数据的初始字符序列进行分析包括对所述初始字符序列进行分段分析。

根据本发明另一方面，提供了一种数据解压缩的方法，包括：对于根据上面所述的方法获得的压缩数据，通过游程编码的逆运算从所述压缩数据的游程序列获得所述新字符序列，获取记录的所述变换算法，对所述新字符序列应用所述变换算法的逆运算，从而获得所述数据的初始字符序列。

本发明还提供一种计算机程序，所述程序包括适合于使数据处理装置执行上述压缩方法和 /或数据解压缩方法的指令。

本发明还提供一种包含计算机程序的存储介质，其中所述程序使得，当向该存储介质存储初始数据时，对所述初始数据执亍根据本发明的压缩方法，从而获得该初始数据的压缩数据；当从该存储介质向外部复制所述初始数据时，对所述压缩数据执行根据本发明的解压缩方法，从而将所述压缩数据解压缩为所述初始数据。压缩为无损压缩，遵守数据传输的协议。

本发明还提供一种电子产品，其包括根据上述的存储介质。

本发明实现了对数据（包括压缩数据）的无损再压缩，大大降低了数据存储成本，加速了数据网^ "输，特别是在流媒体网^ ·输的多方面应用，如视频、音频、图像、文件等传输，具有巨大价值。附图说明

图 1是根据本发明的数据压缩方法的流程图。具体实施方式

下面参考附图说明本发明的具体实施例。本领域技术人员可以理解，下文中的具体实施例只是用于更好地说明本发明，而不是限制本发明的范围。

在图 1的步骤 1中，首先对将要压缩的初始数据进行数据分析。

在计算机系统中使用的数据是二进制数，这里将初始数据选择为二进制的字符序列，以便于说明。本申请对压缩数据进行进一步的压缩具有极强的独有功能，但是，本申请的方法同样可用于未经压缩的数据。

在此，例如，将通过本发明的方法压缩的数据序列为，

010101，该数据为压缩数据序列。对于该数据序列可以应用多种变换算法，所述变换算法为通过一定的变换可以使字符序列的游程长度变长的算法。

例如，第一种变换算法为，将数据序列的偶数位反相，上述序列的偶数位反相后的新的序列为：

000000 显然，新数据序列中出现了多个长游程长度，从而可以对其再压缩。

第二种变换算法为，将数据序列每间隔两位进行反相，对上述初始数据序列进行该变换后得到的新的数据序列为：

000111 变换后的新数据序列中也出现了一些长游程长度，即也可再压缩。

第三种变换算法为，将数据序列的相邻 n位字符进行交换， n为大于等于 2的整数，例如，对上述初始数据序列进行将数据序列的相邻三位字符进行交换的变换后得到的新的数据序列为：

010101 同样地，变换后的新数据序列中出现多处长游程长度，从而可再压缩。

第四种变换算法为，对数据序列中的固定字符组合进行约定替换，例如，将初始数据中的 "10"替换为 1，将 "11"替换为 0, 对上述初始数据序列进行该变换后得到的新的数据序列为：

1000111100001001111000101101010001000110111 变换后的新数据序列中同样出现多处长游程长度，从而可再压缩。

上述的几种变换算法只是示例性的，本领域技术人员基于该内容可以设计出更多的变换算法，变换算法可以更加复杂，可以是计算公式形式的变换，可以是对同样的字符序列连续进行多个不同变换的多个不同算法的组合，也可以是用于初始字符序列中的不同字段的字符序列的多个不同算法的组合，只要其最终可以使数据的游程长度变长即可。

从上述几种变换算法的示例中，本领域技术人员也可以看出，这几种变换算法对于同一个数据来说是存在优劣的。例如，上述初始数据在经过第一种变换后明显比经过第二种变换后具有更长的游程长度，从而更有利于数据的压缩。因此，需要对将要压缩的初始数据进行分析，以选择出最适合于该数据的变换算法。当分析初始数据时，可以对所述初始数据穷举应用多种变换算法，并比较各个变换算法能够获得的压缩比，以获得使数据压缩比最优的变换算法，还可以在所述初始字符序列中搜索特定变换算法所针对的特定的字符型，并比较各个变换算法的搜索结果，从而确定适用的变换算法。本领域技术人员据此还可想到其他用于分析数据以获得与其匹配的变换算法的方法，其都包括在本发明的范围内。

在图 1的步骤 2中，将选定的变换算法应用于初始数据，以对数据进行变换。这里，如上文所述，选定的变换算法可以是单个算法，也可以是多种算法的组合，这根据具体初始数据的情况而确定。

在图 1的步骤 3中，在变换后的数据序列中记录变换算法。例如，可以对多种变换算法进行编号，并将编号的标记添加到变换后的数据序列中，从而记录所述变换算法。

在图 1的步骤 4中，对变换后的数据进行游程编码，以实现对数据的压缩，例如经过第一种变换后的数据序列可以表示为游程序列：

2 2 11 2 2 1 3 11 2 3 5 4 1 2 2 4 1 1 5 6, 在步骤 5中，将上述游程序列用二进制数表示出来即为压缩后的数据。

根据本发明的解压缩方法即为上述压缩方法的逆过程，包括：对于通过上述压缩方法获得的压缩数据，通过游程编码的逆运算从所述压缩数据的游程序列获得所述变换后的数据序列，获取记录的所述变换算法，对所述变换后的数据序列应用所述变换算法的逆运算，从而获得所述数据的初始数据序列。

由于本发明的压缩和解压缩方法通过对数据的变换来获得压缩的效果，而并没有对初始数据有任何删减或损坏，因此本发明的压缩方法是一种无损压缩方法。

根据本发明的压缩方法和解压缩方法都可以实施为计算机程序的形式。本发明还可以实施为包含计算积序的存储介质，其中所述程序为：当向该存储介质存储初始数据时，对所述初始数据 Μ亍根据本发明的压缩方法，从而获得该初始数据的压缩数据；当从该存储介质向外部复制所述初始数据时，对所述压缩数据执行根据本发明的解压缩方法，从而将所述压缩数据解压缩为所述初始数据。这里所述的存储介质可以是闪存器、光盘或本领域技术人员的其他存储装置。

本发明还可以实施为各种电子产品，其包括根据本发明的存储介质，从而在复制数据或从网络下载数据时可以以小数据量存储数据，同时在解压缩时恢复到原数据而不会对原数据有任何损坏。所述电子产品的实例可以为智能手机、 MP4播放器或本领域技术人员公知的其他电子装置。

通过本发明的压缩方法，可以实现对已压缩数据的进一步无损压缩，可以实现至少为 50%的压缩比，并能高速压缩，从而大大降低了数据存储成本，并且也大大加速了数据网^ ^输速度，从而可以显著改善流媒体传输、实时播放等多方面应用。

本发明的压缩方法适用于计算机的各种文件格式。

Previous Patent: ANTENNA ASSEMBLY

Next Patent: STAIRCASE AND DRIVER'S CAB