Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
PROCESSING METHOD FOR CONTEXT CHANGE TO SHIELD SENSITIVITY OF DIGITAL CONTENTS
Document Type and Number:
WIPO Patent Application WO/2012/068713
Kind Code:
A1
Abstract:
The present invention relates to a novel method for processing digital contents. The processing method in the present invention extracts elements from original digital contents by using segmentation and extraction technologies. The method includes the following features: (A) identifying and labeling said elements; (B) recomposing said elements to form new digital contents; (C) assigning processing requirements to said new digital contents, wherein the processing requirements include time processing requirements, geographical space processing requirements, precision processing requirements, and so on, assigned to said recomposed new digital contents; (D) distributing said recomposed new digital contents to multiple different processing points for processing. By this manner, the context structure of said original digital contents is changed; thereby the original meaning of said original digital contents is changed or shielded. Compared with the prior art, the present invention has the advantages of eliminating secrecy or privacy sensitivity of original digital contents without changing partial cognition and fidelity of the digital contents elements, and enabling any artificial processing or automatic processing on said partial contents to be carried out in the environment of non-strict secrecy control.

Inventors:
GUAN JUN (CN)
GUAN LIAN (CA)
Application Number:
PCT/CN2010/078934
Publication Date:
May 31, 2012
Filing Date:
November 22, 2010
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
GUAN JUN (CN)
GUAN LIAN (CA)
International Classes:
G06F40/00
Foreign References:
JP2005025553A2005-01-27
CN101840485A2010-09-22
CN1689040A2005-10-26
CN101359333A2009-02-04
Attorney, Agent or Firm:
GUANGZHOU ZHONGJUNXIONGJIE INTELLECTUAL PROPERTY AGENCY CO., LTD. (CN)
广州中浚雄杰知识产权代理有限责任公司 (CN)
Download PDF:
Claims:
权利要求书

1、 一种改变上下文以屏蔽数字内容敏感度的处理方法,是通过分割和提 取技术, 将原有数字内容中的单元体提取出来, 其特征在于: (A)、 对于所述的单元体进行标识和注记; (B)、 将所述的单元体重新组合 形成新的数字内容; (C)、 对所述新的数字内容赋予处理的要求, 包 括对重组后的所述新的数字内容规定的时间处理要求,地理空间处理 要求和精度处理等要求; (D)、 将所述的重新组合形成所述新的数字 内容分配到不同的多个处理点上去处理;以这种方式来改变所述原有 数字内容的上下文结构,从而改变或屏蔽了所述原有数字内容的原始

2、 根据权利要求 1 所述的改变上下文以屏蔽数字内容敏感度的处理方 法,其特征在于所述的单元体设计为唯一的所述原有数字内容的所述 单元体标识,所述单元体的提取方式, 要与所述的原有数字内容相互 具备逻辑关系或几何关系或物理关系,提取的所述单元体与所述原始 数字内容的要有相同的关键处理指标。

3、 根据权利要求 2 所述的改变上下文以屏蔽数字内容敏感度的处理方 法,其特征在于所述原始数字内容要有唯一的标识和各项关键处理指 标, 所述的各项关键处理指标包括: 进入系统的时间, 处理所述原始 数字内容的时间要求、 保密或隐私等级、 处理精确度要求等。

、 根据权利要求 1 所述的改变上下文以屏蔽数字内容敏感度的处理方 法, 其特征在于所述(A)到 (D)的步骤在功能上分为 3个子系统: 原 始数字内容处理子系统 (1 )、 数字内容重组子系统 (2 ) 和重组数字 内容处理子系统 (3)。

、 根据权利要求 4 所述的改变上下文以屏蔽数字内容敏感度的处理方 法, 其特征在于所述原始数字内容处理子系统 (1 ) 对进入系统的所 述原始数字内容进行唯一性的标识并且设置关键处理指标;对所述原 始数字内容根据内容的敏感部分或全部对所述原始数字内容进行统 一或者大小不一的分割截取。

、 根据权利要求 5 所述的改变上下文以屏蔽数字内容敏感度的处理方 法, 其特征在于所述原始数字内容处理子系统 (1 ) 对从所述原始数 字内容中提取的每个数字内容单元体,赋以唯一的所述数字内容单元 体标识, 记录所述数字内容单元体的提取方式, 提取的所述数字内容 单元体与所述原始数字内容的逻辑关系, 几何关系,物理关系, 提取 的所述数字内容单元体与所述原始数字内容要有相同的关键处理指 标, 并将这些数据存于所述原始数字内容处理子系统 (1 ) 的数据库 中。

、 根据权利要求 4 所述的改变上下文以屏蔽数字内容敏感度的处理方 法, 其特征在于所述的数字内容重组子系统 (2 ) 根据预先定义的所 述数字内容单元体重组规则,将所述数字内容单元体重组成新的数字 内容; 所述新的数字内容也有的唯一标识, 所述新的数字内容与其中 的所述数字内容单元体的关系记录于所述数字内容重组子系统 (2 ) 的数据库中。

、 根据权利要求 7 所述的改变上下文以屏蔽数字内容敏感度的处理方 法, 其特征在于所述的数字内容重组子系统 (2 ) 中的所述数字内容 单元体重组规则包括:

A1)将处理时间相近的所述数字内容单元体组成所述新的数字内容;

B1)根据精确度要求某些所述数字内容单元体可以多次或重复出现 在相同或 /和不同的重组所述新的数字内容中;

C1)建立处理所述新的数字内容的操作界面和参数。

、根据权利要求 4所述的改变上下文以屏蔽数字内容敏感度的处理方法, 其特征在于所述的重组数字内容处理子系统(3 )根据预先定义的重组 数字内容分配处理规则,将所述新的数字内容分配到不同的处理站点, 所述新的数字内容分配处理规则包括:

A2)将包含可能相关所述数字内容单元体的新内容分发到物理位置或 网络地址的地理位置等跨度大的不同处理站点去处理;

B2)将包含可能相关所述数字内容单元体的新内容在不同时间分发到 物理位置 (或网络地址的地理位置) 跨度大的不同处理站点去处理; C2)将包含可能相关所述数字内容单元体的新内容分发到较安全的专 业处理公司处理队列去处理。

、根据权利要求 9所述的改变上下文以屏蔽数字内容敏感度的处理方法, 其特征在于系统中的重组数字内容处理子系统(3 )每次处理完一个重 组数字内容后通知所述数字内容重组子系统 (2 ) ; 所述数字内容重组 子系统(2 )在接到每个原始数字内容的所有所述数字内容单元体处理 完信息后, 把一个完整的所述原始数字内容所需处理的所述数字内容 单元体信息返回到所述原始数字内容处理子系统 (1 ), 由所述原始数 字内容处理子系统 (1 ) 完成整个内容处理流程。

Description:
改^ ±下文以屏蔽数字内容敏感度的处理;^

技术领域 本发明涉及数字内容的一种新的处理方法。 它通过分割和提取原始数 字内容中的内容单元体, 并将从不同的原始内容中提取出的单元体进行 重 新组合形成新的数字内容使得原有数字内容中 的结构不再存在, 其敏感性 被屏蔽, 使得对该部分内容的任何人为或自动处理可以 在非严格保密控制 的环境下实行。 背景技术 所谓数字内容是指用数字方式记录和承载的一 切人类交流方式, 它包 括文字, 图形, 图像 (静态, 动态), 声音以及触觉。 数字内容由组成数字 内容的单元体, 比如, 字符, 词汇, 语音, 语调, 记录景象反射或发射电 磁波的强弱的像素值和这些单元体在数字内容 中的组成方式。 完整的数字 内容可以表达复杂和准确的意义。 数字内容可以被重新分割成单元体, 如 数字图像中的一个子图像和 /或一段子频谱, 语音中的一个片段和 /或语音 频谱中的一个子频道。 现有的数字内容处理方法, 由于个人隐私, 保密等 要求, 对某些数字内容的处理需要有特定的保密环境 或者对涉及处理的人 员有特殊的背景和行为要求。 但是如果我们改变数字内容的敏感度, 并且 通过一些特殊的处理, 由这些内容单元重新组合形成的新的数字内容 就不 再具有敏感内容,从而达到不需要在特定的保 密控制环境下进行信息处理。 例如, 某些银行信息:

姓名: 张三

出生日期: 1980年 9月 6日

地址: 中国, 天津市, 马场路 12345号

银行: 中国银行

账户号: 888-123450-9999

目前账号余额: 2345. 00

姓名: 李四

出生日期: 1976年 3月 16日

地址: 中国, 河北省, 保定市, 新村路 5678号

银行: 北京银行

账户号: 865-123450-1249

目前账号余额: 6793. 00

上述信息无论用何种形式表达 (语音, 文档, 图像) 它们完整的原始 内容都属于个人信息, 对其的访问与处理在现有的保密法律和法规下 都是 有限制性要求的。 但是如果将这些内容的信息单元从它们的相关 上下文中 间单独提取出来, 将它们重新混合形成多个新的数字内容。 而在不能收集 到全部新的数字内容同时不知道这些新的数字 内容与原始数字内容的关系 的情况下, 新的数字内容就不具有任何信息价值, 它们就不再具有任何值 得保密的意义。

比如以上信息可以分为若干新的数字内容表 达: 新数字内容 1

1980年 9月 6日, 1976年 3月 16日, 865, 888, 123450-9999, 123450-1249。 马场路 12345号, 新村路 5678号

新数字内容 2

姓名: 张三, 姓名: 李四

地址: 中国, 天津市, 地址: 中国, 河北省, 保定市

新数字内容 3

银行: 中国银行, 目前账号余额: 2345. 00, 银行: 北京银行, 目前账号余 额: 6793. 00

这些数字内容的敏感性已经降低了,如果不同 的原数字内容越多, 内容 单元划分得越小, 混合后形成的多个新的数字内容的保密敏感性 就越低。

在此之上, 我们还可以在大跨度的时间或地理位置的处理 点上去对新 的数字内容处理, 使得对此数据集的安全保密更加有效。 而对这些信息的 处理, 比如,文字(text )输入, 信息核对等等可以在非严格保密控制的环 境下实行, 对处理这些信息的人员也不必有特殊的要求。

发明内容

本发明的目的是要通过分割和提取数字内容中 的内容单元体, 并将从 不同的原始内容中提出的单元体进行重新组合 形成新的数字内容, 使得原 有数字内容的上下文在新的数字内容中不再存 在或者说被屏蔽。 在不改变 数字内容单元体的局部认知程度和保真度的前 提下达到消除原始数字内容 的保密或隐私敏感度, 使得对该部分内容的任何人为或自动处理可以 在非 严格保密控制的环境下实行。 本发明的目的是通过如下技术方案来实现的: 通过分割和提取技术, 将原有数字内容中的单元体提取出来, 其特征在于: (A)、对于所述的单元 体进行标识和注记; (B )、 将所述的单元体重新组合形成新的数字内容; (C)、 对所述新的数字内容赋予处理的要求, 包括对重组后的所述新的数 字内容规定的时间处理要求, 地理空间处理要求和精度处理等要求; (D)、 将所述的重新组合后形成的数字内容分配到不 同的多个处理点上去处理; 以这种方式来改变所述原有数字内容的上下文 结构和内容单元之间的相互 关系, 从而改变或屏蔽了所述原有数字内容的原始意 义。

本发明所述的内容单元体的表达设计包括: 对所述原有数字内容的所 述单元体进行唯一标识,对所述单元体的提取 方式和与所述的原有数字内 容相互具备的逻辑关系或几何关系或物理关系 进行表达, 对提取的所述单 元体与所述原始数字内容赋以相应的关键处理 指标。 所述的各项关键处理 指标包括: 进入系统的时间, 处理所述原始数字内容的时间要求、 保密或 隐私等级、 处理精确度要求等。

本发明的处理方式可以将所述 (A) 到 (D)的步骤在功能上分为 3个子 系统: 原始数字内容处理子系统(1 )、 数字内容重组子系统(2 ) 和重组数 字内容处理子系统 (3)。

本发明所述原始数字内容处理子系统(1 )对进入系统的所述原始数字 内容进行唯一性的标识并且设置关键处理指标 ; 对所述原始数字内容根据 内容的敏感部分或全部对所述原始数字内容进 行统一或者大小不一的分割 截取。 所述原始数字内容处理子系统(1 )对从所述原始数字内容中提取的 每个数字内容单元体, 赋以唯一的所述数字内容单元体标识, 记录所述数 字内容单元体的提取方式, 提取的所述数字内容单元体与所述原始数字内 容的逻辑关系, 几何关系,物理关系, 提取的所述数字内容单元体与所述原 始数字内容要有相同的关键处理指标, 并将这些数据存于所述原始数字内 容处理子系统 (1 ) 的数据库中。

本发明所述的数字内容重组子系统(2 )根据预先定义的所述数字内容 单元体重组规则, 将所述数字内容单元体重组成新的数字内容; 所述新的 数字内容也有的唯一标识, 所述新的数字内容与其中的所述数字内容单元 体的关系记录于所述数字内容重组子系统 (2 ) 的数据库中。

本发明所述的数字内容重组子系统中(2 )的所述数字内容单元体重组 规则包括:

A1)将处理时间相近的所述数字内容单元体组成 所述新的数字内容;

B1)根据精确度要求某些所述数字内容单元体 可以多次或重复出现 在相同或 /和不同的重组所述新的数字内容中;

C1)建立处理所述新的数字内容的操作界面和参 数。

本发明所述的重组数字内容处理子系统(3 )根据预先定义的重组数字 内容分配处理规则, 将所述新的数字内容分配到不同的处理站点, 所述新 的数字内容分配处理规则包括:

A2)将包含可能相关的所述数字内容单元体的新 内容分发到物理位置 或网络地址的地理位置等跨度大的不同处理站 点去处理;

B2)将包含可能相关所述数字内容单元体的新内 容在不同时间分发到 物理位置 (或网络地址的地理位置) 跨度大的不同处理站点去处理;

C2)将包含可能相关所述数字内容单元体的新 内容分发到较安全的专 业处理公司处理队列去处理。 本发明系统中的重组数字内容处理子系统(3 )每次处理完一个重组数 字内容后通知所述数字内容重组子系统(2 );所述数字内容重组子系统(2 ) 在接到每个原始数字内容的所有所述数字内容 单元体处理完信息后, 把一 个完整的所述数字内容单元集所需处理的所述 数字内容单元体信息返回到 所述原始数字内容处理子系统 (1 ), 由所述原始数字内容处理子系统 (1 ) 完成整个内容处理流程。

本发明与现有技术相比, 具有在不改变数字内容单元体的局部认知程 度和保真度的前提下,达到消除原始数字内容 保密或隐私敏感度,使得对 该部分内容的任何人为或自动处理可以在非严 格保密控制的环境下实行等 优点

附图说明

图 1、 图 2、 图 3是本发明处理方法的数据架构和事件流程图

具体实 式

下面结合附图说明对本发明作进一步详细的描 述: 如图 1、 图 2、 图 3 所示, 本发明从功能上可以分为三个子系统, 其中:

1. 原始数字内容处理子系统 (1 ) 主要任务是对每个原始数字内容进行分 割:

a) 该子系统首先将进入该系统中的原始数字内容 根据整体系统标准设 定唯一标识。 唯一标识可以用目前的公知技术, 比如用子系统名 + 客户识别号(数字内容的拥有者的内部名) +到秒级的时间序列数字

+4 位随机数 +子系统内部当日输入原始数字内容数目 (如每日从 b) 根据具体业务要求设定数字内容的关键处理指 标。 这些指标包括: 客户识别号, 进入该系统的时间, 处理该原始数字内容的时间要求, 该原始数字内容的处理精确度 o o

要求何业务处理要求如翻译, 识别, 信息输入, 核对等。

C) 然后该子系统将每个原始数字内容进行分割。 目前对数字内容的分 割有很多现有技术, 比如: 语音频谱和时间域上的分割 (speech signal segmentation) ,图像的分害 U ( image segmentation) , 分害 !j 的内容单元大小可以根据对数字内容各部分的 敏感程度来调整。 比 如某文件表格要求在上半部的个人信息部分不 超过三个字符, 根据 扫描文档的分辨率可以推算出三个字符的图像 单元的分割尺寸。 语 音数字内容可以根据时间来分割, 比如正常语速为 180字 /60秒, 划分九个字可以按 3秒来分割。 某些有高精度要求的数字内容可以 重叠分割即图像内容单元或语音内容单元的分 割区域可以重叠。 d) 数字内容分割后的关系表达可以用关系方式 ( entity relationship ) , 也可用目标(object)来表达。这种关系在子系 之 间可以用 XML的格式来传输。 数字内容分割后的关系表达方式之一 (关系方式): 分割内容单元表

原始内容标识 单元标识 密级 时空范围 文件名

DA—A00卜 1 1 5, 5, 100, 50 http://. . . . 001-1

DA—A00卜 2 1 105, 5, 100, 50 http://. . . . 001-2 A-.A001 DA—A001- 3 1 205, 5, 100, 50 http://....001-3

A-.A001 DA—AOOH 1 305, 5, 500, 50 http://....001-4

A-.A001 DA—A001- 5 1 805, 5, 1000, 50 http://....001-5

A-.A001 DA—AOO卜 6 1 1805, 5, 200, 50 http://....001-6

A-.A001 DA—AOO卜 7 2005, 5, 200, 50 http://....001-7

A-.A002 DA—A002- 1 1 1-lOsec http://....002-1

A-.A002 DA—A002- 2 1 ll-20sec http:// ....002-2

A-.A002 DA—A002- 3 1 21-33sec http:// ....002-3

A-.A002 DA—A002- 4 1 34sec-20min http:// ....002-3

A-.A003 DA—A003- 1 1 15, 5, 100, 100 http://....003-1

A-.A003 DA—A003- 2 1 115, 5, 100, 100 http:// ....003-2

A-.A003 DA—A003- 3 1 215, 5, 100, 100 http:// ....003-3

A-.A003 DA—A003- 4 1 315, 5, 100, 100 http://....003-4

A-.A003 DA—A003- 5 1 455, 5, 100, 100 http:// ....003-5

A-.A004 DA—A004- 1 1 15, 5, 100, 100 http://....004-1

A-.A004 DA—A004- 2 1 115, 5, 100, 100 http://....004-2

A-.A004 DA—A004- 3 1 215, 5, 100, 100 http://....004-3

A-.A004 DA—A004- 4 1 315, 5, 100, 100 http://....004-4

A-.A004 DA—A004- 5 1 455, 5, 100, 100 http://....004-5 数字内容单元集

e) 将分割后的数字内容单元组成一个或多个数字 内容单元集用 XML的 格式发送给一个或多个数字内容重组系统。 数字内容单元集可以包 括一个完整原始内容的所有内容单元, 也可以包括原始内容的部分 内容单元。

2.数字内容重组子系统 (2) 该子系统的主要功能是对进入该子系统 中的内容单元集按照预先设定的混合重组规则 进行混合重组形成新 的数字内容:

a) 存储接收到的不同数字内容单元集。

b) 根据业务要求(翻译, 识别, 信息输入, 核对)用一个重组数 字内容模板创建一个新的重组数字内容,重组 数字内容模板的 格式见下表:

数字内容单元集

C)重组数字内容的组合规则如下- i . 将接收到的不同数字内容单元集中的数字单元 根据相同的业

务处理要求(业务种类, 处理时间, 敏感程度)从数字内容单 元集中挑出数字内容单元, 组成重组数字内容。

i i. 如果某些数字内容单元集有高精度要求则该单 元集中的数字

内容单元允许在相同或不同的重组数字内容中 重复出现。

i i i. 如果某些数字内容单元集必须由绝密渠道来处 理则组成专

门处理的重组数字内容。 d)重组数字内容之间如果包含相同的数字内容 元集中的内容单元 则其相对于该集的相关度为 1, 具体计算方法实例之一见下表:

重组数字内容表 重组数字 I 内容 A 重组数字 内容 B 重组数字 内容 C 重组数字内容 A 重组数字内容 B

请将左边图像文字输入文本文字

μ 提取的单元

;、 沁园春

Hfe, 峰回路 取消 提交

重组数字内容 A与重组数字内容 B的相关度是 2 (二重组内容中各有两个内容单元来源于同一 数字内容单元集)

重组数字内容 A与重组数字内容 C的相关度是 0 (二重组内容中无任何内容单元来源于同一个 字内容单元集)

重组数字内.容 B与重组数字内容 C的相关度是 1 (二重组内容中有一个内容单元来源于同一个 字内容单元集) e)将重组数字内容用 XML的格式发送给一个或多个重组数字内容处 理子系统(3)。 重组数字内容处理子系统(3)。该子系统中将 组数字内容分配和发送 到不同的处理渠道去处理。

a) 存储接收到的重组数字内容

b) 根据业务要求 (翻译, 识别, 信息输入, 核对, 处理时间, 敏感程 度, 相对关连度) 分配和发送到到不同的处理渠道。

c) 分配和发送重组数字内容到处理渠道规则举例 如下:

i. 专业处理渠道拥有保密认证可以处理敏感性较 高的数字内容 (如整个的个人信息部分)

i i. 公共处理渠道根据其网络 IP地址可以转化为地理位置。 i i i. 重组数字内容之间相关度高的分配到地理位置 相差大的公共 渠道 (如 5000公里外), 相关数低的如 1可以分配到地理位 置相差小 (如 50公里内) 的公共渠道。

iv. 重组数字内容之间相关度高的可以被分配到地 理位置相差较 大(如 500公里外), 而且将相关重组数字内容在分配的时间 跨度上 (如 10小时) 分开, 这又是一个渠道分配规则。 d) 根据业务要求 (翻译, 识别, 信息输入, 核对, 处理时间, 敏感程 度, 相对关连度) 和以上规则分配和发送到到不同的处理渠道。 e) 分配队列管理模块根据各处理渠道的处理速度 调整重组数字内容的 分配。

组数字内容在经过各处理渠道处理完毕后:

重组数字内容处理子系统 (3 )

a) 每接受到一个来自处理渠道的处理完毕提交 (submitting ) 该子系 统将提交结果界面上的输入文字(翻译, 识别, 信息输入, 核对 正确与否)存入数据库中的重组数字内容单元 的相应文档域 (text field) 中。 处理结果如下表格:

原始内容表

重组数字内容表

b)通知数字内容重组子系统(2)该个重组数字 容处理完毕。

5、 数字内容重组子系统(2 )

数字内容重组子系统(2 )接到处理子系统的一个重组数字内容处理完 信 息后: a) 检査核对在重组数字内容中有重复的单元处理 返回结果的一致性, 如果 一致则在处理可信度标志中设高可信度, 否则根据回复结果不一致性设 中或低可信度。 峰

回回

路路路

b) 一旦发现来自同一数字内容单元集的内容单元 都已处理完毕(即属于同 一数字内容单元集中的内容单元都已经处理)

c) 通知原始数字内容处理子系统(1 ), 该数字内容单元集处理结果。

6.原始数字内容处理子系统(1 ) 回

a)

转路

容的处理结果, 如果是重叠的内容单元, 将前内容单元的文档文字与后内容夢 元的文档文字进行匹配处理如果一致则在处理 可信度标志中设高可信度, 否则 根据结果不一致性设中或低可信度, 完成处理。 处理方法如下表:

也, 峰回转

也, 峰回路

比较前面字串的最后 N个和后面字串的前第 N个在找到一个匹配后第一个不匹配结

束此算法为公知技术

将两个内容单元结果合成后的结果为

"也, 峰回路转," 本发明的实施方式可以用多级多机可扩充的架 构来实现,即:原始数字 内容处理子系统(1 ), 数字内容重组子系统(2 )和重组数字内容处理子系 统(3)可以分成三级多机的系统。 每一级可以是前一级的服务提供者。 原 始数字内容处理子系统与后面的数字内容重组 子系统与重组数字内容处理 子系统可以分离成独立的子系统。




 
Previous Patent: FOOTBALL TABLE

Next Patent: HAIR GROWTH PROMOTER