Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD AND DEVICE FOR QUERYING QUESTION BASE
Document Type and Number:
WIPO Patent Application WO/2012/065332
Kind Code:
A1
Abstract:
A method and a device for querying a question base are provided, which are applied in an electronic device with a question base. The method includes: receiving data to be queried which is input by an input module; analyzing the data to be queried through an identifying module by using a word segmentation base; applying intersection comparison to the data to be queried which has been analyzed and a keyword character base by a correlation module to produce a keyword set; and searching out a question data array in a classification question base according to the keyword set, and assembling a question base. The solution facilitates users querying the classification question base directly and concisely, and provides the corresponding questions according to the correlation of the data to be queried and the keyword character base.

Inventors:
CHEN HUAIYAN (CN)
JIANG YANGAN (CN)
Application Number:
PCT/CN2010/079983
Publication Date:
May 24, 2012
Filing Date:
December 20, 2010
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
INVENTEC BESTA XI AN CO LTD (CN)
CHEN HUAIYAN (CN)
JIANG YANGAN (CN)
International Classes:
G06F17/30
Foreign References:
CN101814080A2010-08-25
CN1335574A2002-02-13
Attorney, Agent or Firm:
XI'AN ZHIBANG PATENT & TRADEMARK AGENT CO., LTD. (CN)
西安智邦专利商标代理有限公司 (CN)
Download PDF:
Claims:
权 利 要 求 书

1、 一种查询题库的方法, 其特征在于: 该方法包含以下步骤:

1 ) 建立文字分词库, 由多个文字分词集合而成, 用来辨识分析欲查询数 据的关键词;

2) 建立分类题库, 储存试题数据组;

3 ) 建立关键词文字库, 储存分类题库的第一关键词及第一关键词在分类 题库中个别的出现次数;

4) 输入欲查询数据;

5 ) 根据欲查询数据, 并使用文字分词库分析, 取得第二关键词;

6) 关联查询模块根据第二关键词交集比对关键词文字库的第一关键词, 提取出交集比对结果; 并根据交集比对结果至分类题库查询出与交集比对查 询相关的试题数据组;

7)试题数据组根据交集比对结果内的第一关键词出现次数高低排序出一 题库。

2、 根据权利要求 1所述的一种查询题库的方法, 其特征在于: 所述文字 分词为经过提取单一词汇方法分析而成。

3、 根据权利要求 2所述的一种查询题库的方法, 其特征在于: 所述提取 单一词汇方法为过滤词性并保留有意义词汇、 忽略连接词及标点符号以提取 出单一词汇。

4、 一种查询题库的装置, 其特征在于: 该装置包括: 记忆单元, 包括: 文字分词库, 储存单一中文词汇; 分类题库, 储存试题数据组; 关键词文字 库, 储存分类题库的第一关键词及第一关键词在分类题库的出现次数; 输入 单元, 接收欲查询数据; 处理单元, 利用经过输入单元输入的欲查询数据与 记忆单元的文字分词库比对分析出第二关键词, 且利用第二关键词至记忆单 元的关键词文字库中交集比对出出现次数最高的第一关键词, 以交集比对的 结果在记忆单元的分类题库进行查询得出试题数据组, 并以第一关键词的出 现次数为索引排序试题数据组生成题库; 输出单元, 输出题库至输出装置, 所述处理单元分别与记忆单元、 输入单元和输出单元连接。

5、 根据权利要求 4所述的一种查询题库的装置, 其特征在于: 所述装置 为电子字典、 个人计算机、 手持装置或个人行动助理机。

6、 根据权利要求 4所述的一种查询题库的装置, 其特征在于: 所述输入 单元为键盘或手写装置。

7、 根据权利要求 4所述的一种査询题库的装置, 其特征在于: 所述输出 装置为屏幕或打印机。

Description:
查询题库的方法及装置 技术领域

本发明涉及一种查询题库的方法及装置, 尤其是一种以欲查询数据对题 库进行查询的方法及装置。

背景技术

目前, 试题数据库的电子化程度已日渐普及, 许多电子装置设置了试题 数据库, 而利用电子装置进行相关测验的技术也早已令 大众所熟知, 目前市 面所流通的教育学习装置或计算机辅助教学 (Computer Aided Instruction; CAI)软件等。 其中, 上述装置及软件大多配置一套试题数据库, 且该试题数 据库中储存有不同难易程度、 科目、 级别及类型的试题, 针对不同程度的使 用者, 可以自主选择要测验学习的级别, 据此, 可供使用者通过实作试题达 到学习的效果, 且使用者得以通过各式电子装置, 如 PDA、 电子辞典或个人 计算机等使用试题数据库。

上述试题数据库通常只有配置简单的关键词查 询, 有时使用者无法想到 或选择适当的关键词, 或输入关键词时得到的查询结果只与该关键词 相关而 过于狭隘, 无法立即获得使用者欲查询的试题, 如此, 不但会花费使用者大 量时间进行查询与查阅, 而且, 此种关键词查询也可能因关键词判断错误, 导致使用者无法找到适合自己程度的试题, 对使用者而言, 则会花费过多精 神于此, 则可能会令使用者失去使用此试题数据库的兴 趣, 因此, 上述试题 数据库的一般查询方式显然无法让使用者快速 寻找到准确的试题数据组。 发明内容

本发明为解决背景技术中存在的上述技术问题 , 而提出查询题库的方法 及装置。

本发明的技术解决方案是本发明为一种查询题 库的方法, 其特殊之处在 于: 该方法包含以下步骤:

1 ) 建立文字分词库, 由多个文字分词集合而成, 用来辨识分析欲查询数 据的关键词;

2 ) 建立分类题库, 储存试题数据组; 3 ) 建立关键词文字库, 储存分类题库的第一关键词及第一关键词在分 类 题库中个别的出现次数;

4) 经过输入模块输入欲查询数据;

5 )辨识模块根据欲查询数据, 并使用文字分词库分析, 取得第二关键词; 6) 关联查询模块根据第二关键词交集比对关键词 文字库的第一关键词, 提取出交集比对结果; 并根据交集比对结果至分类题库查询出与交集 比对查 询相关的试题数据组;

7)试题数据组根据交集比对结果内的第一关键 出现次数高低排序出一 题库。

上述文字分词为经过提取单一词汇方法分析而 成。

上述提取单一词汇方法为过滤词性并保留有意 义词汇、 忽略连接词及标 点符号以提取出单一词汇。

一种查询题库的装置, 其特殊之处在于: 该装置包括: 记忆单元, 包括: 文字分词库, 储存单一中文词汇; 分类题库, 储存试题数据组; 关键词文字 库, 储存分类题库的第一关键词及第一关键词在分 类题库的出现次数; 输入 单元, 接收欲查询数据; 处理单元, 利用经过输入单元输入的欲查询数据与 记忆单元的文字分词库比对分析出第二关键词 , 且利用第二关键词至记忆单 元的关键词文字库中交集比对出出现次数最高 的第一关键词, 以交集比对的 结果在记忆单元的分类题库进行查询得出试题 数据组, 并以第一关键词的出 现次数为索引排序试题数据组生成题库; 输出单元, 输出题库至输出装置, 处理单元分别与记忆单元、 输入单元和输出单元连接。

上述装置为电子字典、 个人计算机、 手持装置或个人行动助理机。

上述输入单元为键盘或手写装置。

上述输出装置为屏幕或打印机。

本发明提供的查询题库的方法及装置, 其应用于具有题库的电子装置中, 包括接收输入模块输入的所需查询数据, 由辨识模块使用文字分词库分析欲 查询数据, 利用关联模块交集比对已被分析的欲查询数据 及关键词文字库, 用来产生关键词集合, 根据关键词集合在分类题库中查询出试题数据 组, 并 组成题库。 便于使用者在分类题库中做直接简明的查询, 且根据欲查询数据 与关键词文字库的关联度提供相应程度的试题 。

附图说明

图 1为本发明查询题库的方法流程图;

图 2为本发明查询题库的装置示意图;

图 3为本发明第一实施例状态示意图;

图 4为本发明第二实施例状态示意图。

其中, 10-记忆单元, 100-文字分词库, 101-分类题库, 102-关键词文字库, 11-输入单元, 110-输入模块, 12-处理单元, 120-关联查询模块, 121-辨识模 块, 13-输出单元;

具体实施方式

参见图 1, 本方法包括:

(S10) 使用者在输入模块输入欲查询数据;

(S20) 根据预先建立的文字分词库, 其包括多个文字分词, 利用欲查询 数据经过辨识模块根据文字分词库提取欲查询 数据的第二关键词;

(S30)根据第二关键词, 经过关联查询模块通过关键词文字库的第一关 键词与第二关键词相同者, 产生关键词集合, 若有, 则进行至步骤 (S40 ) , 否则进行至 (S70);

( S40 )利用上述步骤的关键词集合至分类题库查询 试题数据组, 并得 到试题数据组;

( S50 )将分类题库查询出试题数据组, 根据关键词集合在关键词文字库 中所记录的个别出现次数高低排序出一套题库 ;

( S60 ) 查询过程结束, 清空输入模块, 供使用者再次输入。

参见图 2, 本装置包含记忆单元 10、 输入单元 11、 处理单元 12及输出单 元 13, 其中, 记忆单元 10包括储存单一中文词汇集合的文字分词库 100, 储 存试题数据组的分类题库 101,储存由分类题库 101分析提取而出的第一关键 词及第一关键词的出现次数的关键词文字库 102, 输入单元 11接收欲查询数 据, 处理单元 12利用被输入的欲查询数据, 经过文字分词库 100比对分析出 第二关键词, 并利用第二关键词至关键词文字库 102选出符合第一关键词的 关键词集合, 利用此关键词集合至分类题库 101 查询得出试题数据组, 并以 第一关键词在关键词文字库的出现次数排序试 题数据组产出一题库, 后由输 出单元 13输出此题库至输出装置。

据上所述, 本发明的查询题库的方法在分析欲查询数据时 , 辨识模块 121 主要利用文字分词库 100 的文字分词进行辨识比对, 此文字分词经过提取单 一词汇方法分析之后所产生的独立词汇, 提取单一词汇方法为过滤词性并保 留有意义词汇、 忽略连接词及标点符号的方法, 如下例所示:

已知有一点位于第四象限, 且距离 X轴 3个单位长, 距离 y轴 0.6个单位 长, 请问这点的坐标为何?

经过文字分词后

已知 /有 /一点 /位于 /第四 /象限 /, 且 /距离 /x/轴 /3/个 /单位长 /, 距离 /y/轴 /0.6/ 个 /单位长 /, 请问 /这 /点 /的 /坐标 /为何 /?

提取出的第二关键词

/一点 /第四 /象限 /距离 /x/轴 /单位长 /距离 /y/轴 /坐标 /

通过此分词方法, 使用者可有较大的弹性在输入模块 110输入欲查询数 据, 其欲查询数据可为关键词, 也可为完整题目, 当欲查询数据经由此分词 方法提取出第二关键词后, 此第二关键词通过关联查询模块 120根据关键词 文字库 102 的第一关键词选出相同的关键词集合, 并将此关键词集合送至分 类题库进行查询得出试题数据组, 此试题数据组以关键词集合中的关键词出 现次数排序成题库, 达到使用者可自由弹性输入欲查询数据的条件 , 并可精 确查询出最符合条件的题库。

参见图 3, 电子装置为电子辞典, 记忆单元 10为安装在电子辞典上的记 忆卡, 输入单元 11为电子辞典的键盘, 处理单元 12为电子辞典的中央处理 器, 输出单元 13为电子辞典的液晶屏幕, 其中, 记忆单元 10包括文字分词 库 100、 分类题库 101及关键词文字库 102, 文字分词库 100、 分类题库 101 及关键词文字库 102为关联性数据库, 文字分词库 100预先存入可做单一词 汇提取的文字分词, 分类题库 101为储存试题数据组, 关键词文字库 102为 预先储存由分类题库 101 提取的第一关键词及第一关键词的出现次数, 处理 单元 12包含关联查询模块 120及辨识模块 121, 关联查询模块 120及辨识模 块 121为预先编写好的程序。 当使用者在电子辞典的键盘或手写笔输入欲查 询数据, 设定相关查询条 件后执行开始搜寻指令, 辨识模块 12通过比对文字分词库 100内的文字分词 与输入的欲查询数据得到一组第二关键词, 并以此第二关键词与关键词文字 库 102 的第一关键词, 利用关联查询模块选出第二关键词中与第一关 键词相 同的关键词集合, 并以此关键词集合为索引查找分类题库 101 并得到试题数 据组, 且利用关键词文字库的第一关键词的出现次数 由高到低排序, 由于电 子辞典显示有限, 可根据使用者需要, 仅列出第一关键词排行较前的部分笔 数, 更增加了查询的弹性。

参见图 4, 电子装置为个人计算机, 记忆单元 10为安装在个人计算机上 的硬盘, 输入单元 11为个人计算机的键盘与鼠标, 处理单元 12为个人计算 机的 CPU, 输出单元 13为个人计算机的液晶屏幕或打印机, 其中, 记忆单元 10需包括文字分词库 100、 分类题库 101及关键词文字库 102, 文字分词库 100、 分类题库 101及关键词文字库 102为关联性数据库, 处理单元 12包含 关联查询模块 120及辨识模块 121,关联查询模块 120及辨识模块 121为预先 编写好的程序。

当使用者在输入单元 11输入欲查询数据, 设定相关查询条件后执行开始 搜寻指令, 通过比对文字分词库 100 内的文字分词与输入的欲查询数据得到 一组第二关键词, 并以此第二关键词与关键词文字库 102 的第一关键词, 利 用关联查询模块选出第二关键词中与第一关键 词相同的关键词集合, 并以此 关键词集合为索引查找分类题库 101 并得到试题数据组, 由于个人计算机可 加装如打印机的输出装置, 可根据使用者需要, 直接打印产生题库, 更增加 了使用的便利。