Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD AND SYSTEM FOR BLOG CONTENT SEARCH
Document Type and Number:
WIPO Patent Application WO/2014/059836
Kind Code:
A1
Abstract:
Provided in the present invention are a method and system for blog content search. The method for blog content search comprises: receiving a blog content search request, where the search request comprises a search term and a search time range; searching for and acquiring inverted data blocks of the search term from a database on the basis of the search term in the search request, jumping, on the basis of a timestamp jump table of the inverted data blocks and of the search time range, to the inverted data blocks comprising qualifying data; and merging the inverted data blocks comprising the qualifying data to acquire a search result. The method and system of embodiments of the present invention for blog content search, by adding the blog generation timestamp jump table to headers of the inverted data blocks, and by using the jump table, allow for, on the basis of the search time range inputted by a user, jumping directly to and searching at the inverted data blocks from where the result may possibly be retrieved, thus greatly reducing search time, and increasing search efficiency. In addition, data of earlier times can be searched via the timestamp jump table, thus ensuring the accuracy and completeness of the search result.

Inventors:
WANG JIAQIANG (CN)
HE JIANGUO (CN)
Application Number:
PCT/CN2013/082893
Publication Date:
April 24, 2014
Filing Date:
September 04, 2013
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
TENCENT TECH SHENZHEN CO LTD (CN)
International Classes:
G06F17/30
Foreign References:
US7558786B22009-07-07
CN102426610A2012-04-25
CN102110160A2011-06-29
CN102708187A2012-10-03
Attorney, Agent or Firm:
LIU, SHEN & ASSOCIATES (CN)
北京市柳沈律师事务所 (CN)
Download PDF:
Claims:
权利要求书

1、 一种博客内容搜索方法, 包括以下步骤:

接收博客内容检索请求, 该检索请求包括检索词和检索时间段范围; 根据检索请求中的检索词从数据库中检索并获取该检索词的倒排数据 块, 根据倒排数据块的时间戳跳表和检索时间段范围, 跳转到包含符合条件 的数据的倒排数据块; 以及

对包含符合条件的数据的倒排数据块进行归并得到检索结果。 2、根据权利要求 1所述的博客内容搜索方法, 在所述接收博客内 佥索 请求的步骤前还包括步骤: 按照博客内容发表或生成时间生成倒排数据块; 以及在倒排数据块中添加博客内容发表或生成时间戳跳表。

3、根据权利要求 2所述的博客内容搜索方法, 所述时间戳跳表为每个倒 排数据块的最后一篇文章的生成时间戳, 所述时间戳跳表添加在每个倒排数 据块的头部。

4、根据权利要求 1至 3任一项所述的博客内容搜索方法, 所述接收博客 内容检索请求的步骤还包括步骤: 判断检索请求是否是带时间段范围的检索 请求; 如果是带时间段范围的检索请求, 则获取检索词的倒排数据块; 以及 如果不是带时间段范围的检索请求, 则对倒排数据块进行检索。

5、根据权利要求 1至 3任一项所述的博客内容搜索方法, 所述根据倒排 数据块的时间戳跳表和检索时间段范围, 跳转到包含符合条件的数据的倒排 数据块的步骤包括步骤: 获取检索词任意的倒排数据块; 通过检索词的倒排 数据块的头部信息, 判断出可能包含符合条件的数据的倒排数据块; 以及获 取所述倒排数据块进行检索。

6、根据权利要求 1至 3任一项所述的博客内容搜索方法, 所述对包含符 合条件的数据的倒排数据块进行归并得到检索结果的步骤包括步骤: 对包含 符合条件的数据的倒排数据块进行归并; 对归并出的结果做时间过滤; 判断 过滤结果是否到达设定的数量; 如果达到设定数量, 则返回检索结果; 以及 如果没有达到设定数量, 则重新根据倒排数据块的头部信息的时间戳跳表, 跳转到包含符合条件的数据的倒排数据块进行检索。

7、根据权利要求 1至 3任一项所述的博客内容搜索方法, 所述博客包括 传统博客、 微博及轻博。

8、 一种博客内容搜索系统, 包括:

请求接收模块, 被配置为接收博客内容检索请求, 该检索请求包括检索 词和检索时间段范围;

数据跳转模块, 被配置为根据检索请求中的检索词从数据库中检索并获 取该检索词的倒排数据块,根据倒排数据块的时间戳跳表和检索时间段范围, 跳转到包含符合条件的数据的倒排数据块; 以及

结果返回模块, 被配置为对包含符合条件的数据的倒排数据块进行归并 得到检索结果。

9、 根据权利要求 8所述的博客内容搜索系统, 还包括: 数据生成模块, 被配置为按照博客内容发表或生成时间生成倒排数据块; 以及信息添加模块, 被配置为在倒排数据块中添加博客内容发表或生成时间戳跳表。

10、 根据权利要求 9所述的博客内容搜索系统, 所述时间戳跳表为每个 倒排数据块的最后一篇文章的生成时间戳, 所述时间戳跳表添加在倒排数据 块的头部。 11、 根据权利要求 8至 10任一项所述的博客内容搜索系统, 还包括请求 判断模块, 被配置为判断检索请求是否是带时间段范围的检索请求, 如果是 带时间段范围的检索请求, 则获取检索词的倒排数据块, 以及如果不是带时 间段范围的检索请求, 则对倒排数据块进行检索。 12、 根据权利要求 8或 9所述的博客内容搜索系统, 所述数据跳转模块 获取检索词的第一块倒排数据块, 通过检索词的第一块倒排数据块的头部信 息, 判断出可能包含符合条件的数据的倒排数据块, 以及获取所述倒排数据 块进行检索。

13、 根据权利要求 12所述的博客内容搜索系统, 还包括结果过滤模块, 被配置为对包含符合条件的数据的倒排数据块进行归并, 对归并出的结果做 时间过滤, 以及返回过滤结果。

14、 根据权利要求 13所述的博客内容搜索系统, 还包括结果判断模块, 被配置为判断过滤结果是否到达设定的数量, 如果达到设定数量, 则由结果 返回模块返回检索结果,否则继续由数据跳转模块获取检索词的倒排数据块。

15、根据权利要求 8至 10任一项所述的博客内容搜索系统, 所述博客包 括传统博客、 微博及轻博。 16、 一种包括程序代码的计算机程序, 当所述计算机程序运行在计算机 上时,所述程序代码执行根据权利要求 1所述的博客内容搜索方法的各步骤。

Description:
博客内容搜索方法及系统 技术领域

这里公开的主题内容涉及互联网技术领域, 特别是涉及一种博客内容搜 索方法及系统。 背景技术

在博客搜索特别是微博搜索中, 存在搜索某个时间段发表过的文章的需 求, 例如用户记得大概某个时间有一篇 4艮好的语录或文章, 现在想找出来看 看。 现有的博客搜索入口中存在相关的搜索时间段 , 用户可以搜索最近 1天、 3天等的博客内容, 也可以指定搜索一段时间内的博客内容。

现有的博客内容搜索方法采用的是按照文章发 表时间逆序的顺序生成倒 排数据块。 在接收到检索请求时, 首先取得每个检索词的第一块倒排数据库, 然后进行归并。 对于归并出来的结果再判断其发表时间是否在 请求所给的时 间段内, 如果不在, 则丟弃该归并的结果, 如果在所请求的时间段内, 就将 该归并结果作为一个满足条件的结果。 当某个检索词的倒排数据块归并到末 尾时, 继续取该词的下一块归并, 直到某个词的倒排数据块都做完或者找到 了足够多的结果才结束。

但是, 现有的博客内容搜索方法存在以下缺点: 该博客内容搜索方法需 要对每个倒排数据块进行归并及判断, 造成搜索花费时间长, 用户需要长期 等待才能得到搜索结果; 另外, 现有的博客内容搜索方法找到了一定的博客 内容就会返回结果, 不能将所有结果都返回, 造成用户可能找不到期望的结 果。 发明内容

本发明提供了一种博客内容搜索方法及系统, 旨在解决现有技术中需要 对每个倒排数据块进行归并及判断, 造成搜索花费时间长以及不能将所有结 果都返回的问题。

本发明的目的及解决其技术问题是采用以下技 术方案来实现的。

根据本发明的一个方面, 提供一种博客内容搜索方法, 包括以下步骤: 接收博客内容检索请求, 该检索请求包括检索词和检索时间段范围; 根据检索请求中的检索词从数据库中检索并获 取该检索词的倒排数据 块, 根据倒排数据块的时间戳跳表和检索时间段范 围, 跳转到包含符合条件 的数据的倒排数据块; 以及

对包含符合条件的数据的倒排数据块进行归并 得到检索结果。

根据本发明的另一个方面, 还提供一种博客内容搜索系统, 包括: 请求接收模块, 被配置为接收博客内容检索请求, 该检索请求包括检索 词和检索时间段范围;

数据跳转模块, 被配置为根据检索请求中的检索词从数据库中 检索并获 取该检索词的倒排数据块,根据倒排数据块的 时间戳跳表和检索时间段范围, 跳转到包含符合条件的数据的倒排数据块; 以及

结果返回模块, 被配置为对包含符合条件的数据的倒排数据块 进行归并 得到检索结果。

根据本发明的再一个方面, 还提供一种包括程序代码的计算机程序, 当 所述计算机程序运行在计算机上时, 所述程序代码执行根据上述博客内容搜 索方法的各步骤。

本发明的技术方案具有如下优点或有益效果: 根据本发明的实施例的博 客内容搜索方法和系统通过在倒排数据块的头 部添加博客生成时间戳跳表, 通过该跳表, 可以根据用户输入的检索时间范围直接跳到可 能取到结果的倒 排数据块进行检索, 大大缩短了搜索时间, 提高了搜索效率, 另外, 通过时 间戳跳表可以检索到时间较老的数据, 保证了搜索结果的准确性和完整性。

上述说明仅是本发明技术方案的概述, 为了能够更清楚了解本发明的技 术手段, 而可依照说明书的内容予以实施, 并且为了让本发明的上述和其他 方面、 特征和优点能够更明显易懂, 以下配合附图详细描述本发明的各个实 施例。 附图说明

附图 1是根据本发明的第一实施例的博客内容搜索 法的流程图; 附图 2是根据本发明的第二实施例的博客内容搜索 法的流程图; 附图 3是根据本发明的第一实施例的博客内容搜索 统的结构示意图; 附图 4是根据本发明的第二实施例的博客内容搜索 统的结构示意图。 具体实施方式

以下结合附图及各个实施例, 对依据本发明提出的用户原创内容的推荐 方法及推荐装置其具体实施方式、 方法、 步骤、 结构、 特征及其功效, 详细 说明: ¾口下。

有关本发明的前述及其他技术内容、 特点及功效, 在以下配合参考图式 的各个实施例的详细说明中将可清楚呈现。 通过具体实施方式的说明, 当可 对本发明所采取的技术手段及功效得以更加深 入且具体的了解, 然而所附图 式仅是提供参考与说明之用, 并非用来对本发明加以限制。

图 1是根据本发明的第一实施例的博客内容搜索 法的流程图。 如图 1 所示, 根据本发明的第一实施例的博客内容搜索方法 从步骤 S100开始。

在步骤 S100, 在博客内容倒排数据块中添加博客内容发表或 生成的时间 戳跳表。

在步骤 S100中, 博客可以包括传统博客、 微博及轻博。 按照博客内容一 定时间内的发表时间逆序的顺序生成倒排数据 块。该一定时间可以为 1个月、 3 个月或者用户、 系统设置的时间。 另外, 也可以按照一定的博客数据条数 的发表时间逆序的顺序生成倒排数据块, 例如发表的 5000条博客数据或者 10000条博客数据或者用户、 系统设置的博客条数。 例如, 整个博客发表时 间为 1年, 博客数据为 50000条, 如果按照 3个月发表时间逆序的顺序生成 倒排数据块, 则有 4个倒排数据块; 如果按照 10000条博客数据发表时间逆 序的顺序生成倒排数据块, 则有 5个倒排数据块。 另外, 由于博客内容在时 新性方面比较敏感, 也可以按照博客数据生成时间进行排序; 时间戳跳表可 以添加在每个倒排数据块的头部。 通过时间戳跳表, 可以根据用户输入的检 索时间范围直接跳到可能取到结果的倒排数据 块操作。 具体的倒排数据块的 头部结构如下: 其中, 时间戳跳表(TimeStampSkipList ) 为每个倒排数据块的最后一篇 文章的生成时间戳, 形成一个数组,总共有 4*BlockNum个字节。 可以理解, 根据本发明的实施例的倒排数据块头部结构不 限于上述具体结构。

在步骤 S110, 接收博客内容检索请求, 该检索请求包括检索词和检索时 间段范围。

在步骤 S110中, 时间段范围可以根据用户的需求进行设定。

在步骤 S120, 根据检索请求中的检索词从数据库中检索并获 取该检索词 的倒排数据块, 根据倒排数据块的头部信息的时间戳跳表, 跳转到包含符合 条件的数据的倒排数据块;

在步骤 S120中, 可以获取检索词任意的倒排数据块, 通过该倒排数据 块的头部信息, 判断出哪一倒排数据块可能包含符合条件的数 据, 然后取该 倒排数据块进行后继的检索动作; 另外, 也可以获取检索词的其他倒排数据 块。

在步骤 S130, 对包含符合条件的数据的倒排数据块进行归并 , 对归并出 的结果做时间过滤, 返回检索结果。 在步骤 S130中, 时间过滤为根据用户输 入的检索时间段范围对归并结果进行过滤, 如果对归并出的结果做时间过滤 得到足够多的结果, 就结束检索; 否则跳转到步骤 S120继续找下一个可能归 并出结果的倒排数据块。

以下为根据本发明的实施例的博客数据搜索系 统的一个具体应用。 可以 理解, 本发明实施例不限于下面的具体应用。 假设用户搜索 A关键词和 B关 键词的组合, 时间段是 2011 -4- 1到 2011 -4- 10 , 其中, A关键词和 B关键词的 组合可以为任意形式, 例如: A关键词和 B关键词组合在一起形成了 "AB" 字符串; 或者 A关键词和 B关键词中间利用空格等等符号隔开。

建索引模块在倒排数据块中添加时间信息, 具体格式就是每一倒排数据 块的最后一篇文章的生成时间戳, 形成一个数组。 假设现在 A关键词的时间 戳跳表信息为 {2012-4-01 0:0:0, 2012-1-01 0:0:0, 2011-8-01 0:0:0, 2011-6-01

0:0:0, 2011-1-01 0:0:0, 2010-10-01 0:0:0 } , B关键词的时间戳跳表信息 为 {2012-3-01 0:0:0, 2011-12-01 0:0:0, 2011-7-01 0:0:0, 2011-3-01 0:0:0 , 2011-2-01 0:0:0, 2010-11-01 0:0:0 }。

检索模块根据建索引模块提供的数据索引进行 以下步骤:

1) . 分别取 A、 B两个关键词的第 1块倒排数据块, 得到相关的信息;

2) . 根据第 1块倒排数据块中的时间戳跳表,确定第 1块倒排数据块中是 否可以取到满足条件的结果; 如果不能, 则跳过第 1块倒排数据块, 取第 2 块倒排数据块, 依次类推;

在此, 根据时间戳跳表, 可以确定由于 A关键词的第 1~4块倒排数据块 的时间戳跳表分别为 2012-4-01 0:0:0 , 2012-1-01 0:0:0 , 2011-8-01 0:0:0 , 2011-6-01 0:0:0, 其均晚于时间段 2011-4-1到 2011-4-10, 因此第 1~4块倒排 数据块不可能取到满足条件的结果。 而第 5 块倒排数据块的时间戳跳表 2011-1-01 0:0:0, 早于时间段 2011-4-1到 2011-4-10, 因此 A关键词直到第 5 块倒排数据块才可能取到满足条件的结果。 同理, B关键词直到第 4块倒排 数据块才可能取到满足条件的结果。

3) . 选取 A、 B两个关键词的满足条件的这两个倒排数据块 即 A关键词 的第 5块倒排数据块和 B关键词的第 4块倒排数据块, 并进行归并处理以找 到包含 A和 B两个关键词的博文,再对归并出的结果做时 过滤以找到在时 间段 2011-4-1到 2011-4-10内的包含 A和 B两个关键词的博文;

4) . 如果在 A、 B两个关键词的满足条件的这两个倒排数据块 已经得到 了足够多的结果, 那么就结束检索; 否则跳转到步骤 2继续找下一个可能归 并出结果的倒排数据块。

图 2是根据本发明的第二实施例的博客内容搜索 法的流程图。 如图 2 所示, 根据本发明的第二实施例的博客内容搜索方法 从步骤 S200开始。

在步骤 S200, 按照博客内容发表或生成时间生成倒排数据块 。

在步骤 S200中,按照博客内容一定时间内的发表时间 序的顺序生成倒 排数据块, 该一定时间可以为 1 个月、 3个月或者用户、 系统设置的时间。 另外, 也可以按照一定的博客数据条数的发表时间逆 序的顺序生成倒排数据 块, 例如发表的 5000条博客数据或者 10000条博客数据或者用户、 系统设置 的博客条数。 例如, 整个博客发表时间为 1年, 博客数据为 50000条, 如果 按照 3个月发表时间逆序的顺序生成倒排数据块, 则有 4个倒排数据块, 如 果按照 10000条博客数据发表时间逆序的顺序生成倒排 据块, 则有 5个倒 排数据块。

在步骤 S210, 在倒排数据块中添加博客内容发表或生成时间 戳跳表。 在步骤 S210中, 时间戳跳表可以添加在每个倒排数据块的头部 。 通过时 间戳跳表, 可以根据用户输入的检索时间范围直接跳到可 能取到结果的倒排 数据块操作,。 具体的倒排数据块的头部结构如下:

倒排头部的某些信息 总共有多少块数据 时间戳跳表 其它倒排头部的信息

(BlockNum) (TimeStampSkipList) 其中, 时间戳跳表(TimeStampSkipList ) 为每个倒排数据块的最后一篇 文章的生成时间戳, 所以总共有 4*BlockNum个字节。 可以理解, 本发明实 施例的倒排数据块头部结构不限于上述具体结 构。

在步骤 S220, 接收博客内容检索请求, 判断检索请求是否是带时间段范 围的检索请求, 如果是带时间段范围的检索请求, 则进入步骤 S230, 如果不 是带时间段范围的检索请求, 则进入步骤 S240。

在步骤 S220中, 时间段范围可以根据用户的需求进行设定。

在步骤 S230, 获取检索词的倒排数据块, 根据倒排数据块的头部信息的 时间戳跳表, 跳转到包含符合条件的数据的倒排数据块。

在步骤 S230中, 可以获取检索词任意的倒排数据块, 通过该块的头部信 息, 判断出哪一倒排数据块可能包含符合条件的数 据, 然后取该倒排数据块 进行后继的检索动作。 另外, 也可以获取检索词的其他倒排数据块。

在步骤 S240, 对包含符合条件的数据的倒排数据块进行归并 , 对归并出 的结果做时间过滤。

在步骤 S240中, 时间过滤为根据用户输入的检索时间段范围对 归并结 果进行过滤。

在步骤 S250, 判断过滤结果是否到达设定的数量, 如果达到设定数量, 则进入步骤 S260, 否则返回步骤 S230。

在步骤 S260, 返回检索结果。

图 3是根据本发明的第一实施例的博客内容搜索 统的结构示意图。 如 图 3所示,根据本发明的第一实施例的博客内容 索系统包括信息添加模块、 请求接收模块、 数据跳转模块和结果返回模块。

信息添加模块在博客内容倒排数据块中添加博 客内容发表或生成的时间 戳跳表。

时间戳跳表可以添加在每一倒排数据块的头部 。 通过时间戳跳表, 可以 根据用户输入的检索时间范围直接跳到可能取 到结果的倒排数据块操作。 具 体的倒排数据块的头部结构如下: 其中, 时间戳跳表(TimeStampSkipList ) 为每个倒排数据块的最后一篇 文章的生成时间戳, 形成一个数组,总共有 4*BlockNum个字节。 可以理解, 根据本发明的实施例的倒排数据块头部结构不 限于上述具体结构。

请求接收模块接收带时间段范围的博客内容检 索请求, 其中, 时间段范 围可以根据用户的需求进行设定。

数据跳转模块根据检索请求中的检索词从数据 库中检索并获取该检索词 的倒排数据块, 根据倒排数据块的时间戳跳表和检索时间段范 围, 跳转到包 含符合条件的数据的倒排数据块。 其中, 数据跳转模块可以获取检索词任意 的倒排数据块, 通过该块的头部信息, 判断出哪一倒排可能包含符合条件的 数据, 然后取该倒排数据块进行后继的检索动作; 另外, 也可以获取检索词 的其他倒排数据块。

结果返回模块对包含符合条件的数据的倒排数 据块进行归并及过滤返回 检索结果。

图 4是根据本发明的第二实施例的博客内容搜索 统的结构示意图。 如 图 4所示,根据本发明的第二实施例的博客内容 索系统包括数据生成模块、 信息添加模块、 请求接收模块、 请求判断模块、 数据跳转模块、 结果过滤模 块、 结果判断模块和结果返回模块。

数据生成模块按照博客内容发表或生成时间生 成倒排数据块。 其中, 数 据生成模块可以按照博客内容发表时间逆序的 顺序生成倒排数据块, 另外, 由于博客内容在时新性方面比较敏感, 也可以按照博客数据生成时间进行排 序。

信息添加模块在博客内容倒排数据块中添加博 客内容发表或生成的时间 戳跳表。

时间戳跳表可以添加在倒排数据块的头部。 通过时间戳跳表, 可以根据 用户输入的检索时间范围直接跳到可能取到结 果的块操作。 具体的倒排数据 块的头部结构如下: 其中, 时间戳跳表(TimeStampSkipList ) 为每个倒排块的最后一篇文章 的生成时间戳, 形成一个数组,总共有 4*BlockNum个字节。 可以理解, 根据 本发明的实施例的倒排数据块头部结构不限于 上述具体结构。 请求接收模块接收博客内容检索请求, 其中, 时间段范围可以根据用户 的需求进行设定。

请求判断模块判断检索请求是否是带时间段范 围的检索请求, 如果是带 时间段范围的检索请求, 则由数据跳转模块获取检索词的倒排数据块, 如果 不是带时间段范围的检索请求, 则由结果过滤模块对包含符合条件的数据的 倒排数据块进行归并。 词的倒排数据块, 根据倒排数据块的时间戳跳表和检索时间段范 围, 跳转到 包含符合条件的数据的倒排数据块。 其中, 数据跳转模块可以获取检索词的 第一块倒排数据块, 通过该块的头部信息, 判断出哪一倒排数据块可能包含 符合条件的数据, 然后取该倒排数据块进行后继的检索动作; 另外, 也可以 获取检索词的其他倒排数据块。

结果过滤模块对包含符合条件的数据的倒排数 据块进行归并, 对归并出 的结果做时间过滤, 返回过滤结果。

结果判断模块判断过滤结果是否到达设定的数 量, 如果达到设定数量, 则由结果返回模块返回检索结果, 否则继续由数据跳转模块获取检索词的倒 排数据块。

结果返回模块返回检索结果。

根据本发明的一个实施例, 图 1所示的博客内容搜索方法可以是由图 3 或图 4所示的博客内容搜索系统中的各个模块来执 的博客内容搜索方法。 例如, 图 1所示的步骤 S100可以由图 3或图 4所示的信息添加模块来执行; 图 1所示的步骤 S110可以由图 3或图 4所示的请求接收模块来执行; 图 1所 示的步骤 S120可以由图 3或图 4所示的数据跳转模块来执行; 图 1所示的步 骤 S130可以由图 3或图 4所示的结果返回模块来执行。

根据本发明的另一个实施例,图 2所示的博客内容搜索方法可以是由图 4 所示的博客内容搜索系统中的各个模块来执行 的博客内容搜索方法。 例如, 图 2所示的步骤 S200可以由图 4所示的数据生成模块来执行; 图 2所示的步 骤 S210可以由图 4所示的信息添加模块来执行; 图 2所示的步骤 S220可以 由图 4所示的请求接收模块和请求判断模块相结合 执行; 图 2所示的步骤 S230可以由图 4所示的数据跳转模块来执行; 图 2所示的步骤 S240可以由 图 4所示的结果过滤模块来执行; 图 2所示的步骤 S250可以由图 4所示的结 果判断模块来执行; 图 2所示的步骤 S260可以由图 4所示的结果返回模块来 执行。

根据本发明的另一个实施例, 图 3或图 4所示的博客内容搜索系统中的 各个模块可以分别或全部合并为一个或若干个 另外的模块来构成, 或者其中 的某个(些)模块还可以再拆分为功能上更小 的多个模块来构成。 这可以实 现同样的操作, 而不影响本发明的实施例的技术效果的实现。

根据本发明的另一个实施例, 可以通过在包括中央处理单元(CPU )、 随 机存取存储器(RAM )、 只读存储器(ROM )等处理元件和存储元件的例如计算 机的通用计算设备上运行能够执行如图 1或图 2中所示的博客内容搜索方法 的计算机程序(包括程序代码 ), 来构造如图 3或图 4中所示的博客内容搜索 系统, 以及来实现根据本发明的实施例的博客内容搜 索方法。 所述计算机程 序可以记载于例如计算机可读记录介质上, 并通过计算机可读记录介质装载 于上述计算设备中, 并在其中运行。

根据本发明的实施例的博客内容搜索方法和系 统通过在倒排数据块的 头部添加博客生成时间戳跳表, 通过该跳表, 可以根据用户输入的检索时间 范围直接跳到可能取到结果的倒排数据块进行 检索, 大大缩短了搜索时间, 提高了搜索效率, 另外, 通过时间戳跳表可以检索到时间较老的数据, 保证 了搜索结果的准确性和完整性。

以上描述了本发明的各个实施例, 但是它们并非对本发明作任何形式上 的限制, 本发明的范围由后附的权利要求来定义。 在不脱离本发明的精神和 原则的情况下, 对以上各个实施例所作的任何修改、 等同变化与修饰, 均包 含在权利要求的保护范围内。