Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD AND SYSTEM FOR ESTABLISHING WEBPAGE DATABASE, AND RECOMMENDATION METHOD AND SYSTEM
Document Type and Number:
WIPO Patent Application WO/2013/131432
Kind Code:
A1
Abstract:
Disclosed are a method and system for establishing a webpage database, and a recommendation method and system. The method for establishing a webpage database comprises: when a user accesses a webpage, sending the URL of the webpage to a browser server; the browser server judging whether the webpage exists in a database according to the URL of the webpage; if the webpage doesn't exist in the database, grabbing description information about the webpage; and determining the category to which the webpage belongs according to the description information, adding the webpage into the category corresponding to the database so as to recommend webpages of the same category to users according to data saved in the database when other users in the network also access the webpage. The present invention can establish a webpage database based on the access situation of users, and then provide a foundation for recommending webpages to the users.

Inventors:
WAN YONG (CN)
REN HUAN (CN)
MA ZHIHUA (CN)
LI TIEJUN (CN)
CHEN YINGYING (CN)
Application Number:
PCT/CN2013/071796
Publication Date:
September 12, 2013
Filing Date:
February 22, 2013
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
BEIJING QIHOO TECH CO LTD (CN)
QIZHI SOFTWARE BEIJING CO LTD (CN)
International Classes:
G06F17/30
Foreign References:
CN102629265A2012-08-08
CN102708132A2012-10-03
CN102693271A2012-09-26
CN101577866A2009-11-11
CN102054004A2011-05-11
US20110302191A12011-12-08
Attorney, Agent or Firm:
WISEAST INTELLECTUAL PROPERTY LAW FIRM (CN)
北京智汇东方知识产权代理事务所(普通合伙) (CN)
Download PDF:
Claims:
权 利 要 求

1、 一种建立网页数据库的方法, 其包括:

当用户访问一网页时, 将所述网页的网址发送到浏览器的服务器;

浏览器的服务器根据所述网页的网址判断数据库中是否存在该网页;

如果不存在, 则抓取所述网页的描述信息;

根据所述描述信息确定所述网页所属的类别, 并将所述网页加入到数据库对应的类 别中, 以便当网络中的其他用户再访问该网页时, 根据所述数据库中保存的数据向用户 进行同类别网页的推荐。

2、 根据权利要求 1所述的方法, 其中, 所述网页数据库中还保存各个网页的用户访 问次数, 所述方法还包括:

将该网页的用户访问次数置为一。

3、 根据权利要求 2所述的方法, 其中, 还包括:

如果浏览器的服务器根据所述网页的网址判断出数据库中存在该网页, 则将该网页 的用户访问次数在当前值的基础上加一。

4、 根据权利要求 1所述的方法, 其中, 所述当用户访问一网页时, 将所述网页的网 址发送到浏览器的服务器包括:

当用户访问一网页时, 判断用户访问的网页是否为预置的特定网页;

如果是, 将所述网页的网址发送到浏览器的服务器。

5、 根据权利要求 1所述的方法, 其中, 所述抓取所述网页的描述信息包括: 抓取所述网页的网页标题和 /或头信息。

6、 一种建立网页数据库的系统, 其包括:

发送单元, 用于当用户访问一网页时, 将所述网页的网址发送到浏览器的服务器; 判断单元,用于浏览器的服务器根据所述网页的网址判断数据库中是否存在该网页; 描述信息获取单元, 用于如果不存在, 则抓取所述网页的描述信息;

加入单元, 用于才 居所述描述信息确定所述网页所属的类别, 并将所述网页加入到 数据库对应的类别中, 以便当网络中的其他用户再访问该网页时, 根据所述数据库中保 存的数据向用户进行同类别网页的推荐。

7、 根据权利要求 6所述的系统, 其中, 所述网页数据库中还保存各个网页的用户访 问次数, 所述系统还包括:

参数设置单元, 用于将该网页的用户访问次数置为一。

8、 根据权利要求 7所述的系统, 其中, 还包括: 参数更新单元, 用于如果浏览器的服务器根据所述网页的网址判断出数据库中存在 该网页, 则将该网页的用户访问次数在当前值的基础上加一。

9、 根据权利要求 6所述的系统, 其中, 所述发送单元包括:

判断子单元, 用于当用户访问一网页时, 判断用户访问的网页是否为预置的特定网 页;

发送子单元, 用于如果是, 将所述网页的网址发送到浏览器的服务器。

10、 根据权利要求 6所述的系统, 其中, 所述描述信息获取单元包括:

抓取子单元, 用于抓取所述网页的网页标题和 /或头信息。

11、 一种网页推荐方法, 其包括:

当用户访问一特定网页时, 浏览器的客户端将所述特定网页的网址发送到浏览器的 服务器;

所述浏览器的服务器判断所述特定网页所属的类别, 从预先基于用户的访问情况建 立的数据库中取出该类别下的其他网页信息, 并返回给所述浏览器的客户端;

所述浏览器的客户端根据接收到的内容向用户进行同类别网页的推荐。

12、 根据权利要求 11所述的方法, 其中, 所述浏览器的服务器判断所述特定网页所 属的类别包括:

所述浏览器的服务器根据所述特定网页的网址判断数据库中是否存在该网页; 如果存在, 则查询该特定网页在所述数据库中所属的类别, 将该类别确定为该特定 网页所属的类别。

13、 根据权利要求 11所述的方法, 其中, 所述浏览器的服务器判断所述特定网页所 属的类别包括:

所述浏览器的服务器抓取所述特定网页的描述信息;

根据所述描述信息确定该特定网页所属的类别。

14、 根据权利要求 11所述的方法, 其中, 通过以下方式建立所述数据库: 当用户访问一网页时, 将所述网页的网址发送到浏览器的服务器;

浏览器的服务器根据所述网页的网址判断数据库中是否存在该网页;

如果不存在, 则抓取所述网页的描述信息;

根据所述描述信息确定所述网页所属的类别, 并将所述网页加入到数据库对应的类 别中。

15、 根据权利要求 14所述的方法, 其中, 所述数据库中还保存有各个网页的用户访 问次数信息, 所述根据接收到的内容向用户进行同类别网页的推荐包括:

将与所述特定网页同类别中用户访问次数最多的指定数目的网页推荐给用户。 16、 一种网页推荐系统, 其包括:

发送单元, 用于当用户访问一特定网页时, 浏览器的客户端将所述特定网页的网址 发送到浏览器的服务器;

处理单元, 用于所述浏览器的服务器判断所述特定网页所属的类别, 从预先基于用 户的访问情况建立的数据库中取出该类别下的其他网页信息, 并返回给所述浏览器的客 户端;

推荐单元, 用于所述浏览器的客户端根据接收到的内容向用户进行同类别网页的推 荐。

17、 根据权利要求 16所述的系统, 其中, 所述处理单元包括:

查询子单元, 用于所述浏览器的服务器根据所述特定网页的网址判断数据库中是否 存在该网页;

第一确定子单元, 用于如果存在, 则查询该特定网页在所述数据库中所属的类别, 将该类别确定为该特定网页所属的类别。

18、 根据权利要求 16所述的系统, 其中, 所述处理单元包括:

抓取子单元, 用于所述浏览器的服务器抓取所述特定网页的描述信息;

第二确定子单元, 用于根据所述描述信息确定该特定网页所属的类别。

19、 根据权利要求 16所述的系统, 其中, 通过以下方式建立所述数据库: 当用户访问一网页时, 将所述网页的网址发送到浏览器的服务器;

浏览器的服务器根据所述网页的网址判断数据库中是否存在该网页;

如果不存在, 则抓取所述网页的描述信息;

根据所述描述信息确定所述网页所属的类别, 并将所述网页加入到数据库对应的类 别中。

20、 根据权利要求 19所述的系统, 其中, 所述数据库中还保存有各个网页的用户访 问次数信息, 所述推荐单元具体用于:

将与所述特定网页同类别中用户访问次数最多的指定数目的网页推荐给用户。

21、 一种网络信息推荐方法, 其包括:

当用户通过浏览器访问一网页时, 所述浏览器提取所述网页的关键信息; 将所述网页的关键信息通过预置的地址发送到搜索引擎服务器, 以便由所述搜索引 擎服务器根据所述关键信息搜索与所述网页相关的用于推荐的网络信息;

根据搜索弓 I擎服务器返回的搜索结果, 向用户进行网络信息的推荐。

22、 根据权利要求 21所述的方法, 其中, 所述提取所述网页的关键信息包括: 提取所述网页内容的中心词。 23、 根据权利要求 22所述的方法, 其中, 所述提取所述网页内容的中心词包括: 抓取所述网页中的文字内容; 分析所述文字内容, 提取所述网页内容的中心词; 或者,

获取所述网页的头信息; 分析所述头信息, 提取所述网页内容的中心词。

24、 根据权利要求 21所述的方法, 其中, 所述提取所述网页的关键信息包括: 提取所述网页的统一资源定位符 URL。

25、 根据权利要求 24所述的方法, 其中, 所述搜索引擎通过以下方式搜索与所述网 页相关的用于推荐的网络信息:

根据所述 URL, 判断所述网页是否收录在分类网络信息数据库中;

如果是, 则将所述分类网络信息数据库中, 与所述网页属于同一类别的网络信息, 确定为与所述网页相关的用于推荐的网络信息。

26、 根据权利要求 25所述的方法, 其中, 如果所述网页尚未收录在分类网络信息数 据库中, 则还包括:

所述搜索引擎确定所述网页所属的类别, 并将所述网页收录到所述分类网络信息数 据库中对应的类别下。

27、 根据权利要求 21所述的方法, 其中, 所述浏览器通过以下方式确定用户访问的 网页是否为所述特定网页, 如果是, 再执行提取关键信息以及后续步骤:

当用户访问一网页时,获取该网页的统一资源定位符 URL,通过判断所述 URL所属 的域名是否出现在预置的域名列表中, 判断该网页是否为符合预置条件的特定网页; 或者,

当用户访问一网页时, 根据该网页的网页标题, 通过判断所述网页标题中是否存在 预置的关键词, 判断该网页是否为符合预置条件的特定网页。

28、 根据权利要求 21所述的方法, 其中:

所述搜索引擎服务器在获得与所述网页匹配的搜索结果之后, 查看针对所述网页的 历史推荐记录, 向所述浏览器返回历史推荐记录中用户点击量较高的搜索结果。

29、 一种网络信息推荐系统, 其包括:

信息提取单元, 用于当用户通过浏览器访问一网页时, 所述浏览器提取所述网页的 关键信息;

发送单元, 用于将所述网页的关键信息通过预置的地址发送到搜索引擎服务器, 以 便由所述搜索引擎服务器根据所述关键信息搜索与所述网页相关的网络信息;

信息推荐单元, 用于根据搜索引擎服务器返回的搜索结果, 向用户进行网络信息的 推荐。 30、 根据权利要求 29所述的系统, 其中, 所述信息提取单元包括: 中心词提取子单元, 用于提取所述网页内容的中心词。

31、 根据权利要求 30所述的系统, 其中, 所述中心词提取子单元包括: 第一分析子单元, 用于抓取所述网页中的文字内容; 分析所述文字内容, 提取所述 网页内容的中心词;

或者,

第二分子单元, 用于获取所述网页的头信息; 分析所述头信息, 提取所述网页内容 的中心词。

32、 根据权利要求 29所述的系统, 其中, 所述信息提取单元包括:

URL提取子单元, 用于提取所述网页的统一资源定位符 URL。

33、 根据权利要求 32所述的系统, 其中, 所述搜索引擎服务器包括:

判断单元, 用于根据所述 URL, 判断所述网页是否收录在分类网络信息数据库中; 相关信息确定单元, 用于如果是, 则将所述分类网络信息数据库中, 与所述网页属 于同一类别的网络信息, 确定为与所述网页相关的网络信息。

34、 根据权利要求 33所述的系统, 其中, 所述搜索引擎服务器还包括: 网页收录单元, 用于如果所述网页尚未收录在分类网络信息数据库中, 所述搜索引 擎确定所述网页所属的类别, 并将所述网页收录到所述分类网络信息数据库中对应的类 别下。

35、 根据权利要求 29所述的系统, 其中, 所述信息提取单元包括:

第一判断子单元, 用于当用户访问一网页时, 获取该网页的统一资源定位符 URL, 通过判断所述 URL所属的域名是否出现在预置的域名列表中,判断该网页是否为符合预 置条件的特定网页, 如果是, 提取所述特定网页的关键信息;

或者,

第二判断子单元, 用于当用户访问一网页时, 根据该网页的网页标题, 通过判断所 述网页标题中是否存在预置的关键词, 判断该网页是否为符合预置条件的特定网页, 如 果是, 提取所述特定网页的关键信息。

36、 根据权利要求 29所述的系统, 其中, 所述搜索引擎服务器包括:

筛选子单元, 用于在获得与所述网页匹配的搜索结果之后, 查看针对所述网页的历 史推荐记录, 向所述浏览器返回历史推荐记录中用户点击量较高的搜索结果。

37、 一种计算机程序, 包括计算机可读代码, 当所述计算机可读代码在服务器上运 行时, 导致所述服务器执行根据权利要求 1-5、 10-15和 21-28中的任一个所述的方法。

38、 一种计算机可读介盾, 其中存储了如权利要求 37所述的计算机程序。

Description:
建立网页数据库的方法及系统和推荐方法及系 统 技术领域

本发明涉及浏览器技术及搜索技术领域, 特别是涉及一种建立网页数据库的方 法及系统和推荐方法及系统。 背景技术

随着互联网技术的迅猛发展和普及, 人们对互联网的依赖程度变得越来越高, 从互联网获得信息资讯已成为人们主要的信息 来源方式, 而浏览器则是人们获得网 络信息的主要工具。 然而现有的浏览器的功能通常仅局限于展现网 页中已有的内容, 也即, 网页制作者在网页中设计了什么内容, 浏览器就显示什么内容, 用户也只能 根据网页中显示出的内容进行相关信息的浏览 。 这样会使得一些网络信息无法得到 充分地利用, 用户通过浏览器获取到有效信息的效率也会比 较低。 发明内容

鉴于上述问题, 提出了本发明以便提供一种克服上述问题或者 至少部分地解决 或者减緩上述问题的建立网页数据库的方法及 系统和推荐方法及系统。

根据本发明的一个方面, 提供了一种建立网页数据库的方法, 包括: 当用户访问 一网页时, 将所述网页的网址发送到浏览器的服务器; 浏览器的服务器根据所述网页的 网址判断数据库中是否存在该网页; 如果不存在, 则抓取所述网页的描述信息; 根据所 述描述信息确定所述网页所属的类别, 并将所述网页加入到数据库对应的类别中, 以便 当网络中的其他用户再访问该网页时, 根据所述数据库中保存的数据向用户进行同类 别 网页的推荐。

根据本发明的另一个方面, 提供了一种建立网页数据库的系统, 包括发送单元, 用于当用户访问一网页时, 将所述网页的网址发送到浏览器的服务器; 判断单元, 用于 浏览器的服务器根据所述网页的网址判断数据 库中是否存在该网页;描述信息获取单元, 用于如果不存在, 则抓取所述网页的描述信息; 加入单元, 用于根据所述描述信息确定 所述网页所属的类别, 并将所述网页加入到数据库对应的类别中, 以便当网络中的其他 用户再访问该网页时, 根据所述数据库中保存的数据向用户进行同类 别网页的推荐。

根据本发明的另一个方面, 提供了一种网页推荐方法, 包括当用户访问一特定网 页时, 浏览器的客户端将所述特定网页的网址发送到 浏览器的服务器; 所述浏览器的服 务器判断所述特定网页所属的类别, 从预先基于用户的访问情况建立的数据库中取 出该 类别下的其他网页信息, 并返回给所述浏览器的客户端; 所述浏览器的客户端根据接收 到的内容向用户进行同类别网页的推荐。

根据本发明的另一个方面, 提供了一种网页推荐系统, 包括发送单元, 用于当用 户访问一特定网页时, 浏览器的客户端将所述特定网页的网址发送到 浏览器的服务器; 处理单元, 用于所述浏览器的服务器判断所述特定网页所 属的类别, 从预先基于用户的 访问情况建立的数据库中取出该类别下的其他 网页信息, 并返回给所述浏览器的客户端; 推荐单元, 用于所述浏览器的客户端根据接收到的内容向 用户进行同类别网页的推荐。

根据本发明的另一个方面, 提供了一种网络信息推荐方法, 包括当用户通过浏览 器访问一网页时, 所述浏览器提取所述网页的关键信息; 将所述网页的关键信息通过预 置的地址发送到搜索引擎服务器, 以便由所述搜索引擎服务器根据所述关键信息 搜索与 所述网页相关的用于推荐的网络信息; 根据搜索引擎服务器返回的搜索结果, 向用户进 行网络信息的推荐。

根据本发明的另一个方面, 提供了一种网络信息推荐系统, 包括信息提取单元, 用于当用户通过浏览器访问一网页时, 所述浏览器提取所述网页的关键信息; 发送单元, 用于将所述网页的关键信息通过预置的地址发 送到搜索引擎服务器, 以便由所述搜索引 擎服务器根据所述关键信息搜索与所述网页相 关的网络信息; 信息推荐单元, 用于根据 搜索引擎服务器返回的搜索结果, 向用户进行网络信息的推荐。

根据本发明的又一个方面, 提供了一种计算机程序, 其包括计算机可读代码, 当所述计算机可读代码在服务器上运行时, 导致所述服务器执行根据权利要求 1-5、 10-15和 21-28中的任一个所述的方法。

根据本发明的再一个方面, 提供了一种计算机可读介盾, 其中存储了如权利要 求 37所述的计算机程序。

本发明的有益效果为:

首先, 通过本发明, 能够根据用户对网页的访问情况, 建立网页的分类数据库, 这样当其他用户再次访问数据库中保存的网页 时, 就可以根据该网页所属的类别, 以及该类别下的其他网页, 向用户进行网页推荐, 以使得用户能够通过浏览器的推 荐获取到更多的网络信息, 并且由于这些网络信息是从用户的访问数据中 统计的, 因此, 提供给用户时, 符合用户期望的可能性会比较大, 相应的, 其利用率也就会 比较高。

其次, 通过本发明, 在用户访问某网页的过程中, 浏览器可以为用户提供与该 网页内容相关的其他网络信息的推荐, 这种其他网络信息可能包括其他一个网页的 链接, 或者音视频等文件的下载链接等等, 使得用户能够获取到更多的网络信息, 相应的, 也可以提高网络信息的利用率。

上述说明仅是本发明技术方案的概述,为了能 够更清楚了解本发明的技术手段, 而可依照说明书的内容予以实施, 并且为了让本发明的上述和其它目的、 特征和优 点能够更明显易懂, 以下特举本发明的具体实施方式。 附图说明

通过阅读下文优选实施方式的详细描述, 各种其他的优点和益处对于本领域普 通技术人员将变得清楚明了。 附图仅用于示出优选实施方式的目的, 而并不认为是 对本发明的限制。 而且在整个附图中, 用相同的参考符号表示相同的部件。 在附图 中:

图 1示出了根据本发明一个实施例的建立网页数 库的方法的流程图; 图 2示出了根据本发明一个实施例的建立网页数 库的系统的示意图; 图 3示出了根据本发明一个实施例的网页推荐方 的流程图;

图 4示出了根据本发明一个实施例的网页推荐系 的示意图;

图 5示出了根据本发明一个实施例的网络信息推 方法的流程图;

图 6示出了根据本发明一个实施例的网络信息推 系统的示意图;

图 7示意性地示出了用于执行根据本发明的方法 服务器的框图; 以及 图 8示意性地示出了用于保持或者携带实现根据 发明的方法的程序代码的存 储单元。 具体实施例

下面结合附图和具体的实施方式对本发明作进 一步的描述。

为了能够提高网络信息的利用率, 以及用户获取有效信息的效率, 本发明实施 例提供了一种建立网页数据库的方法, 以期在建立起该网页数据库的基础上, 能够 为用户进行相关网页的推荐。 参见图 1 , 该建立网页数据库的方法包括以下步骤: S 101 : 当用户访问一网页时, 将所述网页的网址发送到浏览器的服务器; 在本发明实施例中, 建立网页数据库的操作可以由浏览器的服务器 端来完成, 并且, 建立的网页数据库, 并不是基于全网中的所有网站来建立的, 而是基于用户 的访问。 也即, 只有被用户访问过的网站才会被收录到本发明 实施例的网页数据库 中, 进而才会用于向用户的推荐。 具体实现时, 由于用户访问网页的操作都是通过 浏览器的客户端来完成的, 因此, 浏览器客户端能够获取到用户访问网页的信息 , 并且能够知晓用户访问的网页的网址 (可以是指网页的 URL ( Uniform / Universal Resource Locator统一资源定位符) ) , 因此, 当用户访问某网页时, 客户端就可以 将该网页的网址发送到浏览器的服务器, 供服务器建立网页数据库使用。

在实际应用中, 通常是对于一些特定类型的网页, 向用户推荐相关的其他网页 时, 才会更有意义。 例如, 比较常见的是情况是团购网站, 每个团购网站都会推出 各自的团购项目, 其中有些团购项目可能是类似的, 如果用户对其中某个团购网站 (假设为网站 A )推出的某个团购项目 (假设为项目 X )感兴趣, 则该用户也可能会 其他团购网站(假设为网站 B )推出的与该团购项目类似的项目感兴趣, 此时, 就可 以将该团购网站 B推出的该类似的团购项目推荐给该用户, 使得用户能够在多个团 购网站中选择出更有的团购项目。 因此, 在本发明实施例中, 可以仅当用户访问的 网页是一些特定的网页时, 才会将其网址发送给浏览器的服务器。 具体实现时, 可 以预先建立一些特殊网站的域名的名单, 例如, 如果需要对团购类的网站进行推荐, 则可以预先统计出团购网站的域名 (可以网络中能够获知到的全部的团购网站, 还 可以是一部分比较优盾的团购网站)加入到名 单中, 当用户访问某网页时, 如果发 现该网页的网址域名在该名单中, 则将其发送给服务器, 否则, 就可以不必发送。 当然, 除了团购网站之外, 还可以是其他类型的网址, 例如博客, 等等。 其中, 关 于上述名单, 可以是以匹配列表的方式存在, 也即, 当用户访问的网页满足一个匹 配列表时才发送。 比如: 满足 "http://www.dianping.com/*" , *表示当访问了 "点评 网" 下面的网址时, 才会触发网址上传。 而这个匹配列表, 可以使用配置文件的方 式下发, 比如每天浏览器客户端会到服务器下载一次配 置文件, 以获取其中的匹配 列表, 等等。

另外需要说明的是, 在实际应用中, 为了防止用户的隐私受到侵犯, 上述上传 网址的操作, 可以是在用户允许的情况下进行的, 例如, 在用户选择了网址推荐服 务的情况下, 才会进行上传, 否则, 如果用户没有选择该服务, 则可以不必将用户 访问的网页的网址上传到服务器。

S 102: 浏览器的服务器根据所述网页的网址判断数据 库中是否存在该网页; 浏览器的服务器在收到客户端发送来的网页的 网址之后, 就可以首先判断数据 库中是否已经存在该网页, 如果已经存在, 则证明该网页不是首次被用户访问, 之 前已经有用户访问过该网页了, 同时, 如果数据库中保存了各个网页的用户访问次 数, 则还可以直接将数据库中该网页的用户访问次 数加一。

S103 : 如果不存在, 则抓取所述网页的描述信息;

如果数据库中不存在该网页, 则证明该网页是第一次被用户访问, 因此, 浏览 器的服务器就可以首先去抓取该网页的描述信 息, 以便于确定该网页的主要内容, 进而为该网页分类。 具体在抓取网页的描述信息时, 可以是抓取网页的网页标题以 及头信息, 因为网页标题通常是用于概括网页主要内容的 文字, 而头信息中也通常 会包括一些类型、 关键词等信息。

S104: 根据所述描述信息确定所述网页所属的类别, 并将所述网页加入到数据 库对应的类别中, 以便当网络中的其他用户再访问该网页时, 根据所述数据库中保 存的数据向用户进行同类别网页的推荐。

获取到网页的描述信息之后, 就可以确定出该网页所述的类别, 并将网页加入 到数据库中对应的类别下。 这样, 随着大量的用户对各个网页的访问, 就可以在浏 览器的服务器端建立起具有一定规模的网页数 据库, 进而, 就可以根据该网页数据 库向用户进行网页推荐了。 例如, 用户在访问某网页 A时, 浏览器的客户端就可以 将该网页 A的网址发送给浏览器的服务器, 浏览器的服务器发现该网页 A在数据库 中存在, 并且属于类别 M, 因此, 就可以将类别 M下的其他网页推荐给该用户。

总之, 在本发明实施例中, 在建立网页数据库的过程中, 如果某网页是第一次 被用户访问, 则服务器会去抓取这个网页的描述信息, 以确定该网页所属的类别, 并将该网页加入到数据库中的该类别中, 同时可以将该网页的用户访问次数置为 1。 如果该网页不是第一次被访问, 就可以在数据库中将该网页的用户访问次数加 一。 在向用户进行网页推荐时, 可以将用户访问次数作为参考, 用户访问次数越多的网 页越有机会推荐给用户。 当然, 也可以以其他的参数作为推荐的依据。

具体实现时, 为用户进行网页推荐的过程与建立及维护网页 数据库的过程可以 是同步进行的, 也即在用户访问网页的过程中, 既可以向用户进行其他网页的推荐, 还可以基于用户当前访问的网页更新网页数据 库中的数据。

也就是说, 当用户访问某网页时, 将该网页发送到浏览器的服务器, 浏览器的 服务器首先根据该网页的网址判断该网页是否 已经在数据库中存在, 如果存在, 则 找到该网页在数据库中所属的类别, 将该网页在数据库中所属类别下的其他网站推 荐给用户, 同时, 将数据库中该网页的用户访问次数加一; 如果不存在, 则抓取该 网页的标题及头信息 (header ) , 通过分析该标题及头信息, 确定该网页所属的类别 (该类别一般是预先建立好的, 例如, 针对团购网站, 建立了餐饮、 酒店、 娱乐等 大类, 每一大类下还可以建立小类, 如餐饮下可以建立火锅、 烧烤、 自助餐等等小 类别) , 然后将该网页的网址加入到数据库中对应的类 别下, 同时, 将该网页的用 户访问次数置为 1。

例如, 某团购网站的首页中新推出了一个团购项目, 是一个关于火锅的团购, 假设用户 A第一时间刷新了该团购网站, 发现该团购项目后, 点击访问了该团购项 目的网页 X, 此时, 浏览器客户端就可以将该访问信息发送到浏览 器的服务器, 浏 览器的服务器就可以在数据库中查询是否存在 该网页 X, 发现不存在, 就可以去抓 取该网页 X的网页标题及头信息, 之后经过分析发现该网页 X应该属于 "火锅" 类, 就可以将该网页 X的网址加入到数据库的 "火锅" 类别下, 同时, 将该网页 X的用 户访问次数置为 1。 之后, 当用户 B访问该网页 X时, 浏览器同样会将该访问信息 发送到浏览器的服务器, 浏览器的服务器经查询, 发现数据库中存在该网页 A的网 址, 并且该网址属于 "火锅,, 类, 此时, 就可以将数据库中同样属于该火锅类的其 他网页推荐给用户, 同时, 还可以将数据库中该网页 A的用户访问次数加 1 , 以此 类推。 并且, 在向用户进行网页推荐时, 除了类别信息以外, 还可以参考用户访问 次数信息, 也即, 可以将网页 A所述类别中, 用户访问次数最多的几个网页推荐给 该用户 A。

总之, 通过本发明实施例提供的方法, 能够实现基于用户访问情况的建立网页 数据库, 进而向用户进行网页推荐, 因此, 用户能够通过浏览器得到更多的、 更有 效的信息, 能够减少用户获取有效信息所需的时间, 同时, 提高网络信息的利用率。

与本发明实施例提供的建立网页数据库的方法 相对应, 本发明实施例提供了一 种建立网页数据库的系统, 参见图 2, 该系统包括:

发送单元 201 , 用于当用户访问一网页时, 将所述网页的网址发送到浏览器的服 务器;

判断单元 202,用于浏览器的服务器根据所述网页的网址 断数据库中是否存在 该网页;

描述信息获取单元 203 , 用于如果不存在, 则抓取所述网页的描述信息; 加入单元 204, 用于根据所述描述信息确定所述网页所属的类 别, 并将所述网页 加入到数据库对应的类别中, 以便当网络中的其他用户再访问该网页时, 根据所述 数据库中保存的数据向用户进行同类别网页的 推荐。

其中, 所述网页数据库中还保存各个网页的用户访问 次数, 所述系统还包括: 参数设置单元, 用于将该网页的用户访问次数置为一。

该系统还可以包括:

参数更新单元, 用于如果浏览器的服务器根据所述网页的网址 判断出数据库中 存在该网页, 则将该网页的用户访问次数在当前值的基础上 加一。

其中, 发送单元 201可以包括:

判断子单元, 用于当用户访问一网页时, 判断用户访问的网页是否为预置的特 定网页;

发送子单元, 用于如果是, 将所述网页的网址发送到浏览器的服务器。

描述信息获取单元 203可以包括:

抓取子单元, 用于抓取所述网页的网页标题和 /或头信息。

总之, 通过本发明实施例提供的建立网页数据库的系 统, 能够根据用户对网页 的访问情况, 建立网页的分类数据库, 这样当其他用户再次访问数据库中保存的网 页时, 就可以根据该网页所属的类别, 以及该类别下的其他网页, 向用户进行网页 推荐, 以使得用户能够通过浏览器的推荐获取到更多 的网络信息, 并且由于这些网 络信息是从用户的访问数据中统计的, 因此, 提供给用户时, 符合用户期望的可能 性会比较大, 相应的, 其利用率也就会比较高。

为了能够提高网络信息的利用率, 以及用户获取有效信息的效率, 本发明实施 例还提供了一种网页推荐的方法, 在使用该方法进行网页推荐之前, 需要预先建立 起网页数据库, 该网页数据库中包含有多个类别, 每个类别下包含多个网页, 其中 还可以包含各个网页的用户访问次数等参数, 根据这些信息就可以向用户进行推荐。 在具体实现时, 该网页数据库可以通过多种方式建立, 例如, 其中一种方式可以是: 当用户访问一网页时, 将所述网页的网址发送到浏览器的服务器, 然后由浏览 器的服务器根据所述网页的网址判断数据库中 是否存在该网页, 如果不存在, 则抓 取所述网页的描述信息, 然后再根据所述描述信息确定所述网页所属的 类别, 并将 所述网页加入到数据库对应的类别中。 这样, 每当有一个网页首次被用户访问时, 网页数据库中就可以多一条网页数据。 如果需要保存用户访问次数的参数, 则可以 在网页首次加到数据库中时, 将网页的用户访问次数置为 1 , 之后再有用户访问相同 的网页时, 就可以将相应网页的用户访问次数加一。

具体的, 建立网页数据库的操作可以由浏览器的服务器 端来完成, 并且, 在本 发明实施例中, 建立的网页数据库, 并不是基于全网中的所有网站来建立的, 而是 基于用户的访问。 也即, 只有被用户访问过的网站才会被收录到本发明 实施例的网 页数据库中, 进而才会用于向用户的推荐。 具体实现时, 由于用户访问网页的操作 都是通过浏览器的客户端来完成的, 因此, 浏览器客户端能够获取到用户访问网页 的信息, 并且能够知晓用户访问的网页的网址 (可以是指网页的 URL ( Uniform / Universal Resource Locator统一资源定位符) ) , 因此, 当用户访问某网页时, 客户 端就可以将该网页的网址发送到浏览器的服务 器, 供服务器建立网页数据库使用。

当然, 在实际应用中, 通常是对于一些特定类型的网页, 向用户推荐相关的其 他网页时, 才会更有意义。 例如, 比较常见的是情况是团购网站, 每个团购网站都 会推出各自的团购项目, 其中有些团购项目可能是类似的, 如果用户对其中某个团 购网站(假设为网站 A )推出的某个团购项目 (假设为项目 X )感兴趣, 则该用户也 可能会其他团购网站(假设为网站 B )推出的与该团购项目类似的项目感兴趣,此 , 就可以将该团购网站 B推出的该类似的团购项目推荐给该用户, 使得用户能够在多 个团购网站中选择出更有的团购项目。 因此, 在本发明实施例中, 可以仅当用户访 问的网页是一些特定的网页时, 才会将其网址发送给浏览器的服务器。 具体实现时, 可以预先建立一些特殊网站的域名的名单, 例如, 如果需要对团购类的网站进行推 荐, 则可以预先统计出团购网站的域名 (可以网络中能够获知到的全部的团购网站, 还可以是一部分比较优盾的团购网站) 加入到名单中, 当用户访问某网页时, 如果 发现该网页的网址域名在该名单中, 则将其发送给服务器, 否则, 就可以不必发送。 当然, 除了团购网站之外, 还可以是其他类型的网址, 例如博客, 等等。

其中, 关于上述名单, 可以是以匹配列表的方式存在的, 也即, 当用户访问的 网页满足一个匹配列表时才发送。 比如, 满足 "http://www.dianping.com/* " , *表示 当访问了 "点评网" 下面的网址时, 才会触发网址上传。 而这个匹配列表, 可以使 用配置文件的方式下发, 比如每天浏览器客户端会到服务器下载一次配 置文件, 以 获取其中的匹配列表, 等等。

另外需要说明的是, 在实际应用中, 为了防止用户的隐私受到侵犯, 上述上传 网址的操作, 可以是在用户允许的情况下进行的, 例如, 在用户选择了网址推荐服 务的情况下, 才会进行上传, 否则, 如果用户没有选择该服务, 则可以不必将用户 访问的网页的网址上传到服务器。

浏览器的服务器在收到客户端发送来的网页的 网址之后, 就可以首先判断数据 库中是否已经存在该网页, 如果已经存在, 则证明该网页不是首次被用户访问, 之 前已经有用户访问过该网页了, 同时, 如果数据库中保存了各个网页的用户访问次 数, 则还可以直接将数据库中该网页的用户访问次 数加一。

如果数据库中不存在该网页, 则证明该网页是第一次被用户访问, 因此, 浏览 器的服务器就可以首先去抓取该网页的描述信 息, 以便于确定该网页的主要内容, 进而为该网页分类。 具体在抓取网页的描述信息时, 可以是抓取网页的网页标题以 及头信息, 因为网页标题通常是用于概括网页主要内容的 文字, 而头信息中也通常 会包括一些类型、 关键词等信息。

获取到网页的描述信息之后, 就可以确定出该网页所述的类别, 并将网页加入 到数据库中对应的类别下。 这样, 随着大量的用户对各个网页的访问, 就可以在浏 览器的服务器端建立起具有一定规模的网页数 据库, 进而, 就可以根据该网页数据 库向用户进行网页推荐了。 例如, 用户在访问某网页 A时, 浏览器的客户端就可以 将该网页 A的网址发送给浏览器的服务器, 浏览器的服务器发现该网页 A在数据库 中存在, 并且属于类别 M, 因此, 就可以将类别 M下的其他网页推荐给该用户。

基于此, 参见图 3 , 本发明实施例提供的网页推荐方法就可以包括 以下步骤: S301 : 当用户访问一特定网页时, 浏览器的客户端将所述特定网页的网址发送 到浏览器的服务器;

为了针对用户访问的网页向用户推荐其他的网 页, 就需要将该网页的网址发送 给浏览器的服务器, 以便浏览器的服务器具体查询该网页在网页数 据库中所属的类 别。

S302: 所述浏览器的服务器判断所述特定网页所属的 类别, 从预先基于用户的 访问情况建立的数据库中取出该类别下的其他 网页信息, 并返回给所述浏览器的客 户端;

具体实现时, 可以有多种确定网页所属类别的方式。 例如, 其中一种方式可以 是, 直接根据网页的网址去抓取网页的描述信息, 然后根据对描述信息的分析, 确 定出该网页所属的类别。 其中, 该描述信息可以是指网页的网页标题和 /或头信息, 等等。 或者, 在本发明实施例中, 如果按照前述例子中的方式建立起的网页数据 库, 则当用户访问到某网页时, 如果该网页不是第一次被用户访问, 则该网页应该已经 被收录进网页数据库中, 并且在加入网页数据库时, 已经为该网页确定了类别, 因 此, 直接在数据库中查询, 就可以得知该网页的类别, 进而, 取出该类别下的其他 网页即可。 因此, 在这种实现方式下, 如果某网页是第一次被用户访问, 由于数据 库中不存在该网页的信息, 因此可以暂时不向用户进行网页的推荐, 但同时, 会将 该首次被用户访问的网页加入到网页数据库中 , 这样, 当其他用户再访问这个网页 时, 就可以得到相关的推荐信息。

其中, 在向用户提供推荐的网页时, 还可以考虑数据库中记录的各个网页的用 户访问次数等因此, 因为, 如果一个网页的用户访问次数越高, 则该网页被该用户 接受的概率也就越高, 也就使得推荐更有意义。 因此, 在数据库中保存了各个网页 的用户访问次数的情况下, 可以将与所述特定网页同类别中用户访问次数 最多的指 定数目的网页推荐给用户。

可见, 在本发明实施例中, 为用户进行网页推荐的过程与建立及维护网页 数据 库的过程可以是同步进行的, 也即在用户访问网页的过程中, 既可以向用户进行其 他网页的推荐, 还可以基于用户当前访问的网页更新网页数据 库中的数据。

也就是说, 当用户访问某网页时, 将该网页发送到浏览器的服务器, 浏览器的 服务器首先根据该网页的网址判断该网页是否 已经在数据库中存在, 如果存在, 则 找到该网页在数据库中所属的类别, 将该网页在数据库中所属类别下的其他网站推 荐给用户, 同时, 将数据库中该网页的用户访问次数加一; 如果不存在, 则抓取该 网页的标题及头信息 (header ) , 通过分析该标题及头信息, 确定该网页所属的类别 (该类别一般是预先建立好的, 例如, 针对团购网站, 建立了餐饮、 酒店、 娱乐等 大类, 每一大类下还可以建立小类, 如餐饮下可以建立火锅、 烧烤、 自助餐等等小 类别) , 然后将该网页的网址加入到数据库中对应的类 别下, 同时, 将该网页的用 户访问次数置为 1。

例如, 某团购网站的首页中新推出了一个团购项目, 是一个关于火锅的团购, 假设用户 A第一时间刷新了该团购网站, 发现该团购项目后, 点击访问了该团购项 目的网页 X, 此时, 浏览器客户端就可以将该访问信息发送到浏览 器的服务器, 浏 览器的服务器就可以在数据库中查询是否存在 该网页 X, 发现不存在, 就可以去抓 取该网页 X的网页标题及头信息, 之后经过分析发现该网页 X应该属于 "火锅" 类, 就可以将该网页 X的网址加入到数据库的 "火锅" 类别下, 同时, 将该网页 X的用 户访问次数置为 1。 之后, 当用户 B访问该网页 X时, 浏览器同样会将该访问信息 发送到浏览器的服务器, 浏览器的服务器经查询, 发现数据库中存在该网页 A的网 址, 并且该网址属于 "火锅,, 类, 此时, 就可以将数据库中同样属于该火锅类的其 他网页推荐给用户, 同时, 还可以将数据库中该网页 A的用户访问次数加 1 , 以此 类推。 并且, 在向用户进行网页推荐时, 除了类别信息以外, 还可以参考用户访问 次数信息, 也即, 可以将网页 A所述类别中, 用户访问次数最多的几个网页推荐给 该用户 A。

总之, 通过本发明实施例提供的方法, 能够实现基于用户访问情况的建立网页 数据库, 进而向用户进行网页推荐, 因此, 用户能够通过浏览器得到更多的、 更有 效的信息, 能够减少用户获取有效信息所需的时间, 同时, 提高网络信息的利用率。

与本发明实施例提供的网页推荐方法相对应, 本发明实施例还提供了一种网页 推荐系统, 参见图 4 , 该系统包括:

发送单元 401 , 用于当用户访问一特定网页时, 浏览器的客户端将所述特定网页 的网址发送到浏览器的服务器;

处理单元 402, 用于所述浏览器的服务器判断所述特定网页所 属的类别, 从预先 基于用户的访问情况建立的数据库中取出该类 别下的其他网页信息, 并返回给所述 浏览器的客户端;

推荐单元 403 ,用于所述浏览器的客户端根据接收到的内容 用户进行同类别网 页的推荐。

具体实现时, 处理单元 402可以包括:

查询子单元, 用于所述浏览器的服务器根据所述特定网页的 网址判断数据库中 是否存在该网页;

第一确定子单元, 用于如果存在, 则查询该特定网页在所述数据库中所属的类 别, 将该类别确定为该特定网页所属的类别。

或者, 处理单元 402也可以包括:

抓取子单元, 用于所述浏览器的服务器抓取所述特定网页的 描述信息; 第二确定子单元, 用于根据所述描述信息确定该特定网页所属的 类别。

其中, 可以通过以下方式建立所述数据库:

当用户访问一网页时, 将所述网页的网址发送到浏览器的服务器;

浏览器的服务器根据所述网页的网址判断数据 库中是否存在该网页;

如果不存在, 则抓取所述网页的描述信息;

根据所述描述信息确定所述网页所属的类别, 并将所述网页加入到数据库对应 的类别中。

在实际应用中, 所述数据库中还保存有各个网页的用户访问次 数信息, 相应的, 推荐单元 403具体可以用于:

将与所述特定网页同类别中用户访问次数最多 的指定数目的网页推荐给用户。 总之, 通过本发明实施例提供的网页推荐系统, 能够根据用户对网页的访问情 况, 建立网页的分类数据库, 这样当其他用户再次访问数据库中保存的网页 时, 就 可以根据该网页所属的类别, 以及该类别下的其他网页, 向用户进行网页推荐, 以 使得用户能够通过浏览器的推荐获取到更多的 网络信息, 并且由于这些网络信息是 从用户的访问数据中统计的, 因此, 提供给用户时, 符合用户期望的可能性会比较 大, 相应的, 其利用率也就会比较高。

参见图 5 , 本发明实施例提供的网络信息推荐方法包括以 下步骤:

S501 : 当用户通过浏览器访问一网页时, 所述浏览器提取所述网页的关键信息; S502: 将所述网页的关键信息通过预置的地址发送到 搜索引擎服务器, 以便由 所述搜索引擎服务器根据所述关键信息搜索与 所述网页相关的用于推荐的网络信 息;

具体在提取一个网页的关键信息时, 可以通过多种方式, 例如, 其中一种方式 可以是提取网页内容的中心词, 将该中心词发送到预置的搜索引擎服务器进行 搜索, 得到搜索结果。 其中, 网页内容的中心词也就是能够表达网页主要内 容的词, 可能 是一个或多个词、 一个或多个短语, 或者一句或多句话等等。 具体在提取网页内容 的中心词时, 可以将网页中的全部文字内容抓取下来, 进行分析, 从而获取其中能 够表达网页主要内容的文字作为中心词。 其中, 具体在进行分析时, 可以是文章段 落等进行语法分析, 或者还可以是对具体的文字进行语义分析等, 具体实现时均可 以釆用已有技术中的实现方式, 这里不再赘述。 当然, 在实际应用中, 为了提高获 取中心词的效率, 还可以不必将网页中的全部文字内容抓取下来 , 而是仅抓取网页 的部分内容。 例如, 几乎所有的网页设计者都会为网页提供网页标 题, 该网页标题 通常能够描述当前网页的主要内容, 因此, 本发明实施例在提取网页内容的中心词 时, 就可以仅获取网页的网页标题, 进而根据网页标题提取网页内容的中心词即可 。 或者, 网页一般还具有头信息(meta ) , 其中通常包括对网页的描述信息, 例如, 网 页的类别、 关键词等, 因此, 也可以从这些头信息中提取网页内容的中心词 。

对于搜索引擎服务器而言, 在接收到一个网页的中心词之后, 可以根据该中心 词确定出该网页所属的类别, 然后在搜索引擎数据库中中查找出于该网页所 属同一 类别的网络信息作为搜索结果。

当然, 对于某网页, 如果已经获取过其中心词, 则可以在服务器侧保存网页的

URL与中心词之间的对应关系, 这样, 在之前有过数据积累的情况下, 只通过 URL 即可在服务端获取已经分析好的页面中心词。 也就是说, 同样的一个 URL, 只要进 行一次或者少数几次分析其中心词的操作即可 , 不必每次都进行加以分析计算,对于 浏览器而言, 只要将用户访问的网页的 URL发送到搜索引擎, 搜索引擎就可以根据 该 URL获知其网页内容的中心词, 进而将其作为关键词进行搜索即可。

获取到网页的中心词之后, 就可以将其发送到一个搜索引擎服务器进行搜 索。 该搜索引擎服务器可以是预先设置好的, 具体实现时, 相当于是浏览器预先获知了 搜索引擎服务器的地址, 当获取到用户访问的特定网页的中心词之后, 就可以直接 通过该地址发送到该搜索引擎服务器进行搜索 。

在实际应用中, 可以在搜索引擎服务器侧预先存储一个分类网 络信息数据库, 该数据库中将网络中的网页分为多个类别, 这样, 当浏览器发现用户访问某网页时, 就可以直接将该网页的 URL发送给搜索引擎服务器, 这样, 搜索引擎服务器就可以 根据预先统计出的所述 URL所属的类别, 将与所述 URL属于同一类别的网络资源 作为搜索结果返回给浏览器。 当然, 如果该 URL尚未收录在该数据库中, 还可以首 先确定出该网页的类别, 并将其收录在数据库的该类别下。

需要说明的是, 具体实现时, 可以是仅对预先设置好的具有某种特征的网页 进 行提取关键信息, 以及后续的操作。 也就是说, 可以并不是在用户访问每个网页时, 都去提取网页的中心词, 并向用户进行网络信息的推荐, 而是在用户访问一些特殊 的网页时, 釆取进行提取关键信息进而进行推荐的相关操 作。 例如, 在通常情况下, 如果用户访问一些团购网站的网页时, 可能会有参考下其他网站的类似团购项目的 需求, 因此, 就可以预先统计并记录下常用的团购网站的域 名, 当用户访问某网页 时, 获取到网页的 URL ( Uniform I Universal Resource Locator, 统一资源定位符 ) , 然后判断该 URL的域名是否出现在预先统计出的团购网站域 名列表中, 如果是, 则 证明该网页是某团购网站的某团购项目网页, 进而, 就可以将该网页认定为符合条 件的特定网页, 并进行提取其网页内容的中心词等操作。 具体实现时, 除了根据用 户访问的网页的 URL来判断该网页是否为符合预置条件的网页之 外, 还可以根据其 他信息进行判断, 例如, 预先设置的条件可以为当网页标题中包含某些 关键词 (例 如, 团购、 购物等等) 时, 该网页就属于需要提取中心词的特定网页, 此时, 就可 以首先提取网页的网页标题, 然后分析其中是否包含预置的关键词, 如果包括, 则 可以将用户访问的该网页作为特定网页来处理 。 当然, 在实际应用中, 具体将具有 何种特征的网页设定为特定网页, 可以根据实际需求而定, 这里不进行限定。

另外需要说明的是, 在本发明实施例中, 用于推荐的网络信息可以包括网页、 音视频等文件的下载地址等等。 另外, 在向用户推荐这些网络信息的同时, 还可以 包括关于网络信息的访问情况的统计, 例如, 在浏览器的下边栏等位置出向某用户 推荐某相关的网页时, 还可以同时给出用户对该网页的访问热度等信 息。

S503 : 根据搜索引擎服务器返回的搜索结果, 向用户进行网络信息的推荐。 由于搜索引擎服务器给出的搜索结果一般是按 照搜索引擎服务器自身定义好的 逻辑进行了排序的, 因此, 浏览器在接收到搜索引擎服务器返回的搜索结 果之后, 可以直接从中选取排名靠前的一定数目的搜索 结果推荐给用户。 当然, 浏览器还可 以使用自己的逻辑对搜索引擎服务器返回的搜 索结果进行重新排序或者选择, 然后 再按照新的排序或选择结果向用户进行推荐。 具体的排序或选择规则可以根据实际 的需要而定, 例如, 如果用户当前访问的网页是某团购网站的网页 时, 可以首先从 搜索引擎服务器的搜索结果中选择同样是团购 网站 (不一定与用户当前访问的网页 所属的团购网站相同) 的网页, 然后再按照这些网页在搜索结果中的顺序, 推荐给 用户, 等等。 其中, 在判断搜索结果是否属于团购网站时, 同样可以提取搜索结果 对应的网页的 URL , 根据其所属的域名, 判断其是否出现在预置的团购网站域名列 表中, 如果是, 则可以将其判定为一个团购网站。

另外, 为了进一步提高推荐的有效性, 在本发明实施例中, 还可以根据其他用 户进行推荐时的用户访问情况, 对当前的推荐进行千预。 也就是说, 对于用户当前 正在访问的特定网页 A而言, 之前可能有其他的用户也访问过该网页, 并且同样向 这些用户推荐了一些网络信息, 其中, 在考量用户是否接受这些推荐信息时, 所使 用的依据就可以是用户的点击情况。 例如, 当用户甲访问网页 A时, 向该用户推荐 了网络资源 1、 2、 3等等, 之后用户甲点击访问了网络资源 1和网络资源 2 , 说明对 于该用户甲而言, 网络资源 1和网络资源 2是有效的推荐, 同样对于别的用户而言, 在向其推荐了某些网络资源之后, 点击了哪些网络资源, 都可以由浏览器可以记录 下来, 并上报给搜索引擎服务器, 由搜索引擎服务器对各个用户对推荐结果的点 击 量进行统计。 这样, 在针对当前用户进行推荐时, 就可以根据以往用户对推荐结果 的点击量, 提供推荐结果。

总之, 通过本发明实施例提供的方法, 在用户访问某网页的过程中, 浏览器可 以为用户提供与该网页内容相关的其他网络信 息的推荐, 这种其他网络信息可能包 括其他一个网页的链接, 或者音视频等文件的下载链接等等, 使得用户能够获取到 更多的网络信息, 相应的, 也可以提高网络信息的利用率。

与本发明实施例提供的网络信息推荐方法相对 应, 本发明实施例还提供了一种 网络信息推荐系统, 参见图 6 , 该系统包括:

信息提取单元 601 , 用于当用户通过浏览器访问一网页时, 所述浏览器提取所述 网页的关键信息;

发送单元 602 ,用于将所述网页的关键信息通过预置的接口 送到搜索引擎服务 器, 以便由所述搜索引擎服务器根据所述关键信息 搜索与所述网页相关的网络信息; 信息推荐单元 603 , 用于根据搜索引擎服务器返回的搜索结果, 向用户进行网络 信息的推荐。

具体实现时, 信息提取单元 601可以包括:

中心词提取子单元, 用于提取所述网页内容的中心词。

可以从网页的文字内容中提取中心词, 此时, 中心词提取子单元可以包括: 第一分析子单元, 用于抓取所述网页中的文字内容; 分析所述文字内容, 提取 所述网页内容的中心词。

其中, 文字内容可以是指所述网页的网页标题。

或者, 也可以从网页的头信息中提取能表达网页主要 内容的中心词, 此时, 中 心词提取子单元可以包括:

第二分析子单元, 用于获取所述网页的头信息; 分析所述头信息, 提取所述网 页内容的中心词。

或者, 在另一种情况下, 信息提取单元 601也可以包括: URL提取子单元, 用于提取所述网页的统一资源定位符 URL。

在实际应用中, 搜索引擎服务器可以包括:

判断单元, 用于根据所述 URL, 判断所述网页是否收录在分类网络信息数据库 中;

相关信息确定单元, 用于如果是, 则将所述分类网络信息数据库中, 与所述网 页属于同一类别的网络信息, 确定为与所述网页相关的网络信息。

可选的, 搜索引擎服务器还可以包括:

网页收录单元, 用于如果所述网页尚未收录在分类网络信息数 据库中, 所述搜 索引擎确定所述网页所属的类别, 并将所述网页收录到所述分类网络信息数据库 中 对应的类别下。

在实际应用中, 并不是针对用户访问的每一个网页都进行网络 信息的推荐, 而 是仅针对一些符合条件的网页进行推荐。 在判断用户访问的网页是否需要进行推荐 时, 可以有多种方式, 例如, 其中一种方式是根据网页的 URL进行判断, 此时, 信 息提取单元 601可以包括:

第一判断子单元, 用于当用户访问一网页时, 获取该网页的统一资源定位符

URL, 通过判断所述 URL所属的域名是否出现在预置的域名列表中, 判断该网页是 否为符合预置条件的特定网页, 如果是, 提取所述特定网页的关键信息。

或者, 也可以根据网页的网页标题进行判断, 此时, 搜索单元 601可以包括: 第二判断子单元, 用于当用户访问一网页时, 根据该网页的网页标题, 通过判 断所述网页标题中是否存在预置的关键词, 判断该网页是否为符合预置条件的特定 网页, 如果是, 提取所述特定网页的关键信息。

搜索引擎服务器可以包括

筛选子单元, 用于在获得与所述网页匹配的搜索结果之后, 查看针对所述网页 的历史推荐记录, 向所述浏览器返回历史推荐记录中用户点击量 较高的搜索结果。

通过本发明实施例提供的网络信息推荐系统, 在用户访问某网页的过程中, 浏 览器可以为用户提供与该网页内容相关的其他 网络信息的推荐, 这种其他网络信息 可能包括其他一个网页的链接, 或者音视频等文件的下载链接等等, 使得用户能够 获取到更多的网络信息, 相应的, 也可以提高网络信息的利用率。

本发明的各个部件实施例可以以硬件实现,或 者以在一个或者多个处理器上运行的 软件模块实现, 或者以它们的组合实现。 本领域的技术人员应当理解, 可以在实践 中使用微处理器或者数字信号处理器(DSP )来实现根据本发明实施例的系统中的一 些或者全部部件的一些或者全部功能。 本发明还可以实现为用于执行这里所描述的 方法的一部分或者全部的设备或者装置程序( 例如,计算机程序和计算机程序产品)。 这样的实现本发明的程序可以存储在计算机可 读介盾上, 或者可以具有一个或者多 个信号的形式。 这样的信号可以从因特网网站上下载得到, 或者在载体信号上提供, 或者以任何其他形式提供。

例如, 图 7示出了可以实现根据本发明的各种方法的服 器, 例如应用服务器。 该 服务器传统上包括处理器 710和以存储器 720形式的计算机程序产品或者计算机可 读介盾。 存储器 720 可以是诸如闪存、 EEPROM (电可擦除可编程只读存储器) 、 EPROM、 硬盘或者 ROM之类的电子存储器。 存储器 720具有用于执行上述方法中 的任何方法步骤的程序代码 731 的存储空间 730。 例如, 用于程序代码的存储空间 730可以包括分别用于实现上面的方法中的各种 步骤的各个程序代码 731。 这些程序 代码可以从一个或者多个计算机程序产品中读 出或者写入到这一个或者多个计算机 程序产品中。 这些计算机程序产品包括诸如硬盘, 紧致盘 (CD ) 、 存储卡或者软盘 之类的程序代码载体。 这样的计算机程序产品通常为如参考图 8 所述的便携式或者 固定存储单元。 该存储单元可以具有与图 7的服务器中的存储器 720类似布置的存 储段、 存储空间等。 程序代码可以例如以适当形式进行压缩。 通常, 存储单元包括 计算机可读代码 73 Γ , 即可以由例如诸如 710之类的处理器读取的代码, 这些代码 当由服务器运行时, 导致该服务器执行上面所描述的方法中的各个 步骤。

本文中所称的 "一个实施例"、 "实施例"或者"一个或者多个实施例 "意味着, 结 合实施例描述的特定特征、 结构或者特性包括在本发明的至少一个实施例 中。 此外, 请注意, 这里"在一个实施例中"的词语例子不一定全指 一个实施例。

在此处所提供的说明书中, 说明了大量具体细节。 然而, 能够理解, 本发明的 实施例可以在没有这些具体细节的情况下被实 践。 在一些实例中, 并未详细示出公 知的方法、 结构和技术, 以便不模糊对本说明书的理解。

应该注意的是上述实施例对本发明进行说明而 不是对本发明进行限制,并且本领域 技术人员在不脱离所附权利要求的范围的情况 下可设计出替换实施例。 在权利要求 中, 不应将位于括号之间的任何参考符号构造成对 权利要求的限制。单词"包含"不排 除存在未列在权利要求中的元件或步骤。位于 元件之前的单词 "一"或"一个"不排除存 在多个这样的元件。 本发明可以借助于包括有若千不同元件的硬件 以及借助于适当 编程的计算机来实现。 在列举了若千装置的单元权利要求中, 这些装置中的若千个 可以是通过同一个硬件项来具体体现。 单词第一、 第二、 以及第三等的使用不表示 任何顺序。 可将这些单词解释为名称。

此外, 还应当注意, 本说明书中使用的语言主要是为了可读性和教 导的目的而 选择的, 而不是为了解释或者限定本发明的主题而选择 的。 因此, 在不偏离所附权 利要求书的范围和精神的情况下, 对于本技术领域的普通技术人员来说许多修改 和 变更都是显而易见的。 对于本发明的范围, 对本发明所做的公开是说明性的, 而非 限制性的, 本发明的范围由所附权利要求书限定。