Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
WIND POWER BIG DATA ANALYSIS SYSTEM BASED ON CLOUD COMPUTING
Document Type and Number:
WIPO Patent Application WO/2019/006721
Kind Code:
A1
Abstract:
A wind power big data analysis system based on cloud computing comprises a distributed file system module (1), a parallel programming frame module (2), a data warehouse system (3), a monitoring tool (4), an operation scheduling tool (5), and a development tool assembly module (6). The distributed file system module (1) is used for the persistent storage of data. The monitoring tool (4) is used for monitoring the running state of the system and the execution state of a data analysis operation. The operation scheduling tool (5) is used for scheduling the data analysis operation according to a demand, and parsing the association or dependency between operations. The development tool assembly module (6) is used for simplifying the configuration management of the system. The system improves the analysis and mining speed of wind power data, so as to improve the wind power management efficiency and the utilization rate of a fan device, thereby increasing the power production.

Inventors:
ZHANG CONG (CN)
Application Number:
PCT/CN2017/091935
Publication Date:
January 10, 2019
Filing Date:
July 06, 2017
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
SHENZHEN FANXI EELECTRONICS CO LTD (CN)
International Classes:
G06F17/30
Foreign References:
CN105069703A2015-11-18
CN104820670A2015-08-05
CN106850249A2017-06-13
CN104281980A2015-01-14
Download PDF:
Claims:
权利要求书

[权利要求 1] 一种基于云计算的风电大数据分析系统, 其特征在于: 包括分布式文 件系统模块 (1) , 并行编程框架模块 (2) , 数据仓库系统 (3) , 监控工具 (4) , 运行调度工具 (5) 以及幵发工具集合模块 (6) , 其中所述分布式系统文件系统 (1) 用于数据的持久化存储, 所述监 控工具 (4) 用于监控系统的运行状态、 数据分析作业的执行状态, 所述运行调度工具 (5) 根据需求对数据分析作业进行调度, 解析作 业间的关联或依赖关系, 所述幵发工具集合模块 (6) 用于简化系统 的配置管理。

[权利要求 2] 根据权利要求 1所述的一种基于云计算的风电大数据分析系统, 其特 征在于: 所述分布式文件系统 (1) 包括元数据服务器和多个数据服 务器。

[权利要求 3] 根据权利要求 1所述的一种基于云计算的风电大数据分析系统, 其特 征在于: 所述分布式文件系统 (1) 的文件由数据块构成, 数据块分 布在不同的节点上, 用于维持负载均衡。

[权利要求 4] 根据权利要求 1所述的一种基于云计算的风电大数据分析系统, 其特 征在于: 所述并行编程框架模块 (2) 采用谷歌公司的 Hadoop, 基于 Map-Reduce进行并行编程。

[权利要求 5] 根据权利要求 1所述的一种基于云计算的风电大数据分析系统, 其特 征在于: 所述数据仓库模块 (3) 采用基于 Hadoop平台的 Hive。

[权利要求 6] 根据权利要求 1所述的一种基于云计算的风电大数据分析系统, 其特 征在于: 所述幵发工具集合模块 (6) 包括 SQL翻译、 并行 ETL工具 、 索引管理和任务管理。

Description:
说明书 发明名称:一种基于云计算的风电大数据分析 系统 技术领域

[0001] 本发明涉及风电技术领域, 特别是一种基于云计算的风电大数据分析系统 。

背景技术

[0002] 风能作为一种清洁的可再生能源, 已经受到全球性的广泛关注和高度重视。 随 着电力系统中风电装机容量的比重日益增大, 每台风电机组的数据也日趋完善 和丰富, 这样, 风电的集中监控系统, 也面临着数据存储规模大、 实吋性、 分 析性强等挑战。 实吋、 有效、 准确的对风电基础数据分析, 不仅可以从各方面 对风机性能进行掌控, 提高风机发电效率和设备利用率, 还可以对风电的预测 更加准确, 从而, 使管理人员可以提前做好调度准备, 有助于电网消纳更多的 风电。

[0003] 对于集控侧的风机数据, 其多样丰富和存储量大的特性, 构成风电系统中独具 特色的大数据, 对于"大数据", 是需要新处理模式才能具有更强的决策力、 洞察 发现力和流程优化能力的海量、 高增长率和多样化的信息资产。 大数据技术的 战略意义不在于掌握庞大的数据信息, 而是对于这些含有意义的数据进行专业 化处理。 目前, 国内集控系统从风电场侧采集的数据主要有: 风机数据、 升压 站数据、 电计量数据、 测风塔数据等。 风场侧通过数据采集装置和网络将数据 传输到集控中心侧, 集控中心侧部署数据存储服务器, 将所有数据进行历史存 储。 现有技术关于风电数据的采集和存储系统的流 程图如图 1所示。

技术问题

[0004] 随着风电行业的迅猛发展, 风机数据日趋丰富和完善, 传统的数据存储系统和 数据分析结构将面临巨大的压力和挑战。 云计算是一种全新的大规模分布式计 算模式, 起源于互联网公司对大量计算与存储资源的需 求以及对可伸缩性、 高 性能、 高可用等特征的追求。 云计算聚合了大量分布、 异构的资源, 向用户提 供强大的海量数据存储与计算能力, 云计算通过虚拟化、 动态资源调配等技术 向用户提供服务避免资源浪费与竞争, 提高资源利用率以及应用性能。 云计算 提供横向伸缩和动态夫在均衡能力。 云计算环境中的资源被组织为数据中心的 形式, 一个数据中心包含数千个甚至数万个节点, 节点间通过高速网络互联, 共同向用户提供计算和存储资源。

[0005]

问题的解决方案

技术解决方案

[0006] 本发明的目的在于提供一种基于云计算的风电 大数据分析系统, 包括分布式文 件系统模块, 并行编程框架模块, 数据仓库系统, 监控工具, 运行调度工具以 及幵发工具集合模块, 其中所述分布式系统文件系统用于数据的持久 化存储, 所述监控工具用于监控系统的运行状态、 数据分析作业的执行状态, 所述运行 调度工具根据需求对数据分析作业进行调度, 解析作业间的关联或依赖关系, 所述幵发工具集合模块用于简化系统的配置管 理。

[0007] 优选的, 所述分布式文件系统包括元数据服务器和多个 数据服务器。

[0008] 优选的, 所述分布式文件系统的文件由数据块构成, 数据块分布在不同的节点 上, 用于维持负载均衡。

[0009] 优选的, 所述并行编程框架模块采用谷歌公司的 Hadoop, 基于 Map-Reduce进 行并行编程。

[0010] 优选的, 所述数据仓库模块采用基于 Hadoop平台的 Hive。

[0011] 优选的, 所述幵发工具集合模块包括 SQL翻译、 并行 ETL工具、 索引管理和任 务管理。

[0012] 根据下文结合附图对本发明具体实施例的详细 描述, 本领域技术人员将会更加 明了本发明的上述以及其他目的、 优点和特征。

发明的有益效果

有益效果

[0013] 采用该基于云计算的风电大系统, 可以提高风电数据分析挖掘速度, 从而提高 风电管理效率和风机设备利用率, 进而提高发电量。 在数据存储方面, 构建起 相对大规模的存储级别的相关系统, 在设备利用方面, 实现存储设备在线的有 效收缩和扩展, 在负载均衡方面, 实现系统的全局性自动的均衡夫在, 在数据 安全方面, 云存储实现整体数据的安全性与保护性。

对附图的简要说明

附图说明

[0014] 后文将参照附图以示例性而非限制性的方式详 细描述本发明的一些具体实施例 。 附图中相同的附图标记标示了相同或类似的部 件或部分。 本领域技术人员应 该理解, 这些附图未必是按比例绘制的。 本发明的目标及特征考虑到如下结合 附图的描述将更加明显, 附图中:

[0015] 图 1为现有技术风电数据的采集和存储系统的流 图;

[0016] 图 2为根据本发明实施例的基于云计算的风电大 据分析系统框图;

[0017] 图 3为根据本发明实施例的基于云计算的风电大 据分析系统的数据流程图。

本发明的实施方式

[0018] 参见图 1, 已经在背景技术部分说明了部分该流程图的内 容, 从风电场侧采集 的数据主要有: 风机数据、 升压站数据、 电计量数据、 测风塔数据等, 风场侧 通过数据采集装置和网络将数据传输给集控中 心侧, 集控中心侧部署数据存储 服务器, 将所有数据进行历史存储。

[0019] 参见图 2, 一种基于云计算的风电大数据分析系统, 包括分布式文件系统模块 1 , 并行编程框架模块 2, 数据仓库系统 3, 监控工具 4, 运行调度工具 5以及幵发 工具集合模块 6, 其中所述分布式系统文件系统 1用于数据的持久化存储, 所述 监控工具 4用于监控系统的运行状态、 数据分析作业的执行状态, 所述运行调度 工具 5根据需求对数据分析作业进行调度, 解析作业间的关联或依赖关系, 所述 幵发工具集合模块 6用于简化系统的配置管理。 分布式文件系统 1包括元数据服 务器 1-1和多个数据服务器 1-2。 分布式文件系统 1的文件由数据块构成, 数据块 分布在不同的节点上, 用于维持负载均衡。 并行编程框架模块 2采用谷歌公司的 Hadoop, 基于 Map-Reduce进行并行编程。 数据仓库系统 3采用基于 Hadoop平台 的 Hive。 幵发工具集合模块 6包括 SQL翻译、 并行 ETL工具、 索引管理和任务管 理。

[0020] 参见图 3, 风电大数据与互联网大数据存在明显区别, 大多数大数据分析系统 H ive和 Impala等均未对索引提供良好支持, 而风电大数据分析中, 多维区域査询 极为常见, 由于没有索引, 导致访问大量不需要的数据, 显著降低査询的执行 性能, 需要设计合适的索引结构以及相应的数据检索 机制, 风电大数据业务场 景中, 存在大量的数据修改, 以覆盖现有数据的方式执行会导致执行效率低 下 的问题, 因此需提供效率较高的数据改写机制, 互联网根据自身的业务而设计 的 HQL只是 SQL的一个子集, 并不完全适用于风电大数据分析系统。 因此附图 3 展示的是一种新型的风电数据分析挖掘应用的 数据流程图, 更适应风电的应用

[0021] 采用该基于云计算的风电大系统, 可以提高风电数据分析挖掘速度, 从而提高 风电管理效率和风机设备利用率, 进而提高发电量。 在数据存储方面, 构建起 相对大规模的存储级别的相关系统, 在设备利用方面, 实现存储设备在线的有 效收缩和扩展, 在负载均衡方面, 实现系统的全局性自动的均衡夫在, 在数据 安全方面, 云存储实现整体数据的安全性与保护性。

[0022] 虽然本发明已经参考特定的说明性实施例进行 了描述, 但是不会受到这些实施 例的限定而仅仅受到附加权利要求的限定。 本领域技术人员应当理解可以在不 偏离本发明的保护范围和精神的情况下对本发 明的实施例能够进行改动和修改