大数据具有 4V 特征,强调跨领域、多类型数 据的融合与利用[9-15],其以云计算为基础,在理论研究和实际应用方面涉及一系列软硬件技术的进步[16-22]。电力大数据技术是大数据在电力行业的应用和发展,包括有分布式存储、并行计算,以及各 种分析算法等组件,并充分吸收电力系统云计算的先进成果[23-28]。
最终实现大数据技术在电力系统的全面应用, 从电力系统各子领域出发的研究和实践是必经之路。这些子领域中的数据通常也具有多类型、分散和未充分利用的特征,借助大数据技术既可促进子领域的技术进步,也能够在一个较小的、可控的范 围内验证、发展电力大数据技术,并为最终的多领域融合作好准备。事实上,大数据的含义也在不断 演变中,正是在与各类实际问题的互动过程中,才真正具有活力。
电力大数据技术是体系化的技术包,而电力系 统各子领域通常都具有较为完备的理论体系和强大的应用系统。因此,引入大数据技术的合适方式 是针对常规方法无法解决的问题和潜在需求,选择电力大数据技术包中能够为其提供支撑的组件,而 不应机械地强调领域数据是否完全符合大数据的 特征,或是希望以大数据技术完全取代现有技术。电力系统仿真计算包括离线计算和在线计算, 是电网规划、设计和运行的重要支撑,在电力系统 研究体系中处于基础地位。仿真计算进行过程中和 结束后能够提供大量计算数据,对这些数据进行挖 掘和分析,并与在线量测结合解决系统实际问题, 特别是暂态稳定问题,长期以来都是数据挖掘技术 应用于电力系统的重要研究方向[29-36]。
从方法论的角度讲,电力系统问题研究的主要 步骤包括观察规律、理论分析和实验验证,这既要 求对系统变化过程的充分观测,也要求对实验结果 的充分观测。目前,在电力系统仿真分析中通常只 监测少数关键量,这必然会遗漏可能的有效信息, 对研究结论产生不利影响。因此,充分利用仿真计 算丰富的数据和结果,对其进行深入的观测和分析 也是电力系统仿真分析发展的要求。 到目前为止,在仿真计算数据挖掘方面的成果 大多都只限于理论和算例分析,在实际中应用较 少,影响力有限。造成这种情况的原因很多,其中 受限于数据吞吐速度、硬件计算能力,以及对各类 计算数据的整合与利用不足是很重要的方面。 电力大数据技术的发展能够为上述问题的解 决提供有效帮助。基于电力大数据平台,由计算能 力和数据存储带来的制约将不再是主要问题,相关 研究和应用可基于大规模数据整合进行。在此基础 上,针对仿真计算数据所提出的各种分析方法,将 有机会得到更好地验证和发展并投入实际应用。更多详细内容请见附件
