QAR数据分析指的是用适当的统计分析方法对收集来的QAR数据进行分析,提取有用信息和形成结论而对QAR数据加以详细研究和概括总结的过程。目前航空公司在QAR数据分析与应用上主要有两类问题。
一是典型超限事件的数据分析不够深入。多数航空公司对超限事件的数据分析虽然能通过数据复原和仿真,完整还原当时的情景,对识别和监控飞行中的典型事件、信息报告的核实及不安全事件调查等起到了积极作用,但还仅停留在单一典型事件本身,没有对单一事件或同类事件背后的隐藏的危险源进行探究。此外,对超限事件分析缺少对机队趋势性风险的识别和研判,也缺乏对超限事件控制措施的落实情况的验证和反馈。
二是基于正常QAR参数的统计和分析不足。大多数航空公司缺乏一个较为成熟的能提供正常QAR参数的统计分析平台,许多成熟的数据挖掘方法无法或没有在现有QAR数据应用基础上使用。
要解决上述两类问题,就需要在QAR数据分析中引入“大数据”的概念。
大数据泛指巨量的数据集,一般大数据有四个特点,即“4V”:Volume(规模性)、Velocity(高速性)、Variety(多样性)、Value(价值性)。从特征上来说,QAR数据就是一种大数据。顾名思义,大数据分析是指对规模巨大的数据进行分析。大数据分析是大数据到信息,再到知识的关键步骤。
飞行品质监控发展到一定阶段,会出现下列2个特点,此时通过QAR大数据的应用,就可以持续有效地提高机队的飞行品质:
一是飞行超限事件逐渐减少,甚至不发生。此时可开展基于正常QAR参数的大数据统计分析工作,例如分析大量QAR参数间的相关性、统计校验QAR数据分析假设等,找寻数据背后隐藏的规律。
二是飞行操纵品质趋向于统一,QAR数据出现聚集现象。此时可开展基于正常QAR参数的数据挖掘和机队运行监控,或通过对机场、航线、环境、机组操纵情况等正常QAR参数的分析开展针对性风险管控,进一步提升飞行安全。
开展基于正常QAR参数的大数据分析,首先要做的是QAR原始数据的批量提取、自动译码、参数配置、参数归一化等一系列工作。其次需要将正常QAR参数与人员信息、机场信息、航线信息、航班信息、飞机信息等外部数据源进行匹配,为下一步的大数据统计分析做准备。此部分工作需要借助大数据分析平台,如GEEMS、AIRFASE、MATLAB、各公司自己开发的数据分析平台等来完成。
一般来说,基于正常QAR参数的大数据分析过程大致分为以下6个步骤:
1.业务理解
最初的阶段集中在理解项目目标和从业务的角度理解需求,同时将业务目标转化为数据分析问题的定义和实现目标的初步计划上。
2.数据理解
数据理解阶段从初始的QAR数据收集开始,目的是熟悉数据、识别数据的质量问题,发现QAR数据的内部属性,或是探测引起兴趣的参数去形成部分假设。
3.数据准备