机会:
随着工厂变得更智能化,我们可以采集的数据也越来越多。也随着大数据技术进一步的发展,我们现在可以利用一些大技术的数据,来进一步提升我们的能源利用效率。
评价能源效率主要使用的KPI为MWH/car,也就是每辆车的综合能耗。
文章的数据收集主要在欧宝集团以及PSA集团内部完成,相关因素比如天气数据使用了开源的天气数据。
数据处理以及分析主要使用了KNIME分析平台,R语言,Excel以及VBA。
应用场景:
预测:
预测的关键:
建模:
建模前期经过了数据清洗(去掉不合理数据,补充缺失数据等)以及特征工程(使用Heating degree days 和cooling degree days 来代替温度)。
经过文献检索,选取了四种最常用的预测方法。分别是:多元线性回归,决策树,随机森林,神经网络。
预测的目标为每月的能量消耗。
测试:
选取了欧洲的六个工厂,分别是德国总部Ruesselsheim,Eisenach,波兰Gliwice,英国Luton,Ellesport Meer,以及西班牙的 Zaraagossa。使用2013到2017的数据进行测试。一共进行了三次测试。测试预测结果好坏的标准为R square。
其中一个工厂的测试结果如下。
我们可以看到,当数据量达到三年的时候。几乎所有的方法都可以相对稳定的预测每个月份的能源消耗。其中随机森林以非常高的R2和稳定的测试结果成为了最合适的预测方法。
不过从其他工厂结果来看,工厂发生一些数据无法表达的变化的时候,是利用生产车辆和天气,不包含工作时间的模型,可以更稳定的预测结果。当这种方法在一个新的工厂开始使用的时候,最好再进行测试,以便确定最好的方法。
应用:
这个预测模型的应用主要分为两方面。一是预测未来的能源消耗。二是为能源效率提供一个标准。
预测消耗非常容易理解,为能源效率设定的标准,主要是以如下的方法实现。
将过去三年的数据带入此模型中,分析模型结果和实际消耗的偏差。统计偏差的分布。
如果想要知道今年上半年的能源使用效率,将今年的数据代入模型,就可以得到使用的参考值,以及和实际值的偏差。这个偏差在分布中的位置,就说明了当前能源消耗的效率。
可视化、应用:
应用包括如下步骤:
将预测数据(生产计划,排班计划,近年平均天气)带入模型,得到预测值。
每经过一个月,讲实际值填入,并且更具过去分布,得到状态范围(红色,黄色和绿色)
对比状态范围和实际值,每个月定期检测能源利用效率。
---转自华为云开发者社区