Predictive maintenace with LSTM autoencoder and explainability by SHAP and LIME
Date
2023-11-29
Embargo
Authors
Coadvisor
Journal Title
Journal ISSN
Volume Title
Publisher
Language
English
Alternative Title
Abstract
Predictive maintenance is becoming increasingly important as machines and equipment become
more complex. This is because modern machines and equipment have sensors and control systems
that can generate a large amount of data. This data can be used to monitor the operating status of
equipment and identify signs of failure.
The versatility of LSTM (Long Short-term memory) makes it possible to use it with quite
different data sets, with results that allow anomalies to be detected in data sets with different
characteristics.
This dissertation will demonstrate that it is possible to use LSTM on two data sets and suc cessfully detect both anomalies. A first set with information from NASA bearing sensors will be
used. The objective is to detect changes in the frequency of the data that could indicate a possible
anomaly.
The architecture used with the NASA data set was applied to a new data set from the Porto
Metro in order to understand whether it was possible to use the same architecture with positive
results in different data sets.
Humans do not easily interpret the results presented in many machine learning models, so
SHAP and LIME will be used to understand the model results.
SHAP is a method for explaining the predictions of machine learning models that provide
a global perspective through the quantification of the contribution of each feature to the final
prediction of the model. LIME is another explanation model that works by creating a simpler
model that approximates the behaviour of the original model.
It will be possible to demonstrate through the results obtained that, despite being powerful
tools used to understand the predictions of machine learning models, they have their limitations.
In the case of SHAP, the results are not easy to interpret, unlike LIME, where the results presented
are easy to interpret.
A manutenção preditiva está a tornar-se cada vez mais importante à medida que as máquinas e equipamentos ficam mais complexos. Isto é porque máquinas e equipamentos modernos estão equipados com sensores e sistemas de controle capazes de gerar uma grande quantidade de dados. Esses dados podem ser utilizados para monitorizar o funcionamento do equipamento e identificar sinais de falha. A versatilidade do LSTM (Long Short-term memory) torna possível a sua utilização com con juntos de dados bastantes distintos, com resultados que permitem que sejam detetadas anomalias em conjuntos de dados com características diferentes. Nesta dissertação, vai ser demonstrado que é possível utilizar o LSTM em dois conjuntos de dados e detetar as anomalias existentes nos dois com sucesso. Vai ser utilizado um primeiro conjunto com informação de sensores de rolamentos da NASA. O objetivo é detetar alterações na frequência dos dados que possam ser indicativos de uma possível anomalia. A arquitetura utilizada com o conjunto de dados da NASA foi aplicada um um novo conjunto de dados com origem no Metro do Porto para que fosse possível compreender se em conjunto de dados diferentes era possível utilizar a mesma arquitetura com resultados positivos. Os resultados apresentados em muitos dos modelos de machine learning não são facilmente interpretados pelo ser humano, para isso vai ser utilizado o SHAP e o LIME para que os resultados do modelo possam ser entendidos. O SHAP é um método de explicação das previsões de modelos de machine learning que dá uma perspectiva global através da quantificação do contributo de cada característica na previsão final do modelo. O LIME é um outro modelo de explicação que funciona através da criação de um modelo mais simples que se aproxima do comportamento do modelo original. Vai ser possível demonstrar através dos resultados obtidos que, apesar de serem ferramentas poderosas utilizadas para entender as previsões de modelos de machine learning, têm as suas limitações. No caso do SHAP, os resultados não são de fácil interpretação, ao contrário do LIME, onde os resultados apresentados são interpretados de forma fácil.
A manutenção preditiva está a tornar-se cada vez mais importante à medida que as máquinas e equipamentos ficam mais complexos. Isto é porque máquinas e equipamentos modernos estão equipados com sensores e sistemas de controle capazes de gerar uma grande quantidade de dados. Esses dados podem ser utilizados para monitorizar o funcionamento do equipamento e identificar sinais de falha. A versatilidade do LSTM (Long Short-term memory) torna possível a sua utilização com con juntos de dados bastantes distintos, com resultados que permitem que sejam detetadas anomalias em conjuntos de dados com características diferentes. Nesta dissertação, vai ser demonstrado que é possível utilizar o LSTM em dois conjuntos de dados e detetar as anomalias existentes nos dois com sucesso. Vai ser utilizado um primeiro conjunto com informação de sensores de rolamentos da NASA. O objetivo é detetar alterações na frequência dos dados que possam ser indicativos de uma possível anomalia. A arquitetura utilizada com o conjunto de dados da NASA foi aplicada um um novo conjunto de dados com origem no Metro do Porto para que fosse possível compreender se em conjunto de dados diferentes era possível utilizar a mesma arquitetura com resultados positivos. Os resultados apresentados em muitos dos modelos de machine learning não são facilmente interpretados pelo ser humano, para isso vai ser utilizado o SHAP e o LIME para que os resultados do modelo possam ser entendidos. O SHAP é um método de explicação das previsões de modelos de machine learning que dá uma perspectiva global através da quantificação do contributo de cada característica na previsão final do modelo. O LIME é um outro modelo de explicação que funciona através da criação de um modelo mais simples que se aproxima do comportamento do modelo original. Vai ser possível demonstrar através dos resultados obtidos que, apesar de serem ferramentas poderosas utilizadas para entender as previsões de modelos de machine learning, têm as suas limitações. No caso do SHAP, os resultados não são de fácil interpretação, ao contrário do LIME, onde os resultados apresentados são interpretados de forma fácil.
Keywords
LSTM, Anomaly detection, SHAP, LIME, Predictive maintenance
Document Type
Master thesis
Publisher Version
Dataset
Citation
Brito, L. M. V. (2023). Predictive maintenace with LSTM autoencoder and explainability by SHAP and LIME [Dissertação de Mestrado em Ciência de Dados, Universidade Portucalense]. Repositório Institucional UPT. http://hdl.handle.net/11328/5248
Identifiers
TID
203551770
Designation
Mestrado em Ciência de Dados
Access Type
Open Access