Freire, M. L. et al.
2
Cad. Ciênc. Agrá., v. 11, p. 01–06, 2019. e-ISSN: 2447-6218 / ISSN: 1984-6738
Introdução
O monitoramento de eventos anormais em proces-
sos de tomada de decisão se beneficia do uso de sistemas
computacionais, em parte devido à complexidade e o alto
volume de dados que devem ser analisados. Por isso, a
importância do estudo da automação em atividades desta
área, denominada Gerenciamento de Eventos Anormais
(Abnormal Event Management, AEM) (Venkatasubrama-
nian et al., 2003c), é de fundamental importância para a
Indústria. Porém, automatizar as tarefas de AEM ainda
é um grande desafio para a indústria e a comunidade
acadêmica.
Como componente das atividades de AEM, há
os Sistemas de detecção e Diagnósticos de falhas (Fault
Detection and Diagnosis, FDD), que são sistemas respon-
sáveis pelo monitoramento de processos, onde é possí-
vel detectar falhas, classificando-as quanto ao seu tipo,
diagnosticando suas causas e origens. Na literatura há
várias propostas de sistemas de FDD utilizando métodos
baseados em modelos quantitativos, modelos qualitativos
e métodos baseados em dados históricos do processo
(Venkatasubramanian et al., 2003c,a,b). Uma etapa im-
portante relacionada ao diagnóstico em sistemas FDD é
a classificação de falhas, onde detectada uma falha pelo
sistema, identifica-se as causas da condição anormal. A
correta classificação das falhas em tempo hábil permite
a correção do problema, sendo fundamental para a se-
gurança do processo e a produtividade.
Um problema enfrentado pelos sistemas de FDD,
no entanto, é o fato de que os processos industriais moder-
nos estão se tornando cada vez mais complexos, tanto em
níveis estruturais quanto de automação. O grande número
de variáveis lidos pelos sensores dispersos pelas plantas
podem ser irrelevantes e/ou redundantes. A eliminação
destas variáveis pode levar a sistemas de FDD mais efi-
cientes e robustos, e a escolha das variáveis adequadas
para o monitoramento, no entanto, não é uma tarefa
fácil (Foster et al., 2015). Esse problema é abordado na
literatura na área de mineração de dados como seleção
de variáveis, e é NP-hard de complexidade O(2n), sendo
frequentemente tratado por meio de métodos heurísticos
e metaheurísticos, classificados como filter e wrapper
(Chandrashekar e Sahin, 2014).
Os métodos de wrapper utilizam métricas de
performance do algoritmo de classificação para guiar a
seleção de variáveis (Chandrashekar e Sahin, 2014; Guyon
e Elisseeff, 2003; Kohavi e John, 1997). Esse processo
de seleção de variáveis dos métodos wrapper podem ser
determinísticos, usando algoritmos de seleção seqüencial,
como o Sequential Forward Selection (SFS) (Whitney,
1971), ou Sequential Backward Selection (SBS) (Marill
e Green, 1963). Podem ser também por meio de heurís-
ticas ou metaheurísticas, que são capazes de explorar o
espaço de busca global, como os algoritmos evolutivos
Differential Evolution (Al-Ani et al., 2013), Ant Colony
Optimization (ACO) (Allegrini e Olivieri, 2011), Particle
Swarm Optimization (PSO) (Ahmad, 2015), e Simulated
Annealing (Brusco, 2014), etc.
Os métodos de filter não utilizam os algoritmos
de classificação e fazem a seleção de variáveis como uma
etapa de pré-processamento dos dados. Para isso, utilizam
características
intrínsecas dos dados selecionando as variáveis baseados
em critérios de relevância e/ou similaridade entre elas,
como o coeficiente de correlação de Pearson ou Infor-
mação Mútua (Yu e Liu, 2004). Nos métodos wrapper
as abordagens para a seleção de variáveis podem ser
mono-objetivos, onde busca-se melhorar a métrica de
performance extraída do algoritmo de classificação para
as soluções. Pode ser também multiobjetivo, havendo
mais de uma métrica de performance a ser analisada.
Ou além da métrica analisada, busca-se explicitamente
minimizar a complexidade das soluções (quantidade de
variáveis). Na abordagem multiobjetivo é retornando
pelo método um conjunto de soluções não dominadas,
onde dentre elas pode-se escolher aquela com o melhor
custo-benefício (Mukhopadhyay et al., 2013).
Neste trabalho é feita uma proposta de um mé-
todo wrapper multiobjetivo de seleção de variáveis para
aplicação em classificação de falhas baseadas em dados
históricos de um processo petroquímico, usando o algorit-
mo genético multiobjetivo MOEADD (Evolutionary Many-
-Objective Optimization Algorithm Based on Dominance
and Decomposition) proposto em Li et al. (2014), e o
algoritmo de classificação KNN (K-nearest neighbors) com
operadores genéticos adaptados ao problema. No método
proposto, denominado MOEADD-KNN-M, o algoritmo
MOEADD foi adaptado para atuar como o mecanismo
de busca para a seleção de variáveis, devido ao seu bom
desempenho em problemas de otimização multiobjetivo
(Li et al., 2014).
De uma forma geral, em qualquer processo in-
dustrial é necessário ter um controle de cada uma das
componentes do processo. Instalar sensores em cada
uma das componentes pode gerar custos desnecessários.
Uma pergunta a ser feita é: Onde instalar estes sensores?
Podemos instalar sensores nas variáveis mais representa-
tivas, obtidas do método de seleção de variáveis, sem a
necessidade de instalar sensores em todas as máquinas,
possibilitando assim uma redução de custos, e por sua
vez, melhoria e eficiência na produção.
Materiais e Métodos
Neste trabalho foi implementado um método
wrapper de seleção de variáveis, denominado MOEADD-
-KNN-M, onde a taxa de erro de classificação é dada pelo
KNN, como uma das funções fitness a serem minimizadas.
Além disso, foram adaptados operadores genéticos de
cruzamento no MOEADD para o problema proposto.