Evaluación asistida por IA sobre el impacto de las actividades de seguridad en los resultados de incidentes

A lo largo de décadas las organizaciones han estructurado programas de seguridad y salud en el trabajo con el objetivo de disminuir el número de incidentes.

Alex Cabrera1*, Harvey Rosas Ph.D.2

  1. CEO, Prevsis, Chile
  2. CTO, Prevsis, Chile

Introducción:

A lo largo de décadas las organizaciones han estructurado programas de seguridad y salud en el trabajo con el objetivo de disminuir el número de incidentes. Algunas de estas actividades pueden tener poca o ninguna incidencia en el resultado deseado, al igual que la información de la recopilación puede o no ser de calidad, pero ¿cuáles actividades tienen impacto y cómo se relacionan entre sí? Para comprender si estas están apalancadas unas con otras y dado que la información disponible, tales como inspecciones, observaciones, entre otros son interdependiente, se considera en el análisis tanto datos estructurados (formularios e informes) como no estructurados (texto libre) relacionados de cada actividad para su análisis y depuración de resultados. La detección de patrones útiles para comprender el impacto se realiza a través del tratamiento de los datos creando clústeres de información previo a la aplicación de algoritmos de aprendizaje automático, considerando información adicional desde otros procesos operacionales y administrativos.

En el presente ejercicio se tomaron datos provenientes de dos actividades de Liderazgo en Seguridad: seguridad basada en el comportamiento e informe de incidentes, esto con el objetivo de comprender la interconectividad y verificar la relación entre los incidentes y el cumplimiento del programa planteado.

Metodología: Se sigue el proceso CRISP-DM (Cross-Industry Standard Process for Data Mining) ver  Figura 1, donde se consideran las siguientes 6 etapas:

  • Comprensión de la problemática: Para obtener una comprensión general de la necesidad, en la mayoría de los casos, el objetivo es comprender la aplicación del producto de datos a desarrollar.
  • Comprensión de datos: donde se obtienen y exploran los conjuntos de datos de entrada, esto generalmente requiere procesos de recopilación y consolidación de datos, considerando la integración con múltiples fuentes de datos.
  • Preparación de datos: una costosa tarea dado el tiempo que requiere, la cual suele ser subestimada, aquí, los datos deben seleccionarse, limpiarse, transformarse y formatearse de manera óptima para modelarlos más adelante.
  • Modelado: dado el producto de datos, se aplica una amplia gama de modelos, dependiendo de la compatibilidad del caso de uso requerido.
  • Evaluación: Aquí se concentra en la evaluación de los resultados obtenidos.
  • Despliegue: Condicionado al éxito de las etapas anteriores, se finaliza desplegando el modelo como un producto de datos.
Diagrama del proceso CRISP-DM.

La modelización, dada la naturaleza de los datos disponibles, tiene como reto el procesar tanto datos estructurados, en forma de variables tanto categóricas como numéricas, así como datos no estructurados, en su mayoría en forma de informes que incluyen descripciones en texto libre. Con el propósito de combinar información clave y descubrir patrones anómalos, manteniendo un enfoque híbrido de aprendizaje supervisado y no supervisado, se emplea una serie de algoritmos de aprendizaje automático que involucran procesamiento de lenguaje natural para el procesamiento de informes de texto (ver Figura 2), dentro de los cuales se encuentran las redes neuronales de aprendizaje profundo LSTM y  clústering mediante k-NN (con sus siglas en Inglés k-Nearest Neighbors: k-vecinos más cercanos). Finalmente, se consideraron modelos de series de tiempo para las observaciones de variables cuantitativas a través del tiempo.

Chart, bubble chart

Description automatically generated
Procesamiento de lenguaje natural – distancia entre tópicos.

Resultados y conclusiones: en este trabajo se encuentra que emerge una conexión enriquecida entre la información de las actividades de seguridad basadas en el comportamiento con los reportes de incidentes, así como no se evidencia una conexión directa con los programas de seguridad y su solo su respectivo cumplimiento. Por otra parte, se advierte de una cantidad subyacente de información que se repite a lo largo del tiempo, que no necesariamente se relacionan jerárquicamente entre sí cuando ocurre un incidente. Referente a los procesos de reclasificación y predicción pueden llevar a cabo con altos niveles de precisión (ver Figura 3), sin embargo, dependen de la cantidad de variables y registros disponibles para el análisis.

Modelización usando redes neuronales artificiales profundas.

Artículos recientes

Solicita tu demostración
con nuestros expertos

Software integrado para la Seguridad, Salud (SST) y Sostenibilidad (ESG)

Actualizaciones

Mujeres en TI, incentivo a la innovación.

A pesar de los avances, persisten los estereotipos y sesgos sobre el papel de las mujeres en la tecnología, así como la brecha en ciertas habilidades que requieren programas de formación y educación para mujeres que se adapten a sus necesidades y circunstancias.

General

Hablemos de Productividad

La productividad, como concepto, y sus indicadores han sido ampliamente debatidos en cuanto a su significado y la forma en cómo se pueden medir.

S
í
g
u
e
n
o
s