Por qué las pruebas de escenarios catastróficos más allá de la fabricación son esenciales para la seguridad de la infraestructura crítica

La interrupción sin precedentes de la FAA que resultó en la suspensión de todos los vuelos nacionales tiene a todos haciendo preguntas:

¿Cómo sucedió esto?

¿Quien es responsable?

¿Cómo evitamos que algo similar vuelva a ocurrir?

Esta interrupción nos ha puesto sobre aviso, destacando que incluso los sistemas que consideramos más seguros, confiables y validados pueden fallar.

Si bien este tipo de interrupción que alcanza el nivel de conciencia pública es poco común, cuando ocurre en un sistema crítico para la vida, puede conducir a una avalancha de resultados catastróficos que afectan la seguridad y la economía. Estamos viendo esto ahora con la interrupción del transporte y las ramificaciones de la sobrecarga en los servicios web/aplicaciones inundados con miles de pasajeros que luchan por llegar a sus destinos.

Si bien la interrupción de la FAA de hoy se considera una falla del sistema, fue una falla de degradación elegante. Eso significa que, afortunadamente, no se produjeron muertes por la falla y el sistema se apagó antes de que se produjeran más daños.

Esto es afortunado, pero no alentador.

Las pruebas siempre se han utilizado en la fabricación para detectar defectos: la simulación de fallas, por ejemplo, era un método para "romper" artificialmente un dispositivo para ver si las pruebas de diagnóstico detectarían y aislarían las fallas hasta sus causas fundamentales. Al diseñar software, a los ingenieros se les enseña a diseñar según la especificación de lo que debería hacer funcionalmente. Se dedicó mucho menos esfuerzo a buscar escenarios catastróficos o una "tormenta perfecta" de condiciones que deben ocurrir y que conducen a la falla del sistema. Anticipar estas condiciones puede ayudarnos a construir de manera proactiva mecanismos para detectar y prevenir fallas catastróficas de manera proactiva.

Prevención de futuras interrupciones y otras fallas de infraestructura crítica

Con la proliferación de la computación en la nube y las soluciones de inteligencia artificial, ahora tenemos el poder computacional lo suficientemente eficiente como para evaluar millones de escenarios operativos para detectar qué casos podrían resultar en escenarios catastróficos.

Para la FAA, ahora debería ser posible analizar de manera proactiva las condiciones y los datos de todos los aeropuertos nacionales, aeronaves en el cielo y en tierra, así como aquellos programados para uso futuro, comunicaciones de la torre de control e infraestructuras relacionadas, pasajeros, clima, y seguridad para resolver escenarios que pueden provocar fallas en el sistema.

Si uno considera la complejidad de las interacciones e interdependencias de este sistema, está claro que es una propuesta desalentadora observar todos los puntos de falla.

La inteligencia artificial puede ayudar a analizar esta abrumadora cantidad de datos para buscar de manera proactiva patrones y comportamientos que puedan plantear desafíos a los sistemas de la FAA.

Esto no tiene precedentes, ya que la inteligencia artificial se ha utilizado para examinar mejor los patrones de tráfico para optimizar la programación y la logística.

La tecnología también se puede implementar como un poderoso mecanismo de defensa para proporcionar una detección temprana de ciberataques y/o comportamientos anormales en los sistemas. La clave para implementar dichos sistemas de manera efectiva será aislar esos valores atípicos y condiciones específicos para que puedan ser examinados por expertos humanos.

Hay muchas lecciones que aprender de la interrupción de la FAA y, con el tiempo, tendremos una imagen más clara de lo que ocurrió. Pero, por ahora, es evidente que las tecnologías emergentes, como la inteligencia artificial, que permiten la detección proactiva de fallas del sistema y otros desafíos que puedan surgir, tienen un papel destacado que desempeñar en la forma en que mantenemos nuestra infraestructura crítica en el futuro.

Fuente: https://www.forbes.com/sites/karenpanetta/2023/01/11/the-perfect-storm-of-the-faa-outage-why-catastrophic-scenario-testing-beyond-manufacturing-is- esencial-para-la-infraestructura-crítica-seguridad/