industria

Datos generados por el IIoT: Cómo optimizar su almacenamiento



Dirección copiada

En el mundo industrial es muy importante saber cómo hacer un análisis preciso de las necesidades de TI que no deje nada al azar y, al mismo tiempo, sea manejable con flexibilidad y escalabilidad.

Publicado el 13 de nov. de 2024



Datos generados por el IIoT

Cuantas más empresas, de los sectores más diversos, comiencen a utilizar aplicaciones industriales Internet de las cosas (IIoT), más se preguntarán cómo y dónde procesar y almacenar mejor las grandes cantidades de datos generados, eligiendo entre las posibles opciones: computación perimetral industriales, grandes centros de datos corporativos locales y centros de datos en la nube.

Estas son preguntas muy importantes, teniendo en cuenta el tamaño y el alcance de las inversiones realizadas en aplicaciones de IIoT. McKinsey & Company estima que las empresas gastarán entre 175 y 215 000 millones de dólares en hardware de IIoT de aquí a 2025, incluyendo hardware informático, sensores, firmware y almacenamiento.

Gartner, por otro lado, prevé que el 75 % de los datos generados por las empresas se almacenarán, procesarán, analizarán y «actuarán» de forma remota de aquí a 2025: una cifra elevada, que aún deja que el 25 % de los datos se procesen en otros lugares. Lo que nos lleva de nuevo a la cuestión de cómo decidir dónde es mejor almacenar, procesar y analizar todos esos datos del IIoT.

Para responder a la pregunta, es necesario explorar cuatro factores relacionados con los datos en cuestión, las cuatro V: volumen, variedad, valor y veracidad. Así es como se debe considerar cada uno de ellos para guiar las decisiones al respecto.

Los datos generados por el IIoT: Las cuatro V

Volumen: Cuántos datos se generan

La cantidad de datos generados es el primer factor a tener en cuenta. Los entornos de IIoT generan grandes cantidades de flujos de datos diferentes con volúmenes muy diferentes. Elementos simples como la temperatura, la presión, el tiempo y los niveles de volumen producen cantidades de datos relativamente pequeñas; esto es especialmente cierto si se miden solo ocasionalmente, en lugar de hacerlo de forma constante.

Por otro lado, una cámara de alta velocidad y alta resolución que monitorea un proceso en una planta de producción para detectar cuellos de botella o defectos puede generar gigabytes de datos por segundo. Evidentemente, esto tendrá requisitos de red, computación y almacenamiento muy diferentes a los de las mediciones de datos ambientales.

Variedad: Diferentes tipos de datos

Como se ha puesto de manifiesto al hablar de volumen, las aplicaciones de IIoT implican muchas variedades diferentes de datos. No todos los datos de los sensores, por ejemplo, son del tipo de “bajo volumen” asociado, por ejemplo, con la temperatura. Incluso un sensor que mide los niveles de un líquido puede diferir drásticamente de una aplicación a otra. Un sensor que mide el nivel de líquido en un tanque grande puede tomar muestras solo cada 10 segundos o menos, mientras que uno que mide los niveles de jeringas para una empresa farmacéutica realizará pruebas con mucha más frecuencia.

De la misma manera, las videocámaras pueden variar drásticamente entre sí. Las cámaras de video para análisis de procesos pueden trabajar a 10.000 fotogramas por segundo, mientras que la televisión de alta definición que vemos en casa funciona a 30 fotogramas por segundo. Por lo tanto, los tipos de datos pueden variar considerablemente según las aplicaciones relevantes.

Valor: Relevancia y durante cuánto tiempo es necesario conservar los datos

El valor se define determinando qué datos deben conservarse y durante cuánto tiempo. Si medimos la temperatura como parte de un proceso de producción, ¿tienen algún valor esos datos una vez finalizado el proceso? ¿Hay alguna razón por la que necesite conservarlos durante más tiempo hoy, mañana o el año que viene?

Para dar un ejemplo, pensemos en un proceso de soldadura automatizado, que incluye una cámara que captura imágenes en tiempo real, una sonda para escuchar el sonido emitido durante el proceso de soldadura, junto con sensores de temperatura y humedad. Todos los datos resultantes se envían a una computadora que los analiza y ajusta en consecuencia para obtener la soldadura óptima. Pero una vez finalizada la soldadura y superado el control de calidad, ¿se siguen necesitando todos los datos que se han utilizado para obtener la soldadura óptima? Probablemente no.

Sin embargo, por motivos de conformidad, en algunos países, los fabricantes de automóviles deben documentar todas las soldaduras que fabrican y conservar la información durante décadas, en caso de que “por el camino” se produzca un problema y sea necesario rastrearlo. Por lo tanto, necesitan conservar algunos datos sobre cada soldadura, pero quizás no sobre todas. Por supuesto, los requisitos de retención de datos varían según la industria, pero es importante identificar y mantener estos datos para la gestión de riesgos y el cumplimiento de las normas.

Veracidad: Llegar a la verdad

La cualidad final a tener en cuenta es la veracidad de los datos, es decir, si los datos son exactos. En la mayoría de los flujos de macrodatos es probable que cierta cantidad de datos represente valores atípicos o imprecisiones.

Por ejemplo, piense en un proceso de producción que mide el diámetro de un objeto, como una lata. Siempre habrá una vibración en el proceso que genere ruido, por lo que acabarás creando datos que en realidad representan ruido aleatorio, no lo que realmente estás intentando medir. No hay ninguna razón para conservar esos datos, por lo que se necesitan parámetros para verificar la calidad de los datos y extraer los que no sean relevantes. Lo más probable es que esto se haga en la periferia, de forma local, antes de enviar conjuntos de datos más grandes a otro lugar para su posterior procesamiento.

Si aplican estas cuatro V a una aplicación de IIoT determinada, debería formarse un marco claro para comprender dónde deben procesarse, almacenarse, protegerse los datos resultantes y cuál es la mejor manera de transportarlos.

El proceso de soldadura automatizado, por ejemplo, se lleva a cabo en tiempo real. Para realizar los ajustes de control necesarios, la aplicación requiere una latencia baja. No hay tiempo suficiente para enviar los datos a alguna plataforma en la nube para su análisis. El análisis debe realizarse localmente, por ejemplo, en una aplicación industrial avanzada. En cambio, para los datos que los fabricantes de automóviles necesitan guardar a largo plazo, probablemente sea mejor optar por enviarlos a un centro de datos regional o a una instalación basada en la nube.

Además de los requisitos de latencia, el coste del ancho de banda también puede ser un factor a tener en cuenta. Cuantos más datos se deban enviar, mayor será el ancho de banda disponible. Y cuanto más grande sea el ‘tubo’ necesario, mayor será la inversión en infraestructura y capacidad de red.

A veces, el volumen de datos requiere gestionarlos inicialmente de forma local y, después, planificar el envío de un subconjunto de esos datos a una estructura regional o a la nube para su posterior procesamiento. Un ejemplo sería una aplicación de automatización de procesos en la que los datos necesarios para ejecutar realmente el proceso se procesan localmente, mientras que los datos del proceso (tiempo necesario, resultados del control de calidad, estado de la máquina) se envían a una aplicación de análisis basada en la nube para optimizar el proceso y supervisar el estado de las máquinas involucradas.
Según el caso de uso real y las consideraciones anteriores, la implementación de una arquitectura de datos híbrida en este caso parece tener más sentido.

Encontrar el equilibrio adecuado entre la informática perimetral industrial, las grandes empresas o los centros de datos compartidos y los centros de datos en la nube puede resultar complejo, y las malas decisiones pueden generar costes adicionales. Incluso en el mundo industrial, hoy en día es sumamente importante saber cómo realizar un análisis preciso de sus necesidades de TI que no deje nada al azar y, al mismo tiempo, sea manejable con flexibilidad y escalabilidad. Esto también es una señal de cómo el mundo de la industria está entrando en un futuro cada vez más digital, con cada vez más tracción y valor.

Fuente: Zerounoweb.it, Network Digital360

Artículos relacionados

Artículo 1 de 5