gESTIÓN DE LA INFORMACIÓN

Analítica de datos, ¿Qué es, para qué sirve y cómo utilizarla en las empresas?



Dirección copiada

Aunque la analítica, como disciplina, no es algo nuevo, ya que se trata de un concepto que se remonta a los griegos, en nuestros días su significado se relaciona directamente con otra cosa: los datos. La analítica está por todas partes, tanto que el mercado global de esta tendencia movió más de 30.000 millones de…

Publicado el 29 de ago de 2023



Analitica de datos
Stock market chart on virtual screen with woman’s hand digital remix

Pero esta cifra es pequeña al compararla con las proyecciones de 393.350 millones para 2032. Las razones para esta magnitud se encuentran en su utilidad. La analítica de datos no solo es transversal a cualquier vertical del mercado, también es la base sobre la cual están apoyadas otras tecnologías como la Inteligencia Artificial.

Además, coincide con otro fenómeno de un mundo digitalizado, el crecimiento desmedido de los datos. Para 2025, se estima que se generarán más de 180 zettabytes de información, una cifra nunca antes vista y más desafiante aún, según IDC, entre 2022 y 2026 la cantidad de datos crecerá más del doble.

En este escenario en el que las empresas están inundadas por los datos, la analítica surge como una necesidad para ser más competitivas y sobrevivir en un mercado cada vez más competido.

¿Qué es la analítica de datos y de dónde nace?

Algunos de los primeros ejemplos del uso de la analítica en empresas vienen de 1911 con el “Estudio de tiempos y movimientos” del ingeniero estadounidense Frederick Winslow Taylor, quien buscaba determinar un análisis riguroso sobre los tiempos de ejecución y remuneración del trabajo para aumentar la eficiencia de las empresas.

Pero siendo más amplios, tal vez el primer uso de la analítica en negocios derive de los impuestos y tributos que los gobiernos pedían a sus súbditos desde tiempos inmemoriales. Después de todo, los impuestos obligaban a clasificar los ingresos de los ciudadanos y sus obligaciones.

Sin embargo, la analítica de datos como la conocemos obedece a otra revolución: la de la información y la abundancia de los datos que se produjo por la digitalización del Big Data.

De esta forma, y según la Universidad de Oxford, el análisis de datos (Data analytics) se define sobre la identificación de patrones significativos en grandes volúmenes de datos mediante el uso de computadoras y la predicción de patrones, todo con el fin de obtener información que mejore la toma de decisiones.

Otra definición de Gartner se refiere a “Data and Analytics” como la forma en que las organizaciones gestionan y analizan los datos para mejorar las decisiones, los procesos empresariales y los resultados, como el descubrimiento de riesgos, desafíos y oportunidades empresariales.

Actualmente Gartner habla de la “analítica avanzada” como una evolución de esta disciplina, que es el examen autónomo o semiautónomo de datos mediante técnicas y herramientas más sofisticadas que las de la inteligencia empresarial (BI) tradicional, para descubrir perspectivas más profundas, hacer predicciones o generar recomendaciones.

Diferencias entre la analítica de datos y el big data

La analítica de datos se refiere al proceso de examinar, limpiar y analizar conjuntos de datos para extraer información significativa y tomar decisiones basadas en evidencia. Este enfoque se centra en la interpretación de datos históricos y actuales, utilizando técnicas estadísticas, algoritmos de aprendizaje automático y visualizaciones para descubrir patrones, tendencias y relaciones ocultas en los datos. Su objetivo principal es proporcionar una visión clara y procesable de los datos que permita a las organizaciones tomar decisiones informadas, optimizar operaciones y responder de manera efectiva a desafíos y oportunidades.

Por otro lado, el término “big data” se refiere al manejo y análisis de conjuntos de datos extremadamente grandes y complejos que superan las capacidades de las herramientas de procesamiento de datos tradicionales. El big data se caracteriza por sus tres “V”: volumen (gran cantidad de datos), variedad (diversidad de fuentes y tipos de datos) y velocidad (alta velocidad de generación y procesamiento de datos). Para abordar el big data, se utilizan tecnologías como sistemas de almacenamiento distribuido, procesamiento en paralelo y herramientas de análisis avanzadas. El big data permite a las organizaciones obtener información profunda y en tiempo real, pero su gestión y análisis requieren una infraestructura tecnológica sólida y especializada.

¿Cómo se hace una analítica de datos?

El proceso de realizar una analítica de datos se inicia con la definición clara de los objetivos y las preguntas clave que se desean responder. A continuación, se recopilan y se preparan los datos necesarios, eliminando valores atípicos o datos irrelevantes. Luego, se procede a explorar los datos mediante técnicas de visualización y estadísticas descriptivas para comprender mejor su estructura y patrones.

Una vez que se comprenden los datos, se aplican modelos de análisis avanzados, como algoritmos de aprendizaje automático o estadísticas inferenciales, para obtener respuestas a las preguntas planteadas. Es crucial evaluar y validar los resultados para garantizar su precisión y relevancia. Finalmente, se comunican los hallazgos de manera clara y efectiva a través de informes y visualizaciones para que las organizaciones tomen decisiones basadas en datos.

Tipos de analíticas de datos en las empresas

Si bien, hasta antes de mediados del siglo XX, la analítica y estadística aplicada al entorno empresarial se limitaba a variables uniformes como gastos de producción, precios, ventas, tiempos de producción, etc. Las empresas de los últimos 30 años han visto una explosión en la diversidad del tipo de datos.

Actualmente, los datos incluyen imágenes, archivos PDF, vídeos, información de sensores de temperatura, seguridad, etc. Hablamos de un universo de datos que se dividen entre estructurados, más vinculados al entorno tradicional, y no estructurados que son la mayoría, más del 80 %.

Este universo de datos debe filtrarse, procesarse y compararse, entre otros pasos, de acuerdo a los fines que se persigan. Según la Escuela de Negocios de Harvard, el análisis de datos se puede dividir en 4 grandes vertientes, que son:

Analítica descriptiva

Responde a la pregunta: ¿Qué ha pasado? Y permite extraer tendencias actuales basadas en el análisis de los datos del pasado. Es el más sencillo y sobre este se basan los otros tipos de análisis.

Gráfico: Knowsy AI.

Analítica de diagnóstico

Este busca responder a la pregunta: ¿Por qué ha ocurrido esto? Se trata de un análisis más avanzado, capaz de comparar tendencias, encontrar relaciones y causas entre ellas.

Analítica predictiva

Busca responder a la pregunta: ¿Qué podría pasar en el futuro? Es uno de los más usados en el desarrollo de productos o en la implementación de nuevas estrategias. Este análisis nos permite crear proyecciones informadas sobre lo que podría suceder en el futuro.

Analítica prescriptiva

Es la más avanzada de las 4 y mezcla las fases diagnósticas y predictivas. Este análisis quiere ir un paso más allá y responder a: ¿Qué debemos hacer a continuación? Este modelo sugiere acciones basadas en escenarios, lo que lo hace ideal para la toma de decisiones. Brilla por su uso de Machine Learning.

Cómo utilizar la analítica de datos

A pesar de las diferencias entre los diferentes modelos analíticos, existen pasos comunes entre todos ellos que van desde agrupar la información hasta depurarla. Más en detalle, son 4 grandes pasos que incluyen: la recolección de datos; la preparación de datos, el análisis de los mismos y, por último, su visualización.

Recolección de datos

Esta fase busca recopilar la mayor cantidad de información desde las diferentes fuentes posibles, buscando en bases de datos, usando API para relacionarse con otras plataformas, investigando en fuentes de datos abiertos, etc.

Gráfico: Seasia Infotech.

Preparación de datos

No todos los datos son relevantes. Algunos están duplicados, otra parte está degradada o corrupta, entre otros problemas. Por eso es tan importante la preparación de los datos, para evitar inconsistencias que puedan llevar a generar errores en el procesamiento.

Análisis de datos

El corazón de este proceso se basa en la aplicación de varias técnicas estadísticas y el uso de tecnologías de Machine Learning para identificar patrones, correlaciones y tendencias. Aquí aplicamos modelos descriptivos, predictivos o prescriptivos dependiendo de los objetivos que se quieran alcanzar en la organización.

Visualización de datos

No importa qué tan brillante sea un hallazgo, si no es capaz de transmitir este mensaje. La visualización busca hacer accesibles los descubrimientos de los procesos de analítica a los tomadores de decisiones.

Cuáles son las capacidades de la analítica de datos

Estas son algunas de las principales capacidades de la analítica de datos:

  1. Descubrimiento de patrones y tendencias: La analítica de datos permite identificar patrones ocultos en grandes conjuntos de datos, lo que facilita la detección de tendencias y comportamientos significativos. Esto es esencial para la toma de decisiones informadas.
  2. Predicción y pronóstico: Mediante técnicas como el aprendizaje automático, la analítica de datos puede predecir eventos futuros y ayudar a las organizaciones a anticipar demandas, tendencias del mercado y necesidades de los clientes.
  3. Optimización: Permite optimizar procesos y recursos. Por ejemplo, en logística, puede utilizarse para optimizar rutas de entrega, mientras que en marketing, puede ayudar a optimizar estrategias publicitarias.
  4. Segmentación de clientes: Ayuda a las empresas a comprender mejor a sus clientes, segmentarlos en grupos con características similares y personalizar estrategias de marketing y servicio al cliente.
  5. Detección de anomalías: Puede identificar de manera eficaz anomalías o eventos inusuales en los datos, lo que es valioso para la detección de fraudes, seguridad cibernética y control de calidad.
  6. Medición de rendimiento: Permite evaluar el rendimiento de una organización en función de métricas clave y KPIs (indicadores clave de rendimiento), lo que facilita la evaluación de estrategias y la toma de decisiones para mejorar el rendimiento.
  7. Automatización: La analítica de datos puede automatizar tareas rutinarias, lo que ahorra tiempo y recursos. Por ejemplo, en el servicio al cliente, puede utilizarse para implementar chatbots inteligentes.
  8. Personalización: Facilita la personalización de productos, servicios y experiencias del cliente en función de los datos recopilados sobre las preferencias individuales.
  9. Visualización de datos: Proporciona herramientas para crear visualizaciones interactivas y comprensibles que facilitan la comunicación de resultados y hallazgos a todas las partes interesadas.
  10. Aprendizaje continuo: La analítica de datos permite mejorar constantemente los modelos y algoritmos a medida que se acumula más información, lo que lleva a un proceso de aprendizaje continuo y refinamiento de estrategias.

Tecnologías más utilizadas para el análisis de datos

Para cumplir con las diferentes etapas de la analítica, se utilizan diversas herramientas para cada paso, que incluyen técnicas como el análisis de redes, el análisis de sentimientos y semántica, el Big Data, la minería de datos, el Machine Learning, el análisis de gráficos, las simulaciones, las redes neuronales, entre otros.

Gráfico: Kadamtech.com.

Un ejemplo básico de la recopilación de la información lo proporcionan las plataformas SQL y NoSQL, que se utilizan para procesar los diferentes tipos de datos. La primera base de datos se emplea para agrupar datos estructurados en tablas, mientras que la segunda trabaja con datos de diferentes formatos (no estructurados) que pueden incluir textos, archivos PDF, audios, correos electrónicos, datos geoespaciales, etc.

Otro ejemplo lo brinda el aprendizaje automático o Machine Learning, que puede identificar patrones, detectar anomalías y prever comportamientos en diversos escenarios. Por ello, está en el corazón de varios tipos de análisis.

Otras tecnologías habitualmente relacionadas con la analítica están vinculadas a la computación en la nube para el almacenamiento de información y la virtualización de datos, que permiten agrupar diferentes fuentes de datos para analizarlos y administrarlos de manera más transparente y sencilla.

En el mundo del análisis de datos, algunas de las tecnologías más utilizadas incluyen lenguajes de programación como Python y R, que ofrecen una amplia gama de bibliotecas y herramientas específicas para análisis estadísticos y de datos. Además, las bases de datos relacionales y no relacionales, como SQL y MongoDB, son esenciales para almacenar y gestionar grandes conjuntos de datos. Las plataformas de análisis y visualización, como Tableau y Power BI, permiten a los profesionales de datos crear informes y visualizaciones interactivas para comunicar resultados de manera efectiva. Además, el aprendizaje automático y la inteligencia artificial, respaldados por bibliotecas como TensorFlow y scikit-learn, desempeñan un papel cada vez más importante en la predicción y la automatización de tareas analíticas. Estas tecnologías forman el núcleo de la infraestructura de análisis de datos moderna y capacitan a las organizaciones para extraer información valiosa de sus datos.

Beneficios e inconvenientes

El poder de la información es innegable, ya sea en política, educación y por supuesto, en negocios. La analítica de datos permite proporcionar la información y el análisis necesarios para que los tomadores de decisiones seleccionen las mejores opciones. Esta tendencia ha creado todo un paradigma de organizaciones catalogadas como “data driven” o basadas en datos.

Incluso la firma analista Forrester habla de una evolución que denomina “insights-driven business (IDB)”, que es la capacidad de transformar los datos empresariales en información, que a su vez desencadena acciones que afectan los resultados tangibles del negocio.

Gráfico: PPC Expo.

Aunque los usos y beneficios de la información son innumerables, algunos de los ejemplos más notables en empresas son:

  • Mejora la productividad y eficiencia.
  • Mejora la experiencia de los clientes mediante el análisis de su comportamiento.
  • Genera ventajas competitivas y la creación de productos innovadores.
  • Permite la creación de productos personalizados.
  • Mejora la toma de decisiones a todos los niveles y mejora la gestión de riesgos.

No obstante, la analítica de datos también plantea desafíos para las organizaciones, desde las políticas de manejo de datos, que no solo deben cumplir con las regulaciones locales, sino también proteger la privacidad de los usuarios.

Al mismo tiempo, el exceso de información generado cada día puede dificultar la visión de las organizaciones si no siguen una estrategia de datos coherente que se inculque en toda la organización.

Impacto de la analítica de datos en las empresas

Las cifras son dicientes. Para evaluar el impacto de la analítica en las organizaciones se dio a conocer el estudio ‘The Global State of Enterprise Analytics’ publicado por la Harvard Business School, donde se encontró que el 56% de los encuestados afirmó que la analítica conduce a una toma de decisiones más rápida, eficiente y efectiva.

Según el informe, el 64% reportó mejoras en la eficiencia; un 51% mencionó mejoras en el desempeño financiero; un 46% resaltó una retención y adquisición de clientes más efectiva; un 44% destacó una mejor experiencia del cliente y un 43% señaló una ventaja competitiva.

Gráfico: Microstrategy.

Otras áreas de impacto de la analítica en las organizaciones se presentan en la agilización de los procesos de venta, una mejor determinación de los modelos de precios y un mayor conocimiento de los clientes y sus hábitos de compra, entre otros.

Casos de uso, ejemplos por sectores

El uso de la información es transversal en cualquier mercado, pero algunos casos concretos nos pueden ayudar a resaltar la flexibilidad de la analítica. Por ejemplo, en el caso de la aerolínea de bajo costo estadounidense Southwest Airlines (SWA), se decidió utilizar regresión logística basada en el comportamiento de sus clientes para desarrollar previsiones de crecimiento que empoderaran a los equipos de ventas y que tuvieran un impacto en mayores ventas.

En el sector de la salud, la firma McKesson llevó a cabo una limpieza de terabytes de información para obtener más datos que le permitieran impulsar nuevos modelos de negocio y al mismo tiempo fortalecer su cadena de suministro.

Gráfico: Medium.

Pero pocos casos de uso de la analítica son tan conocidos por la audiencia como el sistema de recomendaciones de Netflix. Con presencia en 190 países y más de 238 millones de espectadores registrados en el segundo trimestre de 2023, esta plataforma de vídeo OTT es famosa por su algoritmo de recomendación basado en el historial, el tipo de dispositivos, el tiempo promedio de vista y las calificaciones de sus usuarios. Tal vez, el único ejemplo de una magnitud equivalente lo tiene la plataforma de comercio electrónico Amazon.

La analítica de datos tiene aplicaciones significativas en una amplia variedad de industrias y sectores, ya que puede mejorar la toma de decisiones, aumentar la eficiencia operativa y generar ventajas competitivas. Aquí hay ejemplos de cómo se utiliza la analítica de datos en diferentes campos:

  1. Salud y Ciencias de la Salud: En el ámbito de la salud, la analítica de datos se utiliza para el diagnóstico médico, la gestión de la salud de la población y la predicción de brotes de enfermedades. Además, ayuda a identificar patrones de tratamiento efectivos y a optimizar la gestión de recursos en hospitales.
  2. Finanzas: En el sector financiero, se utiliza para la detección de fraudes, la gestión de riesgos crediticios, la predicción de tendencias del mercado y la creación de carteras de inversión más efectivas.
  3. Retail y Comercio Electrónico: Las empresas minoristas utilizan la analítica de datos para optimizar el inventario, personalizar recomendaciones de productos, comprender el comportamiento del cliente y mejorar la eficiencia de la cadena de suministro.
  4. Manufactura: En la industria manufacturera, se aplica para el mantenimiento predictivo de maquinaria, la optimización de la producción y la gestión de la calidad.
  5. Educación: Las instituciones educativas utilizan la analítica de datos para mejorar la retención de estudiantes, evaluar el rendimiento del profesorado y personalizar el contenido educativo.
  6. Energía: En el sector de la energía, se emplea para la gestión eficiente de recursos energéticos, la detección de fallas en equipos y la optimización de la distribución.
  7. Transporte y Logística: Se utiliza para optimizar rutas de envío, programación de mantenimiento de vehículos y para mejorar la eficiencia en la gestión de flotas.
  8. Medios y Entretenimiento: En esta industria, se emplea para el análisis de audiencia, la recomendación de contenido y la personalización de experiencias de usuario.
  9. Gobierno: Los gobiernos utilizan la analítica de datos para mejorar la toma de decisiones políticas, la seguridad pública, la gestión de recursos y la predicción de tendencias económicas y sociales.
  10. Entorno SIG: En el entorno de Sistemas de Información Geográfica (SIG), la analítica de datos se utiliza para analizar y visualizar datos espaciales. Esto incluye la planificación de rutas óptimas, la identificación de áreas de riesgo, la gestión de recursos naturales y la toma de decisiones basada en la ubicación. Los SIG son esenciales en campos como la cartografía, la gestión del territorio y la respuesta a emergencias ambientales.
  11. Agricultura: En la agricultura, se utiliza para la gestión de cultivos, la monitorización de condiciones climáticas y el control de plagas, lo que permite una agricultura más sostenible y productiva.

Seguridad en los datos

El indicador más directo del valor de la protección de los datos lo dan las cifras del ransomware: 1.7 millones de ataques diarios, 19 cada segundo, que para mediados de 2022 derivaron en 236.7 millones de ataques globales. Peor aún, están creciendo y se estima que en 2031 ocasionarán pérdidas de más de 265.000 millones de dólares.

Esta modalidad delictiva se especializa en la captura y retención de la información de las organizaciones, impactando, en el primer trimestre de 2023, especialmente a las industrias de manufactura, petroquímicas, electrónica, alimentos y energía, entre otros segmentos.

Gráfico: Dragos.

Un caso tristemente célebre fue el del Colonial Pipeline en Estados Unidos, donde el robo de información paralizó el suministro de combustible en la costa oeste de Estados Unidos y también significó el pago de 75 Bitcoins, equivalentes en ese momento a 4.4 millones de dólares, a los criminales.

Tras este ataque, el gobierno estadounidense impulsó varias iniciativas como el sitio web stopransomware.gov y la creación de una coalición de países aliados para combatir a los cibercriminales.

Retos y desafíos de la analítica de datos

A primera vista, podría pensarse que el aumento global en la generación de datos es algo positivo para las empresas, pero esto es una verdad a medias; no todos los datos son relevantes para una organización. Esta abundancia de datos en tiempo real representa un desafío para las empresas.

Vivimos en un planeta donde la desinformación se ha convertido en un negocio y donde las noticias falsas con fines que van desde militares hasta lucrativos se han vuelto cotidianas. Por ello, uno de los primeros retos de cualquier organización es asegurar la calidad de sus datos capturados desde todas sus fuentes.

Pero además de este problema, existe un viejo desafío: la falta de mano de obra calificada. Se estima que para 2030 habrá más de 85 millones de empleos tecnológicos vacantes, incluyendo al personal encargado de las áreas de analítica.

Gráfico: AIHR.

Además de la falta de personal con experiencia, suele presentarse una resistencia cultural a la hora de generar nuevas estrategias para el manejo de los datos en las organizaciones.Otro problema habitual son los silos de datos, nodos de información aislados del resto de la organización que resultan inaccesibles para los tomadores de decisiones; peor aún, dentro de estos silos puede haber información crítica.

Y finalmente, los costos. La analítica tiene un valor financiero. Desde el dinero invertido en mantenimiento de infraestructura hasta el tiempo, el procesamiento de datos, la recopilación, el análisis, la curaduría, las proyecciones, etc. Es cierto que los beneficios de la analítica son múltiples, pero requiere de una inversión sostenida a lo largo del tiempo. Por supuesto, el costo de no usarla puede ser mayor.

Otro de los retos más prominentes en la analítica de datos es la persistencia de los silos de datos dentro de las organizaciones. Estos compartimentos estancos en los que los datos se almacenan y gestionan de manera aislada entre diferentes departamentos o equipos pueden en la recopilación, acceso y análisis de datos integrales. La falta de colaboración y la falta de acceso a datos relevantes pueden limitar la capacidad de las empresas para obtener una visión completa de sus operaciones y clientes, lo que a su vez reduce la efectividad de la analítica de datos. Superar estos desafíos requiere un esfuerzo concertado para fomentar una cultura de datos que promueva la compartición y colaboración interdepartamental, y la implementación de tecnologías y flujos de trabajo que permitan una gestión más fluida de los datos en toda la organización.

Situación de la analítica de datos en Colombia y con respecto a otros países

En comparación con países altamente industrializados como Estados Unidos o algunas naciones europeas, Colombia está en una etapa de desarrollo en lo que respecta a la adopción de la analítica de datos. En estas naciones más avanzadas, la analítica de datos se ha convertido en una parte integral de la cultura empresarial y es ampliamente utilizada en sectores como la tecnología, la atención médica, las finanzas y el comercio. Las inversiones en investigación y desarrollo, así como la disponibilidad de recursos y talento altamente especializado, han impulsado aún más la madurez de la analítica de datos en estos países.

Por otro lado, en Colombia, si bien el interés y la demanda por la analítica de datos han crecido de manera significativa, aún se encuentra en proceso de consolidación. La educación y formación en este campo están en constante desarrollo, y las empresas colombianas están comenzando a darse cuenta de la importancia de contar con profesionales de la analítica de datos y tecnologías avanzadas para mantenerse competitivas en un mercado global. A pesar de la brecha inicial con respecto a las naciones más avanzadas, Colombia está avanzando rápidamente y está emergiendo como un jugador relevante en la escena latinoamericana de la analítica de datos, con un gran potencial de crecimiento en los próximos años.

Formación para convertirse en experto en analítica de datos

Para que una persona pueda convertirse en analista de datos, debe buscar una educación formal en campos como Ciencias de la Computación, Estadística o Matemáticas, o un título específico en Ciencia de Datos o Analítica de Datos. Desarrollar habilidades de programación en lenguajes como Python y R, y familiarizarse con herramientas y bibliotecas relevantes. Adquirir conocimientos en estadística, matemáticas y bases de datos, y practicar la limpieza y manipulación de datos. Además, trabajar en proyectos personales o colaborativos para construir un portafolio sólido y participar en cursos en línea, certificaciones y conferencias para mantenerse actualizado en esta área en constante evolución. La capacidad de comunicar resultados y tener un enfoque orientado a la resolución de problemas también es esencial en esta profesión.

SI quiere conocer más sobre el tema lo invitamos a que consulte nuestro White Paper: Big Data y Analítica Avanzada: Se acabaron las excusas, es la hora de exprimir al máximo los datos.

Imagen de rawpixel.com en Freepik

Artículos relacionados

Artículo 1 de 5