guías

Amazon SageMaker, ¿qué es y qué ofrece a las empresas?



Dirección copiada

Amazon es un gigante en todos los sentidos, desde sus ofertas en comercio electrónico hasta su plataforma de almacenamiento en la nube. Esta empresa ha apostado fuerte por los servicios de Inteligencia Artificial con dos grandes nombres: Bedrock y SageMaker. En este texto, conoceremos la naturaleza y los beneficios de este último.

Publicado el 20 de nov de 2024



Amazon SageMaker

El mercado de la Inteligencia Artificial crece cada año, con un valor global estimado en 184.000 millones de dólares para 2024, según proyecciones de Statista. Con una tasa de crecimiento anual del 28,46%, esta tendencia tecnológica presenta nuevas ofertas para las empresas. Amazon SageMaker es una de ellas.

Gráfico: Statista.

Lanzado al mercado en 2017, durante el evento AWS re:Invent, Amazon SageMaker se ha convertido en una de las herramientas favoritas del mercado, facilitando el desarrollo de modelos de Aprendizaje Automático (Machine Learning), simplificando los procesos y su integración con la infraestructura tecnológica de Amazon.

Introducción a Amazon SageMaker

Ampliamente utilizado en nichos de mercado como el financiero, de salud, retail y tecnología, Amazon SageMaker es una plataforma que ha evolucionado a lo largo de los años, desde sus primeros algoritmos integrados con frameworks de aprendizaje profundo, hasta la integración de nuevas funcionalidades para grandes modelos de lenguaje a través de Amazon Bedrock.

¿Qué es Amazon SageMaker?

Según AWS, SageMaker es “un servicio completamente administrado para preparar datos y crear, entrenar e implementar modelos de machine learning (ML) para cualquier caso de uso con infraestructura, herramientas y flujos de trabajo completamente administrados”.

Para ser más específicos, un ML totalmente gestionado se refiere a proveedores de servicios en la nube como Google, Microsoft, IBM y Amazon, que se encargan de proporcionar y administrar toda la infraestructura y las operaciones necesarias para construir, entrenar e implementar modelos de Aprendizaje Automático.

Algunos ejemplos de este modelo son:

  • Google Cloud AI Platform
  • Microsoft Azure Machine Learning
  • IBM Watson Studio
  • H2O.ai

En este modelo, el proveedor se encarga de proporcionar la infraestructura necesaria (servidores, redes, software, etc.), su mantenimiento (actualizaciones, parches) y su seguridad, entre otras características.

Ventajas de usar Amazon SageMaker

Amazon SageMaker ofrece varias ventajas típicas de este tipo de soluciones de ML (Machine Learning). Un gran diferencial es su integración con los productos y servicios de Amazon, como Amazon S3, AWS Glue, Lambda, Bedrock, etc.

Gráfico: Statista

Esto significa tener acceso a la plataforma de computación en la nube más usada del planeta.  Para 2024, se proyecta que Amazon acapara un 31% del mercado de la nube, seguido de Microsoft Azure (20%), Google Cloud (12%) y Alibaba Cloud (4%), entre otros.

Entre las ventajas que ofrece a los desarrolladores, destaca su compatibilidad con frameworks de código abierto populares como TensorFlow, PyTorch, MXNet y Scikit-learn. Además, su escalabilidad y capacidad de automatización permiten al desarrollador enfocarse en otras áreas.

Para los científicos de datos, Amazon SageMaker ofrece beneficios de colaboración, permitiendo compartir información con sus colegas. Sobre todo, destaca por ser una solución todo en uno, que unifica el flujo de trabajo desde la preparación de datos hasta la implementación de los modelos, sin necesidad de usar diferentes herramientas y servicios adicionales.

Historia y Evolución

En 2017, el Machine Learning estaba más relacionado con grandes instituciones educativas, centros de investigación y empresas gigantescas que podían costear la creación y mantenimiento de estas infraestructuras tecnológicas. En noviembre de ese año, durante el evento AWS re:Invent, Amazon quiso abrir su plataforma al mercado.

En aquel entonces, Amazon SageMaker buscaba permitir a los clientes crear, entrenar e implementar modelos de aprendizaje automático de forma rápida y sencilla. Al mismo tiempo, se anunciaron cuatro servicios que aplicaban el aprendizaje automático en tareas concretas: Amazon Transcribe, Amazon Translate, Amazon Comprehend y Amazon Rekognition Video.

Cinco años después de su lanzamiento, se añadieron 250 nuevas funciones, incluyendo el primer entorno de desarrollo integrado (IDE) para Machine Learning en el mundo, llamado SageMaker Studio. 

Adicionalmente, entre 2018 y 2020 se lanzaron otras funcionalidades como SageMaker Ground Truth y SageMaker Autopilot, que facilitaron la creación de conjuntos de datos de entrenamiento etiquetados de alta calidad y el desarrollo de modelos de ML con conocimientos mínimos de código computacional.

Posteriormente, Amazon SageMaker ofreció herramientas para detectar sesgos y promover la transparencia a través de SageMaker Clarify, además de opciones para simplificar la preparación de datos con SageMaker Data Wrangler.

Es importante destacar que las últimas tendencias se están llevando a cabo en la integración y desarrollo de más servicios basados en Inteligencia Artificial generativa y la autogeneración de nuevos flujos de trabajo más eficientes y rápidos.

Funcionalidades Principales de Amazon SageMaker

Como mencionamos previamente, una de las grandes ventajas de Amazon SageMaker es la amplia cobertura de funcionalidades, abarcando todo el esquema de desarrollo de los modelos de Aprendizaje Automático, incluyendo desde la preparación de los datos hasta el mantenimiento de los mismos.

Gráfico: Amazon.

Preparación de Datos

Todo comienza con los datos. En este punto, Amazon ofrece las funcionalidades de SageMaker Data Wrangler y SageMaker Ground Truth. El primero permite asegurar la calidad de los datos y facilita su administración, ofreciendo más de 300 transformaciones de datos (normalización y escalado, combinaciones de columnas, manejo de valores nulos y duplicados, etc.), además de conectar varias fuentes de datos.

Por otro lado, SageMaker Ground Truth es especialmente útil para la creación de conjuntos de datos de entrenamiento de alta calidad mediante el etiquetado de datos manual, a través de una fuerza laboral humana.

Entrenamiento de Modelos

La segunda fase en el uso de SageMaker está relacionada con la construcción de los modelos, utilizando herramientas como SageMaker Studio Notebooks, SageMaker Autopilot y algoritmos de ML de alto rendimiento.

SageMaker también soporta la importación de frameworks y algoritmos por parte de los usuarios, además de ajustar automáticamente los modelos para optimizar su rendimiento y así reducir el consumo de recursos y tiempo de desarrollo. Buscando simplificar su uso, se destacan iniciativas como SageMaker Autopilot, que permite construir modelos casi sin código.

Implementación y Gestión de Modelos

Una vez construidos los modelos, la tercera gran fase es su administración, usando módulos como SageMaker Endpoints, SageMaker Model Monitor y SageMaker Clarify, que permiten crear flujos de trabajo automatizados y repetibles para el entrenamiento, la prueba y la implementación de modelos en tiempo real y por lotes.

En este esquema, SageMaker Model Monitor permite supervisar el rendimiento de los modelos y detectar desviaciones en su comportamiento. Funcionalidades como SageMaker Endpoints ofrecen interfaces de uso capaces de escalar y crear predicciones de su funcionamiento.

Otras herramientas destacadas de gestión son SageMaker Edge Manager, que facilita la implementación y administración de modelos de ML en dispositivos perimetrales, y SageMaker Feature Store, que ofrece un repositorio centralizado para almacenar, compartir y administrar características de ML.

Amazon SageMaker Studio

Lanzado al mercado en diciembre de 2019, durante el AWS re:Invent, Amazon SageMaker Studio ha evolucionado con el tiempo. En noviembre de 2023 pasó a llamarse Amazon SageMaker Studio Classic.

¿Qué es SageMaker Studio?

Según sus desarrolladores, Amazon SageMaker Studio es un “entorno de desarrollo integrado (IDE) que proporciona una única interfaz visual basada en la web, donde puede acceder a herramientas especialmente diseñadas para realizar todos los pasos de desarrollo de machine learning (ML), desde la preparación de datos hasta la creación, entrenamiento e implementación de modelos de ML”. 

Gráfico: Amazon.

Entre sus características, Amazon SageMaker Studio permite “cargar datos con rapidez, crear cuadernos nuevos, entrenar y ajustar modelos, avanzar y retroceder entre pasos para ajustar experimentos e implementar modelos en producción sin salir de SageMaker Studio”.

Además, al ser un modelo nativo en la nube, ofrece ventajas propias de este modelo, como una colaboración y acceso más sencillo desde cualquier lugar del planeta y a cualquier hora. Del mismo modo, al ser web, su mantenimiento es más simple, escalable y económico, ya que se paga solo por lo que se consume.

Casos de Uso de SageMaker

Tras varios años en el mercado, SageMaker se ha posicionado en múltiples verticales del planeta y América Latina, que van desde el sector salud y manufactura hasta industrias y banca, entre otras. Un ejemplo concreto es el banco más grande de Colombia, Bancolombia, que en 2021 migró hacia AWS, o el banco privado más grande de Brasil, Itaú.

En el sector financiero de América Latina, en el caso de Itaú, la implementación de SageMaker logró reducir el tiempo de desarrollo de modelos de ML de 6 meses a 5 días, aumentando la productividad mediante la estandarización de procesos y la reducción de costos.

En Argentina, Mercado Libre, la mayor plataforma de comercio electrónico de la región, también ha implementado funcionalidades de Inteligencia Artificial como Amazon Translate, que permite traducir de forma automática millones de títulos y descripciones de productos, e interacciones entre clientes y vendedores. 

Pero esto es solo una muestra regional. Algunos casos de éxito globales involucran laboratorios como AstraZeneca, que implementó SageMaker Studio para ayudar en el proceso de descubrimiento, desarrollo y comercialización de medicamentos en más de 145 países.

También grandes firmas de tecnología como Autodesk han implementado SageMaker Studio para el tratamiento de datos y desarrollo de software y servicios, logrando una reducción de costos de hasta un 30%.

Innovaciones y Herramientas Avanzadas

Parte del éxito de Amazon SageMaker se basa en su innovación a lo largo de los años, involucrando nuevas herramientas de desarrollo y adoptando nuevas tendencias tecnológicas en su portafolio de servicios, que incluyen iniciativas como la Inteligencia Artificial Generativa y herramientas de automatización low-code/no-code, entre otras.

Innovaciones Recientes

Con un tamaño de mercado estimado en más de 67.180 millones de dólares para 2024, según proyecciones de la firma Fortune Business Insight, la Inteligencia Artificial generativa es la principal tendencia tecnológica de los últimos años. Como tal, está incluida dentro de las herramientas de AWS bajo iniciativas como SageMaker JumpStart.

JumpStart permite acceder a modelos de IA generativa, como Llama 2, Stable Diffusion y Bloom. Estos modelos pueden generar texto, imágenes y código para el desarrollo de servicios y aplicaciones, al tiempo que se integran con Bedrock. Recordemos que este último permite acceder a modelos fundacionales de IA generativa de varios proveedores, incluyendo Amazon y Anthropic, entre otros.

Otra iniciativa destacable es el AWS Marketplace, que permite acceder a una amplia gama de algoritmos y paquetes de modelos que se pueden utilizar en Amazon SageMaker, y que han sido desarrollados por terceros, acelerando los tiempos de desarrollo.

Soluciones de Seguridad y Escalabilidad

Como cualquier plataforma tecnológica que manipula datos, SageMaker alberga una variedad de mecanismos para proteger la confidencialidad de los datos, el acceso y el control de los modelos. Por ejemplo, en lo que corresponde a control de acceso, SageMaker se integra con la plataforma de seguridad AWS Identity and Access Management (IAM) para controlar quién tiene acceso a los recursos, además de establecer políticas de seguridad.

Es importante destacar que SageMaker cumple con diversas normas de seguridad y privacidad para la protección de datos donde operan sus clientes, incluyendo estándares como HIPAA, GDPR y PCI DSS, entre otros.

Los datos también son protegidos mediante algoritmos de encriptación y claves maestras de los clientes (CMK) administradas a través del AWS Key Management Service (KMS), un servicio que permite crear, almacenar, administrar y auditar claves criptográficas. De igual forma, crea redes privadas virtuales (VPC) que permiten controlar el tráfico de red y aislar los recursos de los modelos en la infraestructura tecnológica de una organización.

Comunidad y Recursos de Aprendizaje

Por su importancia en el mercado, Amazon SageMaker ya cuenta con una comunidad establecida que comparte conocimientos y experiencias, además del acceso a recursos en línea a través de foros y redes sociales, entre otros.

Recursos Disponibles

  • Redes sociales de SageMaker: Las cuentas oficiales en plataformas como Twitter (X) y LinkedIn permiten mantenerse informado sobre las últimas noticias, anuncios y consejos útiles.
  • Comunidades de desarrolladores: Donde es posible participar en eventos y comunidades en línea relacionadas con AWS y SageMaker para intercambiar ideas y aprender de otros.
  • Blogs de AWS: Con blogs de AWS Machine Learning y el blog general de AWS, donde encontrarás artículos, tutoriales y casos de uso relevantes sobre SageMaker.
  • Foros de AWS: Se trata de un recurso para plantear preguntas, compartir conocimientos y conectar con otros usuarios de SageMaker. En los foros dedicados es posible discutir temas como entrenamiento de modelos, implementación, depuración, entre otros.
  • Documentación oficial de SageMaker en Amazon.

Iniciativas de Aprendizaje

La documentación oficial de SageMaker es una referencia completa que incluye guías de usuario, tutoriales, ejemplos de código y referencias de API, proporcionando a los usuarios todo lo necesario para aprovechar al máximo la plataforma.

AWS ofrece una colección de cuadernos llamados SageMaker Examples, que muestran cómo realizar diversas tareas de machine learning, desde el procesamiento de datos hasta la implementación de modelos. Estos recursos son ideales para aprender a través de ejemplos prácticos.

Para aquellos interesados en una experiencia más estructurada, AWS organiza talleres en línea y presenciales bajo el nombre de SageMaker Workshop, donde los participantes aprenden los conceptos básicos y las características avanzadas de la plataforma mediante ejercicios prácticos y casos de uso del mundo real.

Asimismo, la AWS Machine Learning University (MLU) proporciona cursos gratuitos que abarcan desde los fundamentos del aprendizaje automático hasta técnicas avanzadas, con módulos específicos enfocados en SageMaker.

Además, AWS facilita el acceso a herramientas como SageMaker Studio Lab, una versión gratuita de SageMaker Studio diseñada para principiantes y estudiantes que necesitan recursos de computación y almacenamiento para sus experimentos de ML.

Finalmente, el AWS Partner Network (APN) conecta a los usuarios con socios especializados que ofrecen servicios de consultoría, capacitación y soporte, ayudando a sacar el máximo provecho de SageMaker en entornos empresariales.

Precios y planes de Amazon SageMaker

Amazon SageMaker ofrece a sus clientes diversas maneras de pagar sus servicios, adaptándose a las necesidades y presupuestos de cada organización, incluyendo modelos gratuitos y bajo demanda. También incluye combos con descuentos según el tipo de plan y el tiempo de permanencia de cada cliente en la plataforma.

Modelos de Precios

Pagar solo lo que usa: Si no desea comprometerse a un plan, esta es la mejor opción. Se le cobrará por segundo por las instancias de computación, el almacenamiento y otros recursos que utilice.

Ahorrar con planes: Si prevé un uso intensivo de SageMaker, puede ahorrar hasta un 64% con los “Savings Plans”. Con estos planes, usted se compromete a usar una cantidad fija de recursos durante uno o tres años y a cambio, obtiene un descuento sobre la tarifa estándar.

Empezar gratis: Si es nuevo en SageMaker, puede probarlo gratis. Dispone de horas gratis para usar instancias de computación en Studio, entrenar modelos y hacer predicciones en tiempo real durante sus primeros dos meses.

SageMaker Studio: Usar la interfaz de Studio no tiene costo adicional, pero se le cobrará por los recursos que utilice dentro de él, como las instancias de computación, el almacenamiento y los trabajos que ejecute.

SageMaker Canvas: Si utiliza Canvas, la herramienta para crear modelos sin código, se le cobrará por el tiempo que use la aplicación, el procesamiento de datos, el entrenamiento de modelos, las predicciones y el uso de modelos preentrenados.

Para saber cuánto le costará usar SageMaker, puede utilizar la Calculadora de Precios de AWS. Así podrá estimar los costos según sus necesidades.

Consejos para Nuevos Usuarios

Al igual que ocurre con cualquier tecnología, lo ideal es comenzar por las bases y comprender los servicios básicos de AWS, como S3 (para almacenamiento), IAM y EC2 (para recursos informáticos), y cómo estos operan con SageMaker.

De igual forma, es posible aprender sin pagar, aprovechando el modelo gratuito de SageMaker, desde el cual será posible empezar poco a poco y escalar gradualmente. Otros consejos son utilizar los modelos ya preconstruidos, que demuestran cómo realizar tareas de preprocesamiento de datos, entrenamiento de modelos e implementación.

SageMaker Studio Lab ofrece recursos de computación y almacenamiento gratuitos en un entorno simplificado que facilita el aprendizaje. Por último, un consejo importante es controlar los costos de los proyectos utilizando la calculadora de precios antes de embarcarse en grandes planes.

Artículos relacionados

Artículo 1 de 5