Amazon Web Services explica por qué creó un servicio de aprendizaje automático para ayudar a las empresas a extraer sus datos para obtener predicciones útiles sin necesidad de contar con un equipo de doctores en estadística.
Las empresas buscan cada vez más formas de mejorar sus resultados mediante la extracción de los datos que recopilan.
Pero es difícil para las empresas extraer información significativa cuando los científicos carecen de datos.
En respuesta a este déficit de habilidades, los principales proveedores de cloud computing han creado servicios bajo demanda para dar a las empresas la oportunidad de comenzar con el aprendizaje automático.
El aprendizaje automático es una técnica que permite a las computadoras buscar patrones en los datos y que impulsa los motores de recomendación en línea que sugieren libros o películas que usted podría disfrutar. Las empresas pueden utilizar modelos de aprendizaje automático para hacer predicciones útiles: por ejemplo,»¿Es esto spam de correo electrónico?
Amazon, Microsoft y Google proporcionan servicios de aprendizaje de máquinas bajo demanda a través de sus respectivas plataformas en nube, cada una con diferentes niveles de accesibilidad para los desarrolladores sin experiencia en estadística.
Amazon ha estado utilizando el aprendizaje automático desde sus inicios como vendedor de libros en línea, cuando necesitaba una forma de ayudar a sus editores humanos a elegir recomendaciones de su biblioteca de un millón de ejemplares.
«Desde muy temprano decidimos, como organización, que el aprendizaje automático iba a ser importante a medida que nuestro negocio crecía», dijo Matt Wood, director general de ciencias de la información de Amazon Web Services (AWS.
«Teníamos que tomar una decisión. ¿Queremos irnos y contratar a un montón de expertos y especialistas en aprendizaje de máquinas cuando esos chicos y chicas son muy raros? Es una mezcla muy enrarecida de habilidades de estadística, de validación cruzada, de diseño de algoritmos.»
En su lugar, Amazon decidió contratar a un grupo relativamente pequeño de expertos en aprendizaje de máquinas para construir un servicio interno que todos sus desarrolladores pudieran utilizar.
«Vimos este estilo de innovación porque los desarrolladores no tuvieron que invertir mucho tiempo en el aprendizaje de la máquina para poder utilizar sus beneficios», dijo, citando el papel del servicio en áreas como el cumplimiento, la planificación de la capacidad, la gestión de la cadena de suministro y la identificación de productos falsificados.
El servicio público de aprendizaje de máquinas que ofrece hoy en día AWS se basa en los mismos algoritmos que la empresa pone a disposición de su personal internamente. Los clientes pueden construir modelos de aprendizaje de máquinas utilizando datos almacenados en el Servicio de Datos Relacionales de Amazon con un backend MySQL, el almacén de objetos S3 o el servicio de almacenamiento de datos Redshift para entrenarlos.
Estos modelos se pueden utilizar para hacer varios tipos de predicciones. La clasificación binaria se utiliza para predecir uno de dos posibles resultados:»¿Es esto spam o no? Clasificación multiclase para pronosticar uno de los tres o más resultados posibles y la probabilidad de cada uno -‘¿Este producto es un libro, una película o una prenda de vestir? La regresión se utiliza para predecir un número -‘¿Cuál es la temperatura probable que sea mañana?
El servicio también intentará validar automáticamente los datos y, cuando sea posible, transformarlos en un formulario más útil, por ejemplo, extrayendo el código postal de una dirección.
Una vez construido el modelo, los desarrolladores pueden acceder a él a través de la consola AWS o de las llamadas a la API, lo que permite que las predicciones se envíen a una aplicación o servicio en línea. Los modelos se pueden ajustar con precisión utilizando los controles deslizantes de la consola.
«El desarrollador necesita saber muy, muy poco sobre el aprendizaje automático. Las chuletas de aprendizaje de la máquina son administradas por el servicio», dijo Wood.
Los servicios basados en la nube como este reducen la dificultad de experimentar con el aprendizaje automático, reduciendo el tiempo y el dinero necesarios para aprender las habilidades necesarias para empezar, dijo.
Amazon probó lo fácil que resultaba el servicio para que los desarrolladores se iniciaran en el aprendizaje automático, encargando a dos desarrolladores sin experiencia en el aprendizaje automático que construyeran un modelo para predecir el género de una persona desde su nombre de pila.
Los desarrolladores tardaron un mes en construir su modelo, el cual fue entrenado usando datos del censo y predijo el género con una precisión del 92 por ciento. En contraste, un desarrollador sin conocimientos de aprendizaje de máquina tardó 20 minutos en construir el mismo modelo con la misma precisión de predicción utilizando el servicio de Amazon.
Esto no quiere decir que estos servicios en la nube se adapten a las necesidades de aprendizaje de las máquinas de todo el mundo.
Por un lado, aunque pueden reducir el costo de comenzar, su uso puede ser costoso a largo plazo. El servicio de Amazon puede costar en la región unos 100 euros por cada millón de predicciones.
Como dijo un empresario: «Esto sería muy agradable de usar en mi inicio, pero es un costo prohibitivo incluso con un presupuesto muy grande.»
El servicio también ha sido criticado por bloquear a los usuarios, ya que el servicio no permite a los usuarios exportar e importar modelos.
«No veo cómo una compañía con un poco de sentido común podría bloquear su modelo de predicción en AWS», como dijo un usuario en el foro de desarrolladores de Hacker News.
A pesar de estas críticas al servicio todavía incipiente, Wood cree que conducirá a una mayor experimentación con el aprendizaje automático en empresas que antes no sabían por dónde empezar.
«La clave para mí es la productividad y asegurarse de que los desarrolladores tengan acceso a estas cosas.»