Michael Cavaretta quiere los datos, todos los datos y nada más que los datos. Esto es lo que hace en uno de los mejores trabajos de TI de hoy en día.
No puedes darle a Michael Cavaretta demasiados datos.
Ha sido científico de datos en Ford Motor Company durante casi 16 años, y especialmente durante los últimos ocho años desde que comenzó el mandato del CEO Alan Mulally, los datos – y muchos de ellos – son el mantra de Cavaretta.
Cavaretta ve que su papel se derrumba de varias maneras. Primero, es un científico de datos. También es el gerente de su grupo de científicos de datos.
«Realmente se reduce a obtener valor de las fuentes de datos dentro de la empresa o fuera de ella. Creo que lo más importante es el uso de una amplia variedad de herramientas y tecnologías diferentes, así que cosas como la informática, las estadísticas, el aprendizaje automático», dijo.
La otra parte de lo que hace Cavaretta tiene que ver con la comunicación de lo que los datos significan para otras personas de la empresa. Lo ve como una narración, ya sea a través de gráficos informativos o cualquier visualización que «lo explique de una manera que les permita entender por qué está respondiendo a su pregunta de una manera particular», dijo.
Eso se relaciona con la última parte del trabajo de Cavaretta: el conocimiento del dominio. Cavaretta ayuda a cerrar la brecha entre el lado de los datos y el lado de los negocios. Tener una comprensión de dónde vienen otras personas y cuáles son sus necesidades hace que los datos sean mejor utilizados.
«Si la gente está hablando de cosas que vienen de la perspectiva de las finanzas, hay que ser capaz de hablar el lenguaje de las finanzas», dijo.
En el mundo de las TI, la comprensión de los negocios es una habilidad cada vez más importante. El punto de encuentro de estos dos campos es también algo en lo que Ford puso un gran énfasis cuando su recientemente retirado CEO Alan Mulally se unió a la compañía en 2006.
Su moto: Los datos te liberarán.
Cavaretta obtuvo su doctorado en informática, con una concentración en inteligencia artificial. Interesado en los problemas de optimización, hizo un subconjunto en lo que se llama algoritmos evolutivos, que es una forma de establecer una población artificial para resolver problemas de recursos.
A partir de ahí, comenzó a trabajar en una empresa de consultoría llamada Churchill Systems que se concentró en técnicas para la previsión de la demanda promocional con minoristas de alto volumen como Sears y Kmart.
Cuando Cavaretta se unió al laboratorio de investigación e innovación de Ford en 1998, la compañía estaba formando un equipo de minería de datos. Desde entonces, el equipo y las técnicas han cambiado. En la actualidad, el departamento de Cavaretta, que es uno de varios, cuenta con unas 35 personas.
Después de que Mulally subiera a bordo en 2006, Cavaretta dijo que no se necesitaban demasiadas reuniones en las que se les preguntara a los ejecutivos «dónde están tus datos» para que empezaran a acudir a él y a su equipo en busca de ayuda para apoyar sus decisiones, etc. «Eso realmente cambió las cosas cuando[Mulally] introdujo esta cultura analítica y centrada en los datos en Ford», dijo.
Para poner los datos en términos más concretos, está la historia del intermitente de tres parpadeos. Cuando Ford traía el Fiesta de Europa, se discutió si incluir una señal de giro que parpadeara tres veces y luego se apagara automáticamente.
«Queríamos saber si la gente está contenta con esto, pero los estudios que realizamos fueron un poco confusos, realmente no dieron una indicación clara», dijo Cavaretta. Anecdóticamente, Ford estaba escuchando cosas buenas, pero los números coincidieron. Cavaretta y su equipo empezaron a desmontar cómo la gente en Internet hablaba de la película. Resultó que la negatividad provenía de la implementación o colocación de la señal, no de la señal en sí.
«Pudimos separar esas dos piezas», dijo Cavaretta.
A lo largo de los años, uno de los mejores cambios que Cavaretta ha visto es la idea de que es aceptable almacenar grandes cantidades de datos. No puedes darle demasiados datos, después de todo. Al hablar con personas como los clientes internos de Ford, siempre se esfuerza por obtener el máximo alcance de los datos sobre promedios y agregaciones.
«Vayamos a la materia prima», dijo Cavaretta,»Siempre me sorprende cuando la gente se entera de repente. Les diré:’Están tomando este promedio, si tuviéramos los datos brutos, podríamos hacer muchas cosas diferentes».
Con capacidades de almacenamiento de terabytes sobre terabytes, Cavaretta es capaz de hacer las cosas como él prefiere. «Ese es realmente un gran cambio en el juego», dijo.
En sus propias palabras:
¿Cómo se desenchufa?
Entrenamiento. Ejercitarme es definitivamente lo que más me preocupa. Tengo una familia, me gusta pasar tiempo con mis hijos. Estamos completamente metidos en Clash of Clans ahora, lo que es un poco triste. Pero en realidad, lo más importante para mí para poner mi mente en un lugar diferente es que me gusta salir de una carrera, o salir a caminar, o ir al gimnasio.
¿Hay algún trabajo que te gustaría hacer si no fueras un científico de datos?
Diablos, sí. Se remonta a algo que debería haber mencionado antes, que es que soy un total aficionado a la comida. De origen italiano, mi padre era gerente de un restaurante. Hacemos nuestra propia pasta para las fiestas de cumpleaños. Si yo fuera a ser algo completamente diferente de esto, entonces me encantaría ser chef.
¿Tiene algún tipo de placeres culpables en los medios sociales?
En realidad tuve que borrar la aplicación Reddit de mi teléfono porque estaba pasando demasiado tiempo. Tengo una cuenta en Reddit donde sólo recibo las cosas relacionadas con estadística e informática, y cosas por el estilo, y aunque he aprendido algunas cosas realmente buenas, de vez en cuando salto a»todo» y compruebo las cosas puestas bajo el subreddit de»funny». Big Data Borat a veces tiene cosas realmente buenas. Soy fan de Brain Pickings.