Las organizaciones están entusiasmadas con la contratación de científicos de datos, pero deben recordar que los proyectos basados en datos no resolverán todos los problemas.
Las cinco preguntas principales a las que un científico de datos debe poder responderTom Merritt hace las cinco preguntas a las que todo científico de datos debe tener respuesta.
Las organizaciones de todas las industrias están recopilando más datos que nunca, y buscan a los científicos y analistas de datos para obtener información que les ayude a mejorar el negocio. Sin embargo, con todo el alboroto en torno a los grandes datos, es fácil que las expectativas de los proyectos de ciencia de datos se salgan de control.
«Las empresas están muy entusiasmadas con la posibilidad de que los datos resuelvan todos los problemas que tienen», Andrea Danyluk, profesora de ciencias de la computación en Williams College y copresidenta del grupo de trabajo de la Association for Computing Machinery sobre ciencias de la información. «Es muy posible que los datos y la ciencia de datos resuelvan muchos de sus problemas y hagan avanzar su negocio. Pero con cada proyecto que hagas, deberías sentarte y pensar muy bien sobre los datos específicos que estás recopilando y las posibles implicaciones sobre lo que eso va a significar».
VER: Descripción del puesto: Científico de datos (Tech Pro Research)
Más información sobre Big Data
Por ejemplo, esto significa considerar los sesgos potenciales dentro de los datos mismos, y cómo esos sesgos podrían afectar el avance de su negocio, dijo Danyluk.
En última instancia, «la ciencia de los datos no es una bala de plata», dijo Dave McCarthy, vicepresidente del proveedor de Internet de Cosas (IO) Bsquare. «En vez de eso, es el análisis matemático altamente avanzado y continuo de conjuntos de datos extremadamente grandes en busca de percepciones únicas y procesables.»
Aquí hay ocho consejos sobre cómo su organización puede evitar establecer expectativas poco realistas en los proyectos de ciencias de datos.
1. Empieza de a poco
Comience con un proyecto pequeño y de bajo riesgo, dijo Meta S. Brown, consultora de análisis de negocios y autora de Data Mining for Dummies. Esto significa algo que no te preocupa mucho en este momento, pero que tiene muchas posibilidades de éxito.
«Uno de los lugares más comunes para hacer eso que la mayoría de las organizaciones no están haciendo es probar algo en su correo electrónico», dijo Brown. Por ejemplo, la mayoría de los proveedores de boletines informativos por correo electrónico ofrecen la posibilidad de probar versiones alternativas de un correo electrónico. Podrías empezar a probar tus líneas de asunto y ver cuáles producen más aperturas y clics.
«Es el menor riesgo posible, no tiene nada que perder y no tiene que gastar dinero, porque su proveedor ya proporciona las capacidades técnicas», dijo Brown. «Y puede que descubras que, oye, esta línea de asunto funciona mejor que esa línea de asunto. Es un buen ejemplo de algo que podría estar ahí para que lo hagas, y donde podrías empezar a mostrar valor».
VER: Política de grandes datos (Tech Pro Research)
2. Crear un plan y un proceso de análisis
Las organizaciones necesitan un proceso analítico, dijo Brown. «Cuando la gente se queja de que los analistas no están resolviendo los problemas correctos o dándoles la información correcta, eso es un reflejo de un problema de proceso», añadió.
El proceso puede comenzar por llegar a un acuerdo sobre lo que en la organización es un problema, y elegir un pequeño problema que todos puedan definir y en el que todos puedan estar de acuerdo en trabajar, dijo Brown. A continuación, debe evaluar si dispone de los datos para resolverlo.
3. Ignorar las tendencias
Evite comenzar con un proyecto llamativo, dijo Brown. «No te preocupes por lo que es genial. Preocúpese por lo que es rentable para usted», agregó. «El factor cool puede ser un gran problema».
4. No te obsesiones con las herramientas
Cuando se trata de un proyecto basado en datos, «las herramientas son lo último en lo que hay que pensar», dijo Brown. Sin embargo, las compañías necesitan determinar qué productos en particular son importantes y gastar el dinero cuando lo necesitan, en lugar de gastar mucho esperando o buscando otra solución, agregó.
5. Comprender los límites computacionales
Aunque el análisis de datos puede mejorar muchos procesos, «hay cosas matemáticamente probables que no se pueden hacer incondicionalmente», dijo Danyluk. «Es maravilloso pensar que un solo campo podría hacer todo lo posible para resolver los problemas del mundo con datos. Pero hay cosas que no se pueden hacer hasta el final, a menos que tengamos un marco completamente diferente de cómo pensamos acerca de la computación, simplemente no va a suceder».
6. Recuerde que no todos los datos son utilizables
Las organizaciones deben recordar que recolectar muchos datos no significa que los datos sean limpios o utilizables, dijo McCarthy.
«Aunque las organizaciones pueden tener grandes volúmenes de datos, no siempre se recopilan los datos correctos, están estructurados correctamente o son lo suficientemente ricos como para poder obtener la información que buscan», agregó. «A menudo los datos necesitan ser refinados, limpiados, reestructurados e incluso combinados con otras fuentes de datos antes de que realmente puedan añadir valor. No entender esto es la razón principal por la que a menudo no se cumplen las expectativas».
7. No esperes encontrar un unicornio de la ciencia de datos
Al contratar a un científico de datos, muchas compañías buscan a un candidato mágico que tenga todas las calificaciones posibles, pero que tenga problemas para encontrarlos, dijo Brown. Y cuando contratan a alguien, las expectativas de lo que ese profesional puede hacer son a menudo demasiado altas, agregó.
«Francamente, mucha gente contrata a un científico de datos y no obtiene lo que quiere de ellos», dijo Brown. «Comience con algo modesto, y establezca un buen proceso como su modo de operaciones desde el principio.»
8. Permitir una curva de aprendizaje
Las compañías deben hacer que los proyectos basados en datos sean «proyectos especiales» que reciban apoyo y recursos, pero que se consideren desde el principio fuera de las operaciones cotidianas, dijo Kristen Sosulski, profesora clínica asociada de información, operaciones y ciencias de la gestión en la Escuela de Negocios Leonard N. Stern de la Universidad de Nueva York, y autora de Data Visualization Made Simple (Visualización de datos simplificada.
«Hay un proceso de aprendizaje para que la organización aprenda sobre los datos», dijo Sosulski. «Ten cuidado de no actuar demasiado rápido sin entenderlo.»
Boletín informativo de Big Data Insights
Domine los fundamentos de la analítica de datos de gran tamaño siguiendo estos consejos de expertos y leyendo los conocimientos sobre las innovaciones de la ciencia de datos. Lunes de entrega