Talend CMO Ashley Stirrup habla con ConsejoTecnologico.com sobre cómo decidir sobre un gran software de integración de datos.
En un futuro previsible, los datos más importantes despertarán el interés de la empresa.
Sin embargo, a medida que pase el tiempo, los grandes datos pasarán de ser una palabra de moda a una búsqueda más seria. Y un paso para aumentar el papel y el impacto de los datos dentro de la empresa es decidirse por un gran software de integración de datos.
ConsejoTecnologico.com habló por correo electrónico con Ashley Stirrup, CMO del proveedor de software de integración de datos de código abierto Talend.
Stirrup habló sobre lo que se necesita para convertirse en una empresa basada en datos, y destacó muchas de las preguntas que las empresas deben hacer cuando seleccionan la herramienta de datos más adecuada para el trabajo.
ConsejoTecnologico.com: Según su experiencia, ¿cuáles son las características de las organizaciones basadas en datos?
Ashley Stirrup: En pocas palabras, las empresas basadas en datos son capaces de aprovechar el poder de sus datos y aprovecharlo como un activo corporativo clave y diferenciador competitivo. En lugar de que los datos sean el dominio de la TI o de un equipo empresarial singular, los datos son una disciplina que abarca a toda la empresa y se utilizan para tomar decisiones informadas en toda la organización. El camino hacia el control de los datos requiere un conjunto de pasos comunes. Comienza con un caso de negocio sólido y una clara comprensión de cómo y por qué serán útiles los datos de gran tamaño. Las compañías que encuentran el éxito están inevitablemente usando grandes datos para responder preguntas muy importantes acerca de sus negocios, clientes u operaciones. También es consistente entre las empresas basadas en datos tener un proceso de gestión de proyectos muy bien definido que incluye todo, desde asegurar una amplia participación hasta identificar exactamente los conjuntos de datos que se utilizarán en cualquier proyecto dado.
ConsejoTecnologico.com: ¿Cuáles son las principales tendencias en sus soluciones competitivas de integración de datos espaciales?
Ashley Stirrup: En primer lugar, el auge de Apache Spark es una tendencia importante. Estamos viendo un interés generalizado en Spark como resultado de su capacidad para permitir una integración de datos más rápida y análisis de grandes datos en tiempo real. Las empresas se dan cuenta rápidamente del potencial de Spark y del alto valor de convertir rápidamente el conocimiento en acción. Nuestras recientes pruebas comparativas con Informatica refuerzan las ventajas de Spark, con Talend Big Data completando proyectos hasta 10 veces más rápido que Informatica Big Data Edition.
Además, a medida que más empresas entran en producción con grandes datos, también estamos viendo de primera mano los beneficios de la generación de código y código abierto, ya que las empresas necesitan menos personal y menos trabajadores cualificados para abordar los proyectos. También está claro que las empresas ya no quieren tratar por separado los entornos tradicionales de almacenamiento de datos y los grandes proyectos de datos. Lo que buscan es una solución única que satisfaga todas las necesidades de gestión de datos, por no hablar de los datos a granel, por lotes y en tiempo real. Por último, es imposible ignorar el creciente impacto de la nube en la integración de datos. Claramente, la nube es una tendencia que continuará y se acelerará en 2019 con más compañías que buscan reconocer el valor y la facilidad de la integración basada en la nube.
ConsejoTecnologico.com: ¿Cuáles son las principales razones por las que las empresas eligen proveedores de código abierto para la integración de datos?
Ashley Stirrup: Aunque se trata de algo más amplio que la integración de datos, el paso al código abierto está impulsado en gran medida por el creciente número de empresas que desean abandonar las tecnologías propietarias y amuralladas. El crecimiento de los datos y la rápida evolución de las necesidades empresariales requieren la flexibilidad y agilidad que el software de código abierto puede proporcionar. En particular, esto es cierto en el caso de los grandes datos, en los que se publican nuevas innovaciones casi semanalmente. Por supuesto, los clientes también están motivados por la economía más atractiva o el menor coste total de propiedad asociado con el software libre.
ConsejoTecnologico.com: ¿Qué opina de que Hadoop se convierta en una herramienta empresarial de uso general?
Ashley Stirrup: Sin duda, Hadoop se convertirá en una herramienta empresarial de uso general. En esta época del año pasado, probablemente tuvimos más clientes en pruebas que en producción. Hoy en día, el panorama ha cambiado drásticamente con la mayoría de nuestros clientes entrando en un despliegue completo. Creo que estamos entrando claramente en la primera fase de la mayoría en este momento. La economía es simplemente demasiado buena y las amenazas competitivas demasiado obvias para que las empresas se mantengan al margen por más tiempo.
ConsejoTecnologico.com: ¿Cómo describiría el producto Talend Big Data a un cliente potencial?
Ashley Stirrup: Suelo describir lo que creo que son las preguntas clave que los negocios deben hacer antes de tomar una decisión sobre un gran software de integración de datos.
- ¿Es fácil de usar? Pida ver la interfaz de usuario. ¿Es simple o complejo? ¿La aplicación genera código automáticamente o te obliga a hacerlo a mano? ¿Se pueden realizar tareas mediante acciones de arrastrar y soltar? ¿Ofrece la plataforma un flujo de trabajo y una interfaz de usuario únicos y coherentes, o parece una mezcla de aplicaciones separadas?
- ¿Está unificada? ¿Permite la plataforma la integración de todo tipo de datos (cloud, on-premises, IoT, etc.) y puede realizar tanto el procesamiento por lotes como en tiempo real dentro de la misma solución?
- ¿Aprovecha al máximo el poder de Hadoop? Algunas herramientas requieren que procese y transforme datos antes de cargarlos en Hadoop. Este movimiento de datos no sólo ralentiza los proyectos, sino que también significa que no se está explotando plenamente la capacidad de procesamiento de Hadoop.
- ¿Está al día? ¿El software está basado en código abierto o es privativo? Se ha comprobado que las soluciones de código abierto se adaptan mejor al ritmo de las grandes innovaciones de datos y le permiten seguir siendo ágil y responder mejor a las necesidades de la empresa.
- ¿Es rápido? ¿Utiliza Spark y Spark streaming dentro de Hadoop para procesar datos? ¿O está atascado en los días de YARN?
- ¿Es rentable? ¿Cuál es el costo total de propiedad? ¿Es razonable y se basa en el número de desarrolladores o en los volúmenes de datos, conectores o CPUs?