Al comprender el valor total de los datos en su nivel más bajo, puede posicionar a su empresa para explotar más plenamente los datos más adelante.

    Video: El experto en datos de Cern sobre cómo sacar el máximo provecho de los grandes datos de su empresaManuel Martín Márquez, científico principal de datos de Cern, sobre cómo el laboratorio de investigación está utilizando el aprendizaje automático para extraer valor de las enormes cantidades de datos que genera.

    Por lo general, la exploración de datos a gran escala comienza con un alto nivel de abstracción de datos, y luego se hunde gradualmente en las profundidades de los datos a medida que las empresas aprenden más de ellos.

    El enfoque ha funcionado bien y es operativo en muchos tipos diferentes de aplicaciones.

    VER: Informe especial: Convirtiendo grandes datos en información empresarial (PDF gratuito) (ConsejoTecnologico.com)

    Por ejemplo, el SIG y los sistemas de mapeo utilizan datos para visualizar un mapa de gran tamaño y luego enfocarse en un punto o ubicación específicos. A medida que el analista de datos profundiza en esta ubicación, puede ver otros datos relacionados que podrían adjuntarse a la ubicación, como los datos demográficos de las personas que viven en esa ubicación o el número de accidentes de tránsito en esa ubicación.

    Sin embargo, también hay otro enfoque básico que tiene la capacidad de desbloquear los valores ocultos de los grandes datos. En realidad, este enfoque comienza en el nivel más bajo de los datos y luego se abre camino hacia estructuras de datos más sofisticadas para proporcionar información que sea útil para la administración y el personal.

    Más información sobre Big Data

    Aquí hay un ejemplo:

    «Una pantalla de un solo píxel puede revelar el color visible de un punto, pero también el valor infrarrojo, que puede utilizarse para medir la salud vegetativa», dijo Layton Hobbs, director de investigación y desarrollo y vicepresidente de Woolpert, una empresa de arquitectura, ingeniería y soluciones geoespaciales.

    Hobbs habla del potencial de las empresas agrícolas y forestales para ir más allá de los datos geoespaciales básicos que recopilan y desbloquear tesoros ocultos que están enterrados en datos geoespaciales, como datos sobre topografía, suelo, cubierta vegetal, salud de las plantas y copas de los árboles.

    «La mayoría de los datos geoespaciales se crean por una razón o necesidad específica, pero hay mucha más información en los datos geoespaciales que está subutilizada o no reconocida», agregó Joe Cantz, asociado de Woolpert y líder de la disciplina geoespacial. «Particularmente con las nuevas tecnologías, la información rica en datos está creciendo exponencialmente, pero estamos usando sólo un pequeño porcentaje en este punto.»

    Según los funcionarios de Woolpert, los píxeles de datos geoespaciales son capaces de almacenar un rango mucho más amplio de valores que los 256 valores tradicionales de una imagen de 8 bits. «Estos sistemas modernos a menudo almacenan cuatro bandas de datos (rojo, verde, azul e infrarrojo) de hasta 12 bits o alrededor de 4.000 valores para cada banda», dijo Hobbs. «La combinación de estas cuatro bandas para la interpretación de imágenes crea 256 billones de combinaciones posibles en una ubicación espacial! Esto es definitivamente exagerado para la mayoría de las aplicaciones, pero muestra el potencial de las aplicaciones de imágenes de grandes datos».

    VER: Guía del líder de TI para la seguridad de los grandes datos (Tech Pro Research)

    ¿Por qué es importante para los grandes proyectos de datos de la empresa?

    Los datos de IO, como los datos capturados y emitidos por los sensores, vienen inmediatamente a la mente.

    Con la IO, usted puede comenzar con sus propias iniciativas y análisis de grandes datos de arriba hacia abajo cuando se trata de utilizar datos e imágenes que se envían desde los sensores a bordo de los aviones no tripulados, pero ¿qué pasaría si mirara cada píxel individual de datos que el avión no tripulado está enviando de vuelta y descubriera que hay un valor de datos adicionales capturados que podrían responder a preguntas que no le interesan hoy en día, pero que podrían serlo en el futuro?

    He aquí cómo puede optimizar los datos para su uso actual y futuro:

    Analice lo que es posible extraer de una unidad de datos dada (por ejemplo, un píxel), aunque no le importe toda esta información hoy en día.

    Esto se puede hacer fácilmente. Haciendo referencia al ejemplo de Layton Hobbs, tal vez no le importe la salud del suelo del bosque hoy en día, pero si algún día quiere restaurar este bosque después de una cosecha, comprender algo sobre la salud del bosque le ayudará. En ese momento, conocer todo lo que puede obtener de sus grandes datos bajo gestión se convierte en algo significativo.

    Catalogar la captura de información que es posible en la unidad más baja de datos grandes.

    Si se trata de un píxel y se sabe que la salud y la topografía del bosque es posible analizar a partir de estos datos y se hace un registro de los mismos, es mucho más fácil recordar el potencial de información de los datos y activarlo cuando y donde sea necesario.

    No te pierdas en los detalles

    Si bien es importante catalogar el potencial de información de sus grandes datos en el nivel más bajo de datos, es igualmente importante no perderse en los detalles. Si su trabajo hoy en día es simplemente trazar un mapa de un bosque e identificar los rodales de madera que se puede cosechar, siga con eso. No se desvíe con otros tipos de exploraciones de datos que no son relevantes para la tarea en cuestión.

    Anticipar las lecciones aprendidas

    Cuando dirigía un departamento de marketing para un banco, utilizamos datos demográficos para una de nuestras campañas de comprobación, identificando a personas en determinados lugares por grupos de edad y vinculando a continuación los productos de comprobación a las distintas fases del ciclo de vida en las que se encontraban los clientes. Más tarde, quisimos mejorar los resultados, y añadimos ocupación y edad para orientar nuestros productos de control.

    Este es un escenario común para las empresas. Quieren volver a los datos para ver si pueden añadir más información para mejorar los resultados.

    Al evaluar y catalogar el rendimiento potencial de información de grandes datos en el nivel más bajo de los datos, los analistas de datos pueden estar preparados para abrir los datos a análisis más exhaustivos que puedan desbloquear las respuestas a las preguntas que la empresa querrá formular a continuación.

    Boletín informativo de Big Data Insights

    Domine los fundamentos de la analítica de datos de gran tamaño siguiendo estos consejos de expertos y leyendo los conocimientos sobre las innovaciones de la ciencia de datos. Lunes de entrega

    mismo

    Ver también: