Ir al contenido principal

#DatosParaTodos

Los datos producen conocimiento útil para las empresas

DatosParaTodos - papel del big data - 09072015Aprovechar los datos permite a las empresas conseguir sus objetivos de negocio y estar un paso delante de su competencia. Pero la cada vez mayor cantidad de datos existentes obliga a las empresas a saber en realidad cómo encontrar y aprovechar los datos que son relevantes para el negocio, aquellos que permitan tomar decisiones más rápidas y mejor informadas, aquellos que generan información de valor.

Un proceso para determinar qué datos son útiles es la minería de datos, cuya finalidad es buscar lo que puede ser útil para la empresa y desechar aquello que no lo es. Pero en la actualidad ese concepto podría cambiar. Mick McWilliams, SVP De Metodología de Investigación en LRW, sugiere que ese nombre podría ser erróneo. “La minería de datos debería llamarse minería de conocimiento”.

Para esto, es necesario conocer que existen dos tipos de datos: los estructurados y los no estructurados. Los datos estructurados son aquellos que tienen un modelo definido o residen dentro de un campo fijo que se encuentra en un registro, como las bases de datos de clientes de una empresa dedicada al comercio minorista o los precios de acciones en la bolsa. Por otro lado, los datos no estructurados son aquellos que no tienen un modelo predefinido o no están organizados de una manera definida, ejemplos de estos datos son las publicaciones en redes sociales o documentos de texto.

DatosParaTodos - tipos de data - 09072015

La analogía de la minería de datos es más con relación a una minería de tierra”. McWilliams también comenta que, “La mayoría de lo que compone a Big Data es mucho ruido (Big Noise). Y esta declaración no está muy alejada de la realidad pues se estima que la humanidad crea 2.4 trillones de bytes de datos al día.

Como ejemplo de la cantidad de datos que se generan y analizan, está el caso del Instituto de Bioinformáticas de Virginia y el Departamento de Ciencias de la Computación de Virginia Tech, que necesitaban analizar 15 petabytes de datos de genoma cada día, el equivalente a tener que analizar 60 discos duros de 200GB de capacidad cada uno, un reto nada sencillo que solucionaron a través de la implementación de recursos de cómputo y almacenamiento como Microsoft Azure HDInsight, que les permitieron aprovechar los recursos en la nube para analizar los datos de una manera más rápida.

Para obtener conocimiento a partir de la información que generan los datos, se utilizan dos tipos de métodos de aprendizaje: el aprendizaje no supervisado y el aprendizaje supervisado. El primero es una técnica que se utiliza para encontrar patrones en datos sin etiquetar.

El aprendizaje supervisado es, por otro lado, una técnica que requiere una medida de respuesta definida y es la técnica primaria utilizada en analítica predictiva.

Componentes de una serie de tiempo

La analítica predictiva se basa, aparte de los datos, en series de tiempo que están hechas de uno o más componentes como tendencias, ciclos, temporalidad y residuales. Cada uno de estos elementos permite tomar decisiones a corto, mediano y largo plazo. Las tendencias son patrones a largo plazo; los ciclos reflejan los movimientos a la alza y a la baja dentro de una tendencia; la temporalidad es la fluctuación recurrente durante un año; y los residuales son los componentes impredecibles e inexplicables.

Los elementos antes mencionados permiten que se lleve a cabo el proceso de predicción, que muchas empresas utilizan para conseguir sus objetivos de negocios y aprovechar mejor los datos y la información de valor que se genera a partir de ellos. La importancia de este proceso predictivo radica en su oportunidad, profundidad y exactitud y con herramientas de predicción como Power BI en Excel, los usuarios pueden predecir tendencias futuras basándose en los patrones de datos existentes de manera sencilla y de fácil entendimiento.

Modelos matemáticos

Existen dos tipos de modelos matemáticos utilizados para el análisis predictivo de datos. El modelo determinístico es aquel donde la relación completa de las entradas y los resultados son determinados de manera concluyente. Las mismas entradas obtienen los mismos resultados cada vez, como ejemplo, el cálculo del área dentro de un círculo a través de fórmulas matemáticas.

DatosParaTodos - modelos matematicos - 09072015

El otro modelo es el estocástico (o fortuito) donde las entradas son variables aleatorias y el resultado es una distribución de probabilidad estimada de resultados potenciales. En finanzas por ejemplo, se utiliza el método Monte Carlo para simular el modelo estocástico, que determina la probabilidad de un resultado basado en el número de ocurrencias dentro de una serie de eventos simulados. Un ejemplo de esto sería lanzar dardos a un círculo para estimar el porcentaje de la figura que ocupa el área dentro de un círculo.

Un ejemplo de la utilización de la analítica predictiva en finanzas es el de Great Western Bank, que gracias a la implementación de una plataforma de analítica de negocios de Microsoft obtuvo información de valor referente a las relaciones con sus clientes puede ver lo que sus competidores no ven, además de ofrecer un mejor servicio a sus clientes y conocer sus necesidades para tomar mejores decisiones.

DatosParaTodos - 39 - 09072015

Por esta razón, los CMO o Gerentes de Mercadotecnia necesitan tomar decisiones basadas en el conocimiento, no en los datos. Se trata de una evolución de Big Data como lo conocíamos, que va de los datos, a la información que generan, al conocimiento que esa información genera. Los grandes analistas pueden colar la tierra, filtrar el oro falso y encontrar las verdaderas vetas doradas del conocimiento que les permitan tomar mejores decisiones.

Un ejemplo de lo antes mencionado se presenta en Condé Nast, donde los equipos de mercadotecnia y editorial reciben información de valor para el negocio como comportamiento del consumidor, participación de mercado, competidores y tráfico web a través de navegadores en PC, tabletas y dispositivos móviles que les permite adaptar el contenido para audiencias y dispositivos específicos.

DatosParaTodos - 49 - 09072015

¿Cómo utilizan Big Data los ejecutivos de alto nivel? De acuerdo con información de Microsoft Marketing, 49 por ciento de los altos ejecutivos utilizan Big Data para información de valor sobre los clientes, segmentación o selección de grupos meta; y 39 por ciento lo utilizan en la actualidad para presupuestos, predicciones o planeación.

La variedad de usos que le dan las empresas a los datos y los beneficios que estos generan dependen de la capacidad de los negocios para almacenarlos, analizarlos e interpretarlos, no importa si son estructurados o no. Contar con una plataforma flexible, que se adapte a las necesidades del negocio y que permita obtener dividendo de esos datos es lo que permitirá a las empresas obtener la información de valor y el conocimiento necesarios para mirar adelante, anticiparse a los retos futuros y satisfacer a sus clientes de la mejor manera posible.

Sigan la conversación en #DatosParaTodos.