Big Data es una palabra que aparece de forma continuada en los medios de comunicación. Es un concepto nuevo, que incluye áreas de conocimiento tan diferentes como tecnología de la información, ciencia de datos y estadística aplicada. Pero, en realidad ¿qué es el Big Data?, ¿en qué se diferencia de la ciencia de datos y del Data Mining?
Para entender esta terminología, hay que intentar contextualizarla. La constante evolución y transformación digital ha supuesto un cambio sustancial en todas las actividades de nuestro entorno, tanto en el ámbito profesional, como en el personal. Cada vez es más habitual escuchar hablar en nuestro día a día de la importancia y el valor que aportan los datos, así como de los términos de Big Data y ciencia de datos, muy en boca de todos últimamente. Ambos se asocian a grandes volúmenes de datos, pero no siempre queda clara la diferencia que hay entre estos dos términos que, aunque relacionados, en realidad no son sinónimos.
Desde hace muchos años, las empresas han utilizado los datos para tomar decisiones. No es algo nuevo. ¿Qué ha cambiado? Hace años, los sistemas informáticos para generar y almacenar los datos (ordenadores especializados llamados servidores) eran caros y se comunicaban mal entre ellos. Por esta razón, generar, almacenar, ordenar y posteriormente analizar los datos para la toma de decisiones solo estaba al alcance de las grandes empresas, con amplios recursos para realizar elevadas inversiones en sistemas de computación. En la actualidad, captar datos es fácil (web, redes sociales, sistemas propios de captación de información en el propio punto de venta asequibles) y su análisis está al alcance de la mayoría de pymes, gracias a un software y hardware baratos.
Este cambio tecnológico ha abierto las puertas de los datos a todo el mundo. No obstante, en los medios de comunicación se ha empezado a hablar de conceptos que tienen una base común: los datos, pero que son completamente distintos y que no son recomendables para todas las empresas: ciencia de datos, data mining, big data…
Por tanto, intentemos entender estos conceptos y su impacto en las farmacias.
Big Data, ¿qué es?
El concepto de Big Data hace referencia al almacenamiento, procesamiento y gestión de un conjunto de datos o combinaciones de conjuntos de datos, que pueden ser tanto estructurados (aquellos que tienen un formato y una disposición definida) como no estructurados (aquellos que no presentan ninguna ordenación de la información, como un texto de opinión o una imagen).
Por ejemplo, datos estructurados serían los listines telefónicos, en que toda la información está bien ordenada siguiendo un criterio único que no cambia. Si sabemos el criterio de ordenación, podemos encontrar cualquier dato rápidamente.
Datos no estructurados son los que almacenamos sin ningún orden, ni criterio. La ordenación se hace por su llegada. Es como una pila en que cada nuevo dato se pone encima del anterior. No se puede consultar la pila de forma fácil, porque no hay ningún criterio. Los datos no estructurados en la actualidad son básicamente los que captamos de internet y las redes sociales.
Por otro lado, cuando hablamos de Big Data, tenemos que tener en cuenta cinco características, que se denominan las 5V.
Volumen
Big Data tiene que hacer frente a la gestión de miles de millones de datos. Es la explosión de una ingente cantidad de información que un solo ordenador, independientemente de su potencia y capacidad de cálculo, no puede analizar por sí solo. Estamos hablando de volumen de datos equivalente a un quintillón: 1030.
Variedad
Big Data utiliza datos con formatos y orígenes muy diferentes: datos de empresa, imágenes, información de redes sociales, vídeos, registros de la web…
Generalmente, los sistemas de información no saben interactuar con formatos diferentes de datos, deben de especializarse solo en uno de ellos. En el Big Data los ordenadores hacen frente a esta gran variedad sin provocar mensajes constantes de error.
Velocidad
No solo hay una gran cantidad de datos que analizar, sino que crecen a una velocidad vertiginosa. Cada día aumentan los datos almacenados en los servidores a una velocidad exponencial.
Veracidad
Se refiere a la incertidumbre de los datos como las redes sociales; significa si los datos pueden ser confiables o no.
Valor
Los datos que estamos almacenando tienen que ayudar a tomar decisiones de forma más rápida y eficaz.
Si algo ofrece el tratamiento de datos a gran escala es pasar de un tratamiento descriptivo, es decir, orientado a conocer qué ha pasado (reporting) o qué está pasando (alertas) a un análisis predictivo sobre qué es posible que suceda.
Es un sistema de Big Data el que permite a un banco ofrecer productos personalizados. El banco simplemente compara el perfil de cada persona (edad, profesión, patrimonio, perfil financiero, comportamiento de pagos, tarjetas…) con otros miles de usuarios, identifica patrones de éxito, productos que han sido contratados por clientes que son similares. Estamos hablando del uso de millones de datos para tomar esta decisión, para todos los clientes del banco y de forma rápida.
El Big Data bien implementado no se queda en una predicción básica; si existe una buena estrategia será capaz de recoger información de vuelta (feedback) y valorar si la predicción que realizó fue acertada, generando interaciones que mejoran de forma continua el acierto.
Por ejemplo, accedes a la banca en línea y recibes un mensaje personalizado que ofrece un nuevo producto, por ejemplo, un préstamo personal de 15.000€. El sistema Big Data del banco ha medido el riesgo personal, la probabilidad del éxito de la oferta y la valoración personal como cliente. El sistema recogerá qué éxito tiene cada configuración de producto para identificar aquel con mayor éxito de ventas.
Esto es la base del denominado Machine Learning, la capacidad de un sistema de aprender de sus propias decisiones e ir ajustando sus predicciones.
Uno de los ámbitos donde mayor impacto está teniendo el análisis de grandes cantidades de datos es en el industrial. Las fábricas han pasado de ser máquinas inertes a centros inteligentes que recogen grandes volúmenes de datos a través de sensores (temperaturas, regímenes de funcionamiento, pesos, energía y hasta miles de variables distintas). Estos datos son centralizados en almacenes de datos (data warehouse) y permiten no solo controlar lo que está pasando en una fábrica, sino anticipar posibles problemas, lo que se denomina mantenimiento predictivo. Antes, estos mantenimientos se basaban en indicaciones del fabricante; ahora, a través de estos sensores e información, se analizan los patrones de comportamiento, dicho de otro modo, los valores de los sensores en diferentes escenarios. Podemos tener un patrón de normalidad donde todo va bien, pero también análisis de estos patrones predictivos que anticipan una posible rotura, determinados escenarios de variables que alertan a tiempo de que algo puede ir mal en un periodo de tiempo determinado, indicando una actuación preventiva. Todos sabemos que es mucho mejor prevenir que curar, así que no es lo mismo anticiparse al cambio de una pieza a punto de romper la maquinaria que esperar a que la misma rompa y pueda afectar a todo el sistema.
Aplicar metodologías de Business Analytics, basado en Big Data, no solo puede ser muy interesante; en un plazo muy corto de tiempo será un estándar necesario si una empresa quiere seguir siendo competitiva.
Para entender la capacidad de predicción del Big Data y su significado real, lo mejor es analizar aplicaciones reales:
Predicción del tráfico
Google Maps ofrece una ruta entre dos puntos que varía según la hora o el día (incluso durante la ruta). A través del análisis del geoposicionamiento de todos los usuarios de Google Maps y otros servicios de Android, así como del histórico, se predice el tráfico en cada momento de las diferentes rutas, optimizando con ello el cálculo de tiempos entre diferentes opciones.
Recomendación de películas o series
Basándose en el propio consumo y en el consumo de usuarios similares, plataformas como Amazon y Netflix recomiendan nuevas series o películas. En los últimos meses estas plataformas han introducido los finales de serie “abiertos”, en los que el consumidor puede elegir el desenlace. Esta fórmula que parece muy neutra no es más que un método para conocer más a cada consumidor y poderle personalizar ofertas a sus preferencias.
Sistemas Anti-Fraude
Detección de intentos de fraude, por ejemplo en uso de tarjetas de crédito, identificando los patrones utilizados por los delincuentes (horarios, orígenes, tipología de compras, importes, etc.). Si el comportamiento de una persona es similar al de un delincuente, se considera delincuente probable, con lo que la compañía pone en marcha protocolos de protección ante este riesgo potencial.
Predicción de valores en Bolsa
Es uno de los campos más intensivos en utilización de Big Data, con múltiples estrategias, algoritmos orientados a medir las emociones de los inversores hacia una empresa concreta en base a los tuits, identificación de patrones que predicen subidas o bajadas de cotización, etc.
Diagnóstico de enfermedades
Comienzan a cruzarse datos a gran escala de salud que permiten identificar patrones a través de variables de salud (síntomas, hábitos, indicadores) que actúan como señales de predicción de enfermedades. Clasificando a pacientes de riesgo y permitiendo aplicar medicina preventiva.
Desarrollo de nuevos productos
Análisis de datos de consumo masivos para extraer las características de los productos más vendidos o buscados para dar lugar a productos blockbuster.
Lead Scoring
Análisis de clientes potenciales para clasificarlos en grupos según el nivel de potencial basándose en datos de históricos, perfil social, datos en redes sociales, etc.
Las dificultades del Big Data
En primer lugar, es una tecnología con cierta complejidad, que requiere de perfiles multidisciplinares, profesionales que entiendan el negocio y expertos en tratamiento y análisis de datos y programadores que manejen las herramientas y lenguajes de programación adecuados. Por otro lado, se encuentran las implicaciones legales y éticas, evidenciado en los últimos tiempos por la famosa implantación del RGPD o los escándalos de Cambridge Analytica.
¿Qué es Ciencia de Datos?
Cuando hablamos de datos almacenados en un ordenador, no tienen valor por sí solos. A veces se habla de ellos como el petróleo de la empresa, porque es la materia prima que puede convertirse en conocimiento para tomar decisiones más rápido y de forma más precisa.
Los datos deben de estar estructurados (bien organizados) para que el ordenador pueda encontrar la información que necesita. Pero, a partir de ahí, nacen muchas actividades que tienen que llevarse a cabo.
¿Todos los datos son correctos? Por ejemplo, supongamos que en un campo donde guardamos la edad de la persona, hay un valor negativo, -90. ¿Qué pasaría? El ordenador daría un mensaje de error, y nosotros no sabríamos qué hacer.
Por otro lado, ¿extraemos el dato para hacer qué? Todo esto nos lleva a la ciencia de datos, que involucra métodos científicos, procesos y modelos para llevar a cabo la extracción de valor. Incluye análisis como la analítica descriptiva, la estadística, el Data Mining o minería de datos o el machine learning o aprendizaje automático.
La Ciencia de Datos, desde algo básico como un análisis descriptivo hasta algo evolucionado como la implementación de modelos predictivos, permite a las organizaciones obtener información de valor procedente de dichos datos, detectar patrones, y conseguir así ventajas competitivas, identificar nuevas oportunidades de negocio y mejorar la experiencia de los usuarios.
¿Hace falta tener ingentes cantidades de datos para aplicar técnicas de ciencia de datos?
No es necesario tener grandes volúmenes de datos para poder extraer valor. Lo importante es la calidad de la información que se obtiene de ellos tras aplicar técnicas de ciencia de datos, y eso depende principalmente de dos aspectos clave:
• Relevancia de la información en el problema que se quiere resolver.
• Limpieza de los datos para que el ruido no interfiera en la búsqueda de patrones reales.
Se ha desarrollado un término para los datos que cumplen estas condiciones, indispensables para que aporten valor: Smart Data. En proyectos de tan solo unos cientos de megas de datos, ya se puede obtener una información sumamente valiosa y accionable. Únicamente si la naturaleza de los datos, ya sea por su heterogeneidad o su volumen, hace inmanejables el procesamiento y la exploración de los mismos, se requerirá el uso de la tecnología adecuada para Big Data.
Gestión de los datos en las farmacias
Como hemos visto al comentar los conceptos relacionados con los datos, el Big Data en las farmacias no es aplicable de forma rentable. La farmacia no gestiona ingentes cantidades de datos que provienen de una web, redes sociales o de procesos internos.
Pero los datos sí que son clave en la gestión de la farmacia.
Gestión de stocks
La ciencia de datos nos permite predecir la demanda de los medicamentos, teniendo en cuenta gran cantidad de variables. Esta gestión del stock reducirá los inventarios, con lo que el inmovilizado será menor, así como las necesidades de financiación. Por tanto, la analítica de datos predictiva nos ayudará a trabajar con un stock adaptado a la demanda. No tendremos roturas de stock, pero al mismo tiempo liberaremos recursos, que de otra forma estarían invertidos en productos almacenados esperando a ser vendidos.
Personalización de la atención al cliente
Si conseguimos iniciar una política de fidelización con una tarjeta identificativa de la farmacia y del usuario, cada vez que compre tendremos información valiosa que se integrará en la base de datos. Más información significa que:
Conocemos mejor cada cliente, ya que podemos analizar el histórico de compras
Gracias a ello, sabemos cuáles son sus gustos, tratamientos, patologías. Ya deja de ser un mero cliente, pasa a ser una persona que conocemos. Aparte de poder ofrecer productos que no requieren prescripción médica y que tienen márgenes más elevados, esta atención personalizada tendrá un efecto emocional positivo que lo ligará con nuestra farmacia, haciendo la barrera de cambio más elevada.
Podemos agregar la información individual de cada cliente
Con ello, podemos buscar perfiles de clientes con necesidades o problemas comunes. Cada cliente tendrá un perfil asignado, con lo que podremos predecir futuras compras o preparar ofertas personalizadas, basadas en el comportamiento y la demanda de otros clientes que comparten el mismo perfil.
Campañas online individualizadas
No hace falta que esperemos a que el cliente entre en la farmacia. Con toda la información que tenemos, es muy fácil realizar campañas de Emailing para ofrecer productos de forma individualizada o para avisar de una nueva información que le puede interesar en el blog de la farmacia: si tiene problemas de sobrepeso “consejos de vida saludable”…
Estas campañas nos ayudarán a posicionarnos como expertos en salud, con lo que seremos sus referentes en todos los temas médicos que no requieran visita al médico.
Organización de talleres en la farmacia
La farmacia es un espacio reducido, pero siempre hay la oportunidad de organizar pequeños talleres online, en YouTube. El farmacéutico explica conceptos clave de salud, hábitos saludables. ¿Qué temas? La respuesta está en los datos, ya que nos dirán cómo son las personas que tenemos como clientes, por lo que los temas tratados seguro que serán de su interés.
Mejores condiciones comerciales
Si conocemos a nuestros clientes porque sabemos gestionar la información de forma científica, organizamos talleres online, enviamos emails para crear circulación en la farmacia…. ¿Por qué no negociar con los laboratorios?
Nosotros tenemos información que ellos no tienen, conocemos mejor al cliente, tratamos cada día con él… podemos negociar mayores márgenes en ciertos productos que serán ofertados de forma individual a clientes que aún no los compran. El laboratorio gana captar nuevos clientes con una promoción, pero sin afectar a los clientes habituales.
Como vemos, Big Data no es aplicable a la farmacia. No hay suficientes datos para que sea una alternativa. Pero gestionar los datos sí que es una alternativa fácil de llevar a cabo con costes muy reducidos.
La Agencia Estadounidense de Medicamentos (FDA, por sus siglas en inglés) ha aprobado definitivamente 'Leqembi'…
Loterías y Apuestas del Estado conmemorará el 125 aniversario del Colegio Oficial de Farmacéuticos de…
Las enfermedades cardiovasculares constituyen la primera causa de muerte en los países occidentales. Son la…
Un estudio piloto realizado en un centro médico académico destaca los beneficios de la revisión…
Más de 1’5 millones de personas en España se encuentran en una situación vulnerable y…
El control de los factores de riesgo cardiovascular con pautas de modificación del estilo de…