Los datos se están convirtiendo en una herramienta cada vez más generalizada y amplia en el presente ecosistema digital. La utilización de los datos por parte de las compañías está también expandiéndose de forma rápida, en correspondencia con su creciente presencia digital. Según los pronósticos de Statista, un portal con estadísticas internacionales y datos de mercado, en 2022 se crearán en todo el mundo 94 zettabytes* de datos, frente a los 74 de 2021.
Aunque parece que recopilar datos es algo que está al alcance de cualquier empresa, es preciso que estos datos estén estructurados, tengan calidad y sean seguros y fácilmente accesibles internamente para que impulsen los ingresos y el crecimiento. Echemos un vistazo a los criterios para determinar la calidad de los datos, los métodos para evaluarlos y gestionarlos, los grupos de interés con los que hay que cultivar la relación y las mejores herramientas disponibles.
*Para dar una idea de la magnitud, un zettabyte son 1.000.000.000.000.000.000.000 de bytes.
¿Qué es la calidad de los datos?
La calidad de los datos es una medición del estado de los mismos basada en varios criterios: su exactitud, completitud, integridad, oportunidad, coherencia y grado de cumplimiento de las normas. Estos criterios pretenden facilitar la gestión de los datos y la toma de decisiones a partir de los mismos, y aseguran que se cumple de modo correcto la regulación vigente sobre privacidad:
- Exactitud. ¿Reflejan mis datos la realidad a lo largo del tiempo? ¿Los valores que aportan son fiables?
- Completitud. ¿Se recopilan mis datos en el modo en que considero que debe hacerse? ¿Tengo todos los datos que necesito para tomar decisiones informadas?
- Integridad. ¿Están mis datos libres de errores? ¿Los valores son fáciles de leer y tienen un formato apropiado?
- Oportunidad. ¿Están mis datos disponibles en el momento adecuado? ¿Me permiten reaccionar en tiempo real?
- Coherencia. ¿Son mis datos consistentes en todas las plataformas? ¿La información está centralizada de un modo fiable? ¿Tienen todos mis empleados acceso a los mismos datos?
- Cumplimiento de las normas. ¿Se atiene mi uso de datos a lo dispuesto en el RGPD? ¿Mi proveedor de servicios de análisis me pone en riesgo de ser multado en virtud de la legislación de la Unión Europea?
La importancia de la calidad de los datos
La acelerada digitalización de las compañías a lo largo de la última década y la emergencia, en el mismo periodo de tiempo, de compañías nuevas puramente digitales, tiene como consecuencia que cada vez más y más actores del mercado adopten estrategias de marketing basadas en datos. La puesta en práctica de políticas basadas en los datos trata de responder a la necesidad de ultra-personalización de los mensajes. Ello permite a las compañías estar un paso por delante de la competencia, anticipar mejor las fluctuaciones del mercado y mejorar la toma de decisiones y los resultados.
Ya no es necesario demostrar el valor que tiene recoger, analizar y usar los datos. Por otro lado, a pesar de la democratización de la analítica web en todos los sectores de de actividad, los diferentes grupos de usuarios de los datos todavía tienden a centrarse más en la cantidad que en la calidad, a pesar del incremento de los principios de minimización de datos, que han cambiado nuestro comportamiento en los últimos años.
Cuando se procesa un gran volumen de datos, la calidad de los mismos se puede ver afectada por los siguientes factores:
- Sobrestimaciones en la medición causadas por bots
- Datos de tráfico bloqueados por los ad blockers
- Medición defectuosa debido a errores en el plan de etiquetado
- Sobrestimaciones de la conversión debido a fuentes de atribución defectuosas
- Datos de tráfico no excluidos aunque los usuarios no hayan consentido el uso de cookies
- Parte del tráfico no medido debido al data sampling
Y estos errores pueden acarrear para las empresas consecuencias a largo plazo tales como:
- Perjuicios en la imagen de marca
- Pérdida de confianza por parte de los consumidores
- Menos ingresos y oportunidades de negocio
- Pérdida de tiempo y otros costes adicionales de gestión
- Descenso en el ROI del marketing y de las iniciativas de ventas
- Contaminación de todos los proyectos de análisis
- Descenso en la confianza en la compañía por parte del los propios empleados
- Multas en caso de incumplimiento de las normas sobre privacidad
Estas son las razones por las que es esencial ser meticuloso durante la fase de recolección de datos, la cual puede verse afectada por cada actualización o desarrollo en la página web o en la aplicación móvil.
¿Cómo gestionar y mejorar la calidad de los datos?
Cuando adoptan un enfoque centrado en la calidad de los datos, las organizaciones se enfrentan a un doble reto: por un lado, integrar datos correctos en sus sistemas de información y, por otro, eliminar todos los errores que se hayan identificado, tales como datos incompletos, obsoletos, inseguros, imprecisos o que no cumplan con la regulación vigente. Y estos fallos, que se pueden originar por factores técnicos o humanos, pueden ocurrir en cualquier fase del ciclo vital de los datos, tales como:
- Recolección, debido a errores en el plan de etiquetado
- Data-sharing, debido a la existencia de varias versiones y posiblemente diferentes métodos de cálculo
- Exportación, debido a la incompatibilidad de los sistemas de información
- Durante el mantenimiento técnico, debido a efectos colaterales
Este es un método en cinco pasos para mejorar de forma continua la calidad de los datos:
Paso 1: Define tu rango de calidad de datos
En primer lugar, resulta esencial determinar un marco de referencia claro para tu enfoque sobre la calidad de los datos. Dependiendo de los objetivos de tu compañía y de la información que se estime útil para impulsar sus ventas y sus estrategias de marketing, podrás hacer un mapa de todas las necesidades de datos de tus equipos y determinar los puntos del contacto relevantes en el trayecto de tus usuarios. El objetivo es racionalizar y enfocar los esfuerzos en los datos importantes que te ayudarán a gestionar tu actividad digital.
Paso 2: Audita tu base de datos
Esta fase consiste en trazar un perfil de tus datos. Habrás de asegurarte de que tus bases de datos no contienen anomalía alguna y son completas. ¿Tienen todos los contactos una dirección de e-mail y/o un número de teléfono? ¿Son correctos? ¿Son correctos los nombres y los apellidos? Nada debe interponerse en el camino para conseguir el éxito en los procesos de automatización del marketing o de los envíos de e-mail. Si llevas a cabo esta auditoría con minuciosidad, podrás definir un plan de acción y hacer recomendaciones sobre las reglas para crear y mantener los datos.
Paso 3: Limpia tus bases de datos
Cuando se manejan diversas fuentes de datos, los conjuntos de datos pueden llegar a “contaminarse” por errores de diferentes tipos: mala sintaxis, erratas, campos sin rellenar, etiquetado defectuoso, información duplicada, etcétera. La limpieza de datos consiste en eliminar todas las duplicaciones, la información obsoleta, estropeada o incorrecta y los datos mal formateados. Este ejercicio te posibilitará trabajar con una base sólida de cara al futuro, evitar alteraciones en el análisis de resultados y optimizar la fase de enriquecimiento de los datos. Este paso puede quedar grabado en un registro con el fin de estudiar el origen de los errores y monitorizarlos mejor.
Paso 4: Re-importa el conjunto de datos, chequéalo y valídalo
Una vez que el proceso de limpieza de los datos ha concluido, has de asegurarte de que tu conjunto de datos está adecuadamente limpio y estandarizado. Te aconsejamos que te dotes de un archivo de importación de nomenclatura para evitar errores o caídas durante la próxima mudanza de datos en tu sistema de información. Es difícil conseguir una limpieza del todo eficiente. Siempre se cuelan micro-errores por las rendijas. Así que es conveniente estar preparado para llevar a cabo una segunda limpieza de las bases de datos si es necesario.
Paso 5: Persevera a largo plazo en los esfuerzos en pro de la calidad de datos
Es importante recordar que la calidad de los datos es un planteamiento en el que hay que perseverar si se quiere garantizar esa calidad a lo largo del tiempo. Si un ítem de la base de datos contiene un error, estúdialo, corrígelo, regístralo y finalmente adopta las medidas apropiadas para que no vuelva a suceder. Asimismo, asegúrate de que todos los empleados de la compañía que generan y gestionan datos cotidianamente estén pendientes de seguir las normas de higiene, sea en la creación del plan de etiquetado, sea en el procesado de los datos. Idealmente, deberías crear un ente responsable de la gobernanza de datos, aunque sea pequeño, para monitorizar de modo permanente la eficiencia de los procesos.
¿Cuáles son los roles principales en relación con la calidad de los datos?
Es fundamental, en el seno de la organización, hacer que todos los interesados sean conscientes del factor “calidad”. Cualquier persona involucrada (empleados, proveedores de servicios o colaboradores) deben tener los mismos objetivos y avanzar en la misma dirección parta desarrollar con éxito la estrategia de calidad de los datos.
Para extraer el máximo de los datos, te recomendamos que montes un sistema de gobernanza de los mismos liderado por un Director General de Datos. Esta persona, que ha de garantizar la fluidez de los procesos, será responsable de decidir, arbitrar y planificar todos los proyectos relativos a datos de la organización así como de gestionar los diferentes roles relacionados con este programa.
Dependiendo del tamaño de tu organización y de los recursos disponibles, la gobernanza de datos puede incluir los siguientes roles o cargos:
- Propietario de datos: son los dueños de un conjunto o colección de datos especifica para una unidad de negocio concreta. Esta persona debe garantizar que se siguen los procesos correctos en la recopilación, seguridad y calidad de los datos. Por ejemplo, el Director de Marketing puede ser el propietario de los datos de consumidores; el Director de Recursos Humanos, de los datos internos de la compañía, y el Director General Financiero, de los datos de las finanzas de la empresa.
- Comisario de datos: este coordinador de datos es responsable de organizar y gestionar el contenido, el formateo y la normalización de los datos. Pueden corregir datos o darles el estatus de “datos relevantes”. Normalmente, trabajan en colaboración con los ingenieros /analistas / científicos de datos.
- Custodio de datos: este es un cargo relacionado sobre todo con las IT. Gestionan los aspectos técnicos con el fin de asegurar un ciclo de vida apropiado para los datos, desde el mantenimiento al almacenamiento pasando por las reglas de acceso.
Además de estos roles, que están en la primera linea del frente de la calidad de los datos, hay otros cargos secundarios o funcionales tales como los analistas de datos o de negocio, los consumidores de datos múltiples (dueños y managers de producto, marketing managers, responsables de contenido, community managers, diseñadores UX, etc.) o incluso el Director de Protección de Datos (DPD), que ha de garantizar la aplicación rigurosa de las normas de protección de datos (pautas de RGPD, CCPA, CNIL).
¿Cuáles son las herramientas para la gestión de la calidad de los datos?
Para optimizar y reducir el tiempo que los empleados de la compañía dedican a la gestión de la calidad de los datos, puedes equipar a la compañía con herramientas especializadas. Se puede usar software para hacer una limpieza a fondo de los datos, identificar y eliminar duplicados, validar nuevos datos, verificar la información de contacto o afinar los perfiles. Asegúrate de investigar la oferta de soluciones y compararlas antes de empezar, porque no siempre son eficientes o están adaptadas a tu casuística o configuración técnica.
Recomendamos que desarrolles un sistema maestro de gestión de datos para cada escenario de negocio. Se trata de una serie de herramientas y métodos para almacenar, gestionar y distribuir los datos de referencia de la compañía. Es un repositorio único en el que se centralizan todos los datos para simplificar y garantizar que los datos se comparten entre todas las unidades de negocio.
Finalmente, no olvides dotar a la compañía de una solución de analítica de datos de alto rendimiento que ofrezca datos fiables, no muestreados. En Piano creemos que este proceso de control de datos ha de ser fácil y rápido de supervisar, verificar y corregir. Para ello, ofrecemos varias herramientas especializadas en la calidad de los datos:
- Tag Crawler permite comprobar de manera exhaustiva y exacta la presencia de tus etiquetas en todas las páginas de tu sitio web, especialmente antes y después de cada actualización funcional o depuración.
- Tag Inspector permite llevar a cabo una verificación segmentada de las etiquetas de Piano en determinadas páginas del sitio web para testarlas y, en su caso, depurarlas.
- Data Manager permite corregir, enriquecer o excluir algunos de tus datos de una interfaz simplificada usando reglas personalizadas de procesamiento de datos. Ya no necesitarás tocar tu código para corregir los datos recuperados.