En días recientes, lleve a cabo una sesión sobre planificación, desarrollo y mantenimiento de modelos analíticos. El objetivo, era explicar de una manera amigable lo que hemos logrado a lo largo de los años; desde cambios en el consumo de autoservicio, esquemas de desarrollo, gobernancia, responsabilidades, ciclo de vida e impacto en la cultura del manejo de los datos en la organización.
Sin embargo, de todas las diapositivas, quiero compartirles una que refleja –de manera simplificada– cuatro (4) de los eventos más determinantes al momento de migrar datos y análisis a Power BI. La lectura, siguiendo un estilo de diagrama de Venn, establece las relaciones entre las personas, y los procesos que se deberán llevar a cabo para llegar a la mente (circulo amarillo).
Nota: lo siguiente corresponde a despliegues en estructuras organizacionales (más de 100 consumidores)
¿Qué quiero migrar?
Hasta ahora, el nivel de abstracción en plataformas de BI y datos estructurados corresponde a una representación visual de tablas. Independientemente de residir en la nube o de manera local, las bases de datos conforman la manera empresarial de almacenar, transformar, procesar y transmitir datos. En general, trabajamos principalmente bajo los principios del modelado dimensional (metodología Kimball).
Aquí, comienza a ser necesario trasladar la mente de los usuarios –acostumbrados a las rutinas diarias– de exportación de consultas de los ERP (Sistema de Planificación Empresarial) digamos, SAP, procesando datos en hojas de cálculo; por un preprocesamiento de los datos. En otras palabras: a partir de ahora, no requiero calcular diariamente el mismo indicador, sino que me conectaré a un modelo analítico que ya me transmita los resultados en distintos contextos.
La automatización de análisis complejos deja de ser una utopia, –no es posible, muy complicado…– por una dinámica donde lo principal radica en preguntarse: ¿Qué necesitamos construir en lo físico para agilizar las operaciones diarias de nuestros procesos mentales?
Por esa razon, al decidir migrar, lo estratégico es seleccionar los análisis que tienen mayor calada o se consideran medulares para una gestión gerencial.
¿Qué quiero calcular?
La capa semántica se genera a partir de tablas, relaciones y sus cálculos. En este periodo (círculo rojo) nuestro rol radica en convertirnos en intermediarios entre los requisitos técnicos que deberán cumplirse a nivel de plataforma (Power BI) y las expectativas de los usuarios. Es un baile, un ir y venir donde la planificación, y las habilidades blandas son de gran importancia.
Comprender todo un entramado de análisis en distintas hojas de cálculo, hasta lograr su migración puede ser un largo trecho.
En algunos casos, regresamos al punto cero (circulo azul) ejecutando cambios de raíz –donde residen los datos– para ajustarnos a los nuevos descubrimientos y, así evitar convertir el modelo en un espagueti –no porque lo puedes transformar en PowerQuery es lo correcto-.[1]
Sin embargo, acciones que parecen ser simples, por ejemplo, crear una nueva columna podría inclinarse a la conveniencia humana; más no a la rigidez del aspecto técnico o cumplimiento de prácticas recomendadas.
Y, aunque suene incorrecto lo dicho anteriormente, al descomponer un escenario, veremos como comienzan a aparecer no una, sino dos o hasta tres opciones para decidir a donde crear una simple columna; siendo el reflejo del Autoservicio «Self-Service BI» con sus ventajas; pero con una delgada línea en complicar innecesariamente las cosas.
Cuando se comienzan a replicar cálculos, y el usuario comprende las potencialidades de la plataforma, los horizontes de la mente se expanden al acceder a una mayor robustez, velocidad y variabilidad del mismo análisis. Allí, las respuestas en milisegundos marcan la pauta. Todo, absolutamente todo lo que demore más de un (1) segundo en renderizarse es verificado paso a paso (en realidad con menos ya genera suspicacia). Es un afán de aprovechar lo mejor de las tecnologías de procesamiento en memoria de los modelos tabulares.[2]
No obstante, los procesamientos en streaming o bajo condiciones de DirectQuery (con modalidades de tablas en almacenamiento dual) requieren de un tratamiento aparte; porque allí, para lograr tiempos de respuesta «aceptables» se tienen que realizar más ajustes o considerar sus limitaciones.
Eventualmente llegamos a la creación de reportes. Comienzan a verse los aspectos técnicos del diseño, estrategias de consumo y conveniencia. La capa de visualización puede ser gobernada, restrictiva u ofrecer libertad.
La libertad de darle a un usuario, la posibilidad de crear un reporte conectándose a la capa semántica puede considerarse una blasfemia para algunos estilos de consultoría –mientras más libertad les des, menos dependerán de ti- podría ser una manera de verlo. Esto, se debe a que es posible crear análisis exploratorios (en caliente) saliendo de los reportes predefinidos o creados por otras personas.
En ese sentido, el método de despliegue adquiere importancia: ¿Quiero que mis usuarios solo vean lo que diseñamos nosotros, o busco incentivar la exploración de datos donde y cuando consideren necesario?
¿Cómo lo voy a responder?
Lo bonito de los modelos analíticos basados en Power BI es que no necesariamente deben ser consumidos a traves de un mismo medio. Desde la plataforma web, pasando por Power BI Desktop o Excel/Excel Online (conectándose en vivo al modelo) aplicaciones móviles, desarrollos de terceros con reportes incrustados; hasta conectarse a la capa semántica por medio de otras herramientas de visualización de datos (Tableau) a traves del endpoint XMLA.
Si el usuario tiene acceso a la capa semántica, podrá realizar análisis exploratorios (más allá de los reportes creados por otros) diseñar por sí mismo sus propios análisis, y compartir hallazgos de manera segura.
Sin embargo, un detalle espectacular de la filosofía de gobernancia «rigidez en lo medular; pero flexibilidad en sus extremidades» círculo verde, es la capacidad por parte de los usuarios de crear nuevos cálculos (conocidos como medidas a nivel de reporte) sin la necesidad de modificar el modelo original. Luego, de ser efectivas pueden ser replicadas en la raíz del modelo, siendo lo que llamo: institucionalización de una métrica.
No obstante, hay que destacar que es peligroso dejar sin control cualquier evento de este tipo. Siempre, la educación y entrenamiento continuo van por delante.
Por último, responder tantas interrogantes adquiere distintos matices; pero lo más importante lo hemos logrado: todos los análisis provienen de la misma fuente. Se acaban los cálculos errados o versiones inconsistentes. Por primera vez el usuario vive una experiencia de análisis automatizada y transversal entre los departamentos involucrados en el desarrollo de los modelos, sin restarle flexibilidad ni libertad en el uso de las herramientas conocidas.
Acción humana
Lo que nosotros hacemos en la analítica de datos lo definen las consecuencias que tendrán en nuestra mente. Queremos ser más agiles, precisos y rápidos para soportar el proceso de toma de decisiones. Buscamos tener tiempo libre para reflexionar, pensar claramente u organizarnos mejor. Ansiamos persuadir e inspirar a los demás con interpretaciones ocultas en miles o millones de registros. Sacar del polvo proyectos detenidos por estar ahogados en la operatividad, y la anarquía de los datos.
Vivir la libertad; decidiendo cuándo y cómo responder nuestras dudas.
Y, para lograrlo, necesitamos prestarle atención tanto a lo humano como lo técnico.
[1] Máxima de transformación de datos por Matthew Roche [2] Bajo el método de importación de datos se aprovecha la totalidad de características del programa.
Hola Rafael, con la actualización de abril y poder conectarnos al modelo desde el Servicio, el escenario mejora muchísimo no?
saludos
¡Hola Horacio! en la actualización de abril 2023 nos han dado la capacidad de modificar o editar el modelo desde el Servicio de Power BI (con muchas restricciones por los momentos) pero conectarnos a la capa semántica ya es algo que podemos hacer desde hace años. Pero, si hemos visto una mejoría, y más a medida que se alcance una mayor madurez o equivalencia entre lo que hacemos de manera local vs nube. Saludos.