Elimina por un momento de tú mente los escenarios ideales donde los datos vendrán estructurados de la manera más eficiente. No todo proviene de bases de datos donde podemos manipular y adaptar a discreción la manera de agregarlos en un modelo semántico de Power BI.
Eventos como el que te voy a contar, nos hace recordar que, el ser humano tiene mayor importancia y estará por encima de los cambios impuestos en la manera de analizar datos.
Cambiar lo que es intuitivo para otros por querer encasillarte en lo considerado correcto; algo similar –al todo o nada de las columnas calculadas en DAX-, hacen que nos desviemos de un aspecto importante como consultores; más allá de ofrecer soluciones que cumplan con los requisitos, y como mínimo adopten las practicas recomendadas siempre habrá que tener en cuenta a las personas; quienes pueden o no aceptar los cambios propuestos.
Veamos.
Aceite de oliva
Fincas, parcelas, maquinarias, insumos y personas. Ingresos multimillonarios, pero en gran medida los datos son guardados en hojas de cálculo.
¿Te sorprende?
Hace apenas 2 días publicaron la siguiente noticia: El error de Excel de 92 millones de dólares del fondo soberano noruego
Así que, no entremos en las diatribas sobre Excel o Power BI, simplemente nos enfocamos en una realidad donde aspectos importantes a cualquier nivel, empresarial o gubernamental son guardados y analizados en la hoja de cálculo.
Seguimos.
El registro de algunas de las actividades es lineal o por filas, y no de manera tabular.
Es intuitivo para la persona porque diariamente va llenando los datos hacia la derecha. Una fila corresponde a un (1) solo día a menos que, exista algún registro que lo separe, por ejemplo: una parcela distinta (en verde).
El problema comienza cuando vemos una serie de registros o eventos hacia la derecha y debemos relacionar las maquinas (en amarillo) con una dimensión que agrupe las características de las maquinas; es decir, el clásico esquema de estrella de uno (1) a muchos (*).
El escenario ideal
Para evitarnos transformaciones, podemos sugerir, evitar registrar los datos hacia la derecha. En cambio, se repetirían los registros hacia abajo de acuerdo con la cantidad de máquinas utilizadas en cada uno de los eventos. Asimismo, registros constantes como «arboles» se repetirían o podrían dejarse en blanco.
En otros casos, en vez de utilizar la hoja de cálculo podríamos volcarnos a impulsar la adopción de software de gestión Agroinsdustrial para superar estos escollos.
Pero, si buscas una solución inmediata, utilizando una característica llamada «anulación de dinamización de otras columnas» o también conocida como Unpivot en Power Query para trasladar el encabezado de las columnas a las filas se puede alcanzar el resultado.
Quedaría algo así con otros pasos aplicados (este artículo de opinión no es un tutorial):
En etapas posteriores se terminan ajustando los cálculos; pero el objetivo se habría logrado.
El humano
Verás, lo más fácil era haber cambiado la manera de registrar los datos.
El problema son «ellos», no nosotros, porque en Power BI procesamos datos según los postulados del modelamiento dimensional.
Además, no tendríamos que adaptar la consulta ni utilizar otras transformaciones en Power Query. Hay que decirle a cada uno de los operarios de todas las fincas que, a partir de ahora van a tener que registrar datos hacia abajo; aunque no les resulte intuitivo, propenso a generar errores, omisiones o repeticiones.
A veces, los escenarios ideales solo existen en nuestra mente o en las publicaciones de LinkedIn.
La realidad nos obliga a adaptarnos –aunque sabemos que podría ser mejor hacerlo de otra manera– teniendo un poquito de empatía. Comprender que en muchos casos, modificar la conducta de las personas toma tiempo, dinero y esfuerzo. Reflexionar sobre hasta que punto puede ser viable una solución analítica sin causar conflicto con los conocimientos y los recursos disponibles es crítico para seguir avanzando.
Y, solamente cuando se busca cambiar o exprimir la cultura analítica como una aceituna, allí si nos enfocamos en optimizar los procesos de recopilación de datos.