Spoon, el componente de Pentaho Data Integration (Kettle)

Te mostramos las utilidades de esta herramienta con un caso práctico

La tecnología es el motor que cambia el mundo. De eso no hay ninguna duda. Y es por ello por lo que las empresas necesitan y deben actualizarse, implementando nuevas soluciones o herramientas tecnológicas que faciliten su trabajo.

Una de estas herramientas muy potentes es Pentaho, un software de Gestión de Inteligencia Empresarial (Business Intelligence y Big Data) que permite la mejora de la toma de decisiones, gracias a su capacidad de generar cuadros de mandos, analíticas y mucho más.

Uno de los componentes de Pentaho, es Pentaho Data Integration (PDI) -también llamado Kettle- el cual contiene, a su vez, componentes muy interesantes como Spoon, que convierten a Pentaho en una herramienta muy útil y completa, tal y como pudimos ver en el anterior caso práctico.

Gracias a Spoon vamos a poder realizar procesos de ETL de manera fácil y rápida. En concreto, nos va a permitir hacer Data Warehouse, con estructura en Estrella, pudiendo formar las tablas de Hechos y Dimensiones y sus relaciones entre ellas sin ninguna dificultad.

Prácticamente nos va a permitir hacer de todo: crear conexiones a los datos, hacer todo tipo de transformaciones, insertar fórmulas, transformaciones directas ya implementadas gracias a su calculadora… Sencillamente en pocos pasos te permite hacer muchas cosas sin tener que programar directamente con código.

Para ver cuán interesante es esta herramienta, os mostraremos en este artículo el siguiente caso práctico en Spoon:

En este imagen, podemos ver el panel de Spoon con los diferentes procesos que podemos realizar, los cuales tendremos que ir arrastrando hacia la pestaña creada. En esta pestaña, si os fijáis, podremos darle a “Play”, “Pause” o “Stop” cuando queramos iniciar la transformación, pausarla o pararla.

En este caso, hemos decidido escoger los siguientes procesos para crear un Data Warehouse, es decir, una tabla con fechas:

  • Generate Rows: para generar las columnas.
  • Add sequence: añadir una secuencia.
  • Calculadora: para realizar una fórmula con esos datos.
  • Select values: para seleccionar los valores que escojamos.
  • Búsqueda/actualización en combinación: para actualizar los datos automáticamente.

1º Paso: Generate Rows

En nuestro caso práctico, el primer paso es generar las columnas. Aquí hemos especificado que el límite sea de 6000 y que la primera columna del primer día, todas estén con la fecha 01-01-2015.

2º Paso: Add Sequence

El siguiente paso es “Add sequence”, es decir, vamos a añadir una columna que tendrá cualquier nombre y con la secuencia de 1 en 1, con lo cual empieza en 0 e incrementa en 1:

 

Y el resultado de los datos sería este:

 

3º Paso: Calculadora

Ahora pasaremos a la calculadora directamente, una herramienta muy interesante ya que tiene miles de fórmulas, como podemos ver en la imagen siguiente:

 

Para este caso concreto, utilizaremos varias fórmulas para trabajar con los datos. Como podemos ver en la imagen de debajo, sumaremos 1 al “first_day” y todo lo de la calculadora:

 

Previsualización de los datos:

4º Paso: Select Values

Aquí seleccionaremos los valores con los que nos quedamos y los que no:

 

 

5º Paso: Búsqueda/actualización en combinación

El último paso sería la actualización. Esto es por si cambia algo para que se actualice y no se añada ninguna línea más.

 

Y este sería la tabla final, a la cual hemos añadido el “pk_tiempo” para relacionar la fecha. Esto servirá, por ejemplo, para cuando tengamos una factura o evento de una fecha determinada, dicha fecha corresponde a un determinado pk, con lo cual cuando crucemos los datos, nos quedaremos con la cifra del pk sin tener que meter todos los datos:

 

Como hemos visto, Spoon, de Pentaho Data Integration (PDI), tiene muchas utilidades en el ámbito empresarial, una gran herramienta para tomar los datos, hacer las transformaciones necesarias con las que dejar los datos de una manera muy fácil de analizar y visualizar.

Por ello, la recomendamos encarecidamente ya que, una vez se aprende a usarla, se hace todo de manera muy rápida y ágil. 

¿Te gustaría implementar Pentaho en tu empresa o negocio? Haz clic aquí.

LinkedIn

Sobre el Autor

Paula Martín

Paula Martín

Consultora Marketing.

Responsable de Comunicación y Ventas, además de Community Manager.

Técnico superior en Gestión de Ventas y Espacios Comerciales, y técnico superior en Marketing y Publicidad, con experiencia en varias empresas del sector.

Amante de la psicología y la filosofía como estilo de vida, y del marketing como forma de comunicación de las empresas.

  • Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.

Deja un comentario

Estás comentando como invitado.