Cómo obtener nombres de subcarpetas en Pentaho Data Integration (PDI)

Otro proceso interesante en PDI

En nuestro último artículo, estuvimos explicando un caso práctico o tutorial en Pentaho Data Integration (PDI), concretamente el de cómo utilizar el apartado Input para importar datos desde una base de datos.

Como sabemos que las empresas necesitan analizar e interpretar correctamente toda la información y datos que se van generando para tomar mejores decisiones empresariales, es necesario contar o disponer de herramientas de Analítica Avanzada, Big Data o Business Intelligence de calidad que nos ayuden a llevar a cabo dicha tarea lo mejor posible.

Pentaho Data Integration es una de esas herramientas, se trata de la solución de Integración de Datos Open Source más utilizada en la actualidad, y uno de los componentes más importantes y útiles de Pentaho.

Por ello, en este artículo, queremos explicar otro de los procesos interesantes que podemos hacer en PDI, concretamente en su apartado "Input", y es el de cómo obtener los nombres de las subcarpetas.

¿En qué consiste la función de "Obtener Nombres de Subcarpetas" (Get Subfolder Names)?

Básicamente se trata de decirle a la herramienta que lea una carpeta principal y devuelva todas las subcarpetas.

Pasos a realizar 

Lo primero que tenemos que hacer es acceder a PDI. Una vez hayamos iniciado sesión, hacemos click en "New" y, posteriormente, en "Transformation":

Después, seleccionamos el apartado "Input", buscamos el proceso "Get Subfolder Names" y lo arrastramos al Panel:

Hacemos doble click en el proceso y se nos abrirá una pequeña ventana donde se nos pedirá que busquemos un archivo en directorio pulsando "Browse":

Le damos a "Acepttar", lo añadimos haciendo click en "Add" y le damos a "Ok":

 

A continuación, para previsualizar los datos, pulsamos "Preview rows", "Ok" y luego nos aparecerá una ventana con todas las subcarpetas del archivo del directorio que habíamos añadido previamente:

Y así en unos pocos pasos muy sencillos y rápidos hemos podido obtener los nombres de todas las subcarpetas de cualquier archivo del repositorio.  

¿Tienes dudas o te gustaría aprender más sobre PDI o Pentaho? Accede a nuestros cursos.

Te recomendamos leer

LinkedIn

Sobre el Autor

Paula Martín

Paula Martín

Consultora Marketing.

Responsable de Comunicación y Ventas, además de Community Manager.

Técnico superior en Gestión de Ventas y Espacios Comerciales, y técnico superior en Marketing y Publicidad, con experiencia en varias empresas del sector.

Amante de la psicología y la filosofía como estilo de vida, y del marketing como forma de comunicación de las empresas.

  • Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.

Deja un comentario

Estás comentando como invitado.