Comando Read doc - STELA Automation made Simple

Descripción General #

El comando readDoc pertenece a la categoría de RPA (Documentos). Su propósito principal es abrir e inspeccionar archivos de texto o documentos digitales para extraer su contenido completo o filtrar líneas específicas que cumplan con un criterio determinado. Es una herramienta rápida y eficiente para flujos de validación documental o recolección de datos. El resultado de la lectura se guarda en un archivo fácil de consultar.

Ejemplo de Uso Rápido #

Imagina que un robot de STELA descarga el contrato de un proveedor en formato .docx y necesitas verificar de manera automatizada si incluye la cláusula de vigencia. Puedes utilizar readDoc apuntando a la ruta del contrato y configurando un filtro con la palabra vigencia. El comando analizará el documento en segundo plano y te devolverá de forma exacta cuántas líneas coinciden y el texto de cada una de ellas para que el robot pueda usar la información en los siguientes pasos de tu automatización

Parámetros y Opciones #

Archivo (Obligatorio): Aquí se debe indicar la ruta física local o la variable que contiene la ubicación del documento que STELA leerá. Por ejemplo: C:\Documentos\mi_archivo.pdf o /home/usuario/informe.docx.
Los formatos de archivo compatibles nativamente son:
- .txt (Texto plano)
- .doc y .docx (Documentos de Microsoft Word)
- .pdf (Documentos PDF de texto legible)
Filtro (opcional): Criterio utilizado para limitar las líneas del documento que STELA debe extraer. Si se deja vacío, el comando extraerá la totalidad de las líneas del archivo.
Puede utilizarse de dos formas:
- Texto simple: STELA solo guardará las líneas que contengan esa palabra o frase exacta. Por ejemplo, si en un archivo de texto buscas la palabra «importante», solo se guardarán las líneas que la incluyan.
- Expresión regular (Regex): Si el patrón se escribe entre comillas dobles (ej: ".*vigencia.*"), STELA aplicará las reglas del motor de expresiones regulares para identificar las líneas correspondientes.

El resultado de la ejecución del comando «Read doc» se guarda en el archivo de evidencia de STELA, ubicado en la carpeta de registro (log). El archivo se nombra siguiendo la siguiente estructura: nombre_del_archivo_cargado.extension_del_archivo.ini.

Por ejemplo, si el archivo original era «archivo1.docx», el resultado se guardará como «archivo1.docx.ini».

Se genera un contenedor de datos estructurado con las siguientes claves listas para reutilizar:

cant_datos: Almacena el número total de líneas que cumplieron con el filtro aplicado.
linea1, linea2, linea3, etc.: Variables indexadas secuencialmente que contienen el texto de cada una de las líneas encontradas

Ejemplos de Uso Avanzado #

Extracción de datos de una tabla en un PDF: Supongamos que tienes un archivo PDF con una tabla de precios. Puedes usar «Read doc» indicando la ruta del PDF y, si conoces alguna palabra clave que aparezca en las filas de la tabla (por ejemplo, «Producto»), puedes usarla como filtro. STELA leerá el PDF y guardará solo las líneas que contengan «Producto», facilitando la extracción de los datos de la tabla.
Validación Automatizada de Contratos Corporativos: Puedes usar readDoc sobre un documento (.pdf o .docx) para buscar términos legales críticos como «multa», «penalización» o «resolución». Evaluando posteriormente la variable cant_datos, se puede identificar los casos sospechosos para ser revisados a detalle.
Auditoría de Archivos de Log en Procesos RPA: Al automatizar aplicaciones que generan registros de eventos en archivos .txt, puedes usar readDoc con un filtro de expresión regular como «.ERROR.» para extraer únicamente las líneas de falla del sistema de un día de trabajo. Esto facilita la creación de reportes consolidados sin necesidad de procesar miles de líneas de texto a mano.

Errores Comunes y Soluciones #

Ruta del archivo incorrecta: STELA no puede encontrar el archivo
- Solución: asegúrate de haber escrito correctamente la ruta, incluyendo la unidad de disco y las carpetas y que STELA tenga permisos de lectura sobre esa carpeta o red. Si utilizas una variable para la ruta, asegúrate que se haya cargado correctamente en los pasos anteriores.
El formato o codificación del documento no puede ser interpretado.
- Solución:Asegúrate que el documento no esté corrupto y que corresponda a las extensiones soportadas (.txt, .doc, .docx, .pdf).
El comando se ejecuta con éxito pero cant_datos devuelve 0 cuando el texto sí existe visualmente.
- Solución: Esto ocurre habitualmente cuando el documento inspeccionado es un PDF o Word basado en imágenes (escaneado). readDoc extrae texto libre impreso digitalmente; si el documento es una imagen digitalizada, debes utilizar comandos de la categoría RPA (OCR) como docOCR, o azure_ocr.
Filtro demasiado restrictivo: No se obtiene ningún resultado
- Solución:Si usas un filtro muy específico, es posible que no obtengas ningún resultado si no hay líneas que coincidan exactamente con tu criterio. Revisa tu filtro y considera si necesitas hacerlo más general.

Casos de Uso #

Automatización de tareas repetitivas con información de archivos: Puedes leer listas de clientes desde un archivo de texto para enviar correos electrónicos personalizados o actualizar una base de datos.
Extracción de información clave de informes: Puedes leer informes en PDF o Word y usar filtros para obtener solo los datos o conclusiones que necesitas para tus siguientes acciones.
Monitoreo de archivos de registro para alertas: Puedes leer archivos de registro y usar filtros para detectar errores o eventos importantes y activar notificaciones.