La clasificación manual de documentos no es necesaria
Que hace
Automatización Distribución de documentos resuelve dos tareas relacionadas: reconoce el tipo de archivo y lo envía al lugar correcto del almacenamiento de archivos. El agente de IA se activa para cada nuevo documento que llega a la carpeta de entrada o como adjunto en el correo. El trabajo se realiza las 24 horas, sin activación manual.
Qué hace el agente de IA
- Recibe el archivo de la carpeta de entrada del almacenamiento de archivos o del buzón de correo — el activador se dispara ante el evento «nuevo archivo».
- Extrae la capa de texto: OCR para escaneos y fotografías, parsing para PDF y DOCX, texto tal cual para TXT, RTF, EML.
- Clasifica el documento por tipo mediante LLM — contrato, factura, acta de conciliación, documento de personal, propuesta comercial, currículum, extracto bancario, poder notarial.
- Extrae los metadatos clave según el tipo de documento: contraparte, fecha, número, importe para los financieros; nombre completo, cargo, tipo de certificado para los de personal.
- Genera un nombre de archivo comprensible según la plantilla — por ejemplo, «2026-04-24_Договор_ООО-Ромашка_№142.pdf» o «2026-04-24_Счёт_Контур_№СФ-00128.pdf».
- Mueve el archivo a la carpeta de destino según las reglas definidas durante la configuración: /Договоры/2026/Действующие/, /Счета/Входящие/, /Кадры/Документы-сотрудников/Иванов-И-И/.
- Registra el evento en el log: quién es el iniciador, qué tipo fue reconocido, con qué nivel de confianza, adónde fue trasladado, timestamp para auditoría.
- Notifica al gerente responsable cuando el nivel de confianza del reconocimiento es bajo o cuando el tipo de documento no encaja en ninguna de las categorías — el archivo va a la carpeta «Para revisar».
Qué no hace la automatización
- No toma decisiones jurídicas ni financieras sobre el contenido — solo clasifica y distribuye, no firma, no aprueba, no autoriza el pago.
- No verifica la corrección de los datos en el documento: presencia de firma, sello, conformidad con la plantilla. Eso sigue siendo trabajo del contador, el abogado o el departamento de calidad.
- No reemplaza el proceso de negocio de aprobación de documentos entrantes. Si un contrato debe pasar por el abogado y el director financiero, el circuito de aprobación vive en un sistema separado, y la Distribución solo garantiza que el documento esté donde puedan encontrarlo.
Como funciona
La clasificación de documentos se construye sobre tres capas: disparador en el almacenamiento de archivos, procesamiento del archivo mediante un agente LLM, y escritura del resultado de vuelta al almacenamiento. El stack low-code permite ensamblar el pipeline en pocos días sin desarrollar un servicio backend separado.
Flujo técnico
- El disparador en la plataforma low-code o Zapier escucha la carpeta de entrada en Google Drive, Dropbox, OneDrive o S3. Al aparecer un nuevo archivo, transmite su contenido al siguiente paso.
- Paso de extracción de texto: para PDF se utiliza text extraction, para escaneos — OCR (Tesseract, Google Vision, AWS Textract), para formatos de oficina — parsers DOCX y XLSX.
- Paso de clasificación: el texto del archivo se transmite a un modelo de IA con un prompt que describe los tipos de documentos de la empresa y la respuesta JSON esperada de tipo {type, confidence, metadata}.
- Paso de validación: si el confidence está por debajo del umbral establecido, el archivo va a la carpeta «Para revisión» y se crea una tarea en Slack o Notion.
- Paso de nomenclatura: a partir de los metadatos extraídos se genera un nuevo nombre de archivo según la plantilla definida por el negocio.
- Paso de traslado: el archivo se copia a la carpeta de destino, el original se elimina o se mueve al archivo «procesado».
- Paso de registro: entrada en la tabla de Airtable, Google Sheets o Notion para auditoría — fecha, tipo, contraparte, ruta, confidence.
Etapas de implementación
- Semana 1 — discovery. Recopilamos la lista de tipos de documentos de la empresa, la estructura actual de carpetas, las reglas de nomenclatura y los responsables actuales. Registramos los tipos clave que cubren el grueso del flujo entrante.
- Semana 2 — prototipo. Desplegamos el orquestador, conectamos el almacenamiento de archivos, escribimos el prompt de clasificación y probamos en una muestra representativa de documentos reales.
- Semana 3 — configuración de reglas. Ajustamos las plantillas de nombres, el mapping «tipo → carpeta», los umbrales de confidence y el tratamiento de excepciones (documentos no reconocidos, duplicados, archivos vacíos).
- Semana 4 — piloto y lanzamiento. Ejecutamos en el flujo real con control manual paralelo en los primeros días, registramos discrepancias e iteramos el prompt.
Componentes de la solución
Capa | Herramienta | Tarea |
|---|---|---|
Orquestación | plataforma low-code o Zapier | Disparador y pipeline de pasos |
Almacenamiento | Google Drive, Dropbox, OneDrive, S3 | Fuente y destino |
OCR | Google Vision, AWS Textract, Tesseract | Texto de escaneos y fotos |
LLM | modelo de lenguaje | Clasificación y extracción de metadatos |
Log | Airtable, Google Sheets, Notion | Auditoría e informes |
Notificaciones | Slack, email | Escalado de archivos no reconocidos |
Tras la estabilización del pipeline, la solución opera en segundo plano y requiere revisiones periódicas del log en busca de drift de calidad — cuando aparece un nuevo tipo de documento o una contraparte cambia el formato.
Requisitos previos
Antes de lanzar la Clasificación de documentos hay que preparar tres capas: datos, accesos y personas. Sin una de ellas, el piloto se atasca.
Datos y accesos
- Almacenamiento de archivos con API — Google Drive, Dropbox, OneDrive o compatible con S3. Acceso de lectura y escritura a las carpetas correspondientes.
- Carpeta de entrada donde llegan los archivos — ya sea manualmente desde los gestores, mediante integración con el correo, o exportados desde otros sistemas.
- Lista de tipos de documentos que aparecen en el flujo y las reglas de almacenamiento — aunque en este momento solo existan en la cabeza del office manager.
- Muestras de cada tipo — varios archivos reales para configurar el clasificador y verificar la calidad en la fase de prototipo.
- Clave API del proveedor LLM (Anthropic para el modelo de IA) y del servicio OCR, si el flujo incluye escaneos.
- Cuenta del motor de workflow (self-hosted o cloud) o Zapier con límite de operaciones suficiente para el volumen mensual esperado.
Preparación del equipo
- Responsable del proceso — office manager, director de operaciones o abogado, que decide qué se considera una clasificación correcta.
- Un ingeniero o integrador que construya el pipeline en el motor de workflow y escriba los prompts — basta con un especialista de nivel middle.
- Consentimiento de usuarios para cambiar la ruta de archivos. Si el equipo archiva documentos manualmente, hay que acordar la nueva estructura antes del lanzamiento, no después.
Cronograma
- Formato de proyecto de fin de semana: 2-4 semanas desde el inicio hasta producción con un ingeniero a dedicación parcial.
- Primera semana — discovery y recopilación de muestras, segunda — prototipo, tercera — configuración y pruebas, cuarta — piloto y lanzamiento con control manual paralelo.
Problemas
- Caos en documentos
- Tareas rutinarias repetitivas
FAQ
¿Cuánto tiempo lleva la implementación?
La Clasificación de documentos se pone en marcha en 2-4 semanas. La primera semana se destina a la recopilación de tipos de documentos y muestras, la segunda — al prototipo en el orquestador, la tercera — a la configuración de reglas y pruebas sobre una muestra real, la cuarta — al lanzamiento piloto con control manual en paralelo. Un ingeniero a tiempo parcial lo gestiona sin necesidad de un equipo externo.
¿Qué hacer si no tenemos un almacenamiento de archivos unificado con API?
Si los documentos entrantes están actualmente en el correo o en un disco local sin un punto de entrada unificado, antes del lanzamiento de la Clasificación hay que elegir un almacenamiento de archivos — Google Drive, Dropbox, OneDrive o S3 son válidos. La migración de archivos antiguos no es obligatoria: la automatización trabaja solo con el nuevo flujo, y el archivo existente permanece en su lugar hasta un proyecto de migración independiente.
¿Cuáles son los riesgos de la clasificación automática y qué puede fallar?
El principal riesgo es la clasificación incorrecta de documentos raros o no estándar. Para estos casos, el pipeline envía el archivo a la carpeta «Para revisión» y notifica al responsable, sin descartarlo ni perderlo. El segundo riesgo es el cambio de formatos por parte de los contratistas; esto se resuelve monitorizando el confidence y actualizando el prompt. La pérdida de datos está descartada: el original se conserva hasta la confirmación de una clasificación exitosa.
¿Es la solución adecuada para nuestro sector?
La Clasificación de documentos funciona de manera universal — en cualquier lugar donde haya un flujo entrante de archivos de tipos mixtos. Casos directos: firmas jurídicas (contratos, poderes notariales, actos judiciales), consultoría (contratos, informes de clientes, NDA), servicios profesionales y agencias (especificaciones técnicas, actas, facturas). Para sectores con documentos específicos — medicina, logística, inmobiliaria — se configura un prompt independiente por tipos.
¿Con qué precisión clasifica documentos el AI?
La calidad de la clasificación depende de la muestra en la fase de configuración. En clases de documentos estándar con un prompt preparado, el modelo de AI muestra una calidad estable en la mayoría de los formularios estándar. Los archivos con baja confianza se envían a revisión manual — una clasificación incorrecta silenciosa no ocurre. Tras el primer mes de funcionamiento, el prompt se ajusta en función de los errores reales y la precisión mejora.
¿Funciona esto con escaneos y fotografías de documentos?
Sí, los documentos escaneados y las fotos de contratos se procesan a través de la capa OCR — Google Vision, AWS Textract o Tesseract para soluciones self-hosted. La calidad depende de la resolución y legibilidad del escaneo; para los archivos de baja legibilidad, el agente los envía directamente a la carpeta «Para revisión». La regla es simple: un documento que una persona no puede leer, el AI tampoco lo clasifica.
Quieres esto en tu negocio?
Reserva una auditoria gratuita — te mostraremos como funcionara esta automatizacion para ti.