Etiqueta: #python
-
OCR Platform — Extracción inteligente de documentos PDF
Plataforma production-ready de OCR que extrae texto, tablas y datos estructurados de documentos PDF usando Google Gemini 2.5 Flash. Incluye pipeline RAG para consultas en lenguaje natural sobre documentos procesados.
-
Python-OCR — Sistema OCR con Tesseract, Streamlit y Docker
Sistema OCR moderno y escalable para extraer texto de imágenes y PDFs usando Tesseract-OCR. Interfaz web con Streamlit, 100% dockerizado, con arquitectura limpia, principios SOLID y TDD.