Etiqueta: #ocr
-
OCR Platform — Extracción inteligente de documentos PDF
Plataforma production-ready de OCR que extrae texto, tablas y datos estructurados de documentos PDF usando Google Gemini 2.5 Flash. Incluye pipeline RAG para consultas en lenguaje natural sobre documentos procesados.
-
Go-OCR — Servicio web ligero de OCR con Go y Tesseract
Sistema OCR completo para extraer texto de documentos PDF e imágenes usando Tesseract, con arquitectura limpia, API REST en Go y frontend moderno en React + TypeScript. Desplegable con Docker.
-
Python-OCR — Sistema OCR con Tesseract, Streamlit y Docker
Sistema OCR moderno y escalable para extraer texto de imágenes y PDFs usando Tesseract-OCR. Interfaz web con Streamlit, 100% dockerizado, con arquitectura limpia, principios SOLID y TDD.