Guia
Glosario completo de PDF (de términos básicos a conceptos técnicos)
Glosario práctico de términos PDF, lenguaje de usuario y conceptos técnicos: OCR, compresión, seguridad, estructura de archivo y más.
Glosario completo de PDF
Un PDF (Portable Document Format) es un formato pensado para mantener el diseño de un documento en distintos dispositivos. Este glosario resume términos clave que aparecen en flujos reales de edición, conversión, seguridad y OCR.
Términos comunes (búsquedas de usuario)
- Convertir PDF: pasar desde/hacia PDF (Word, Excel, imagen, etc.).
- Unir PDF: combinar varios archivos en uno.
- Dividir PDF: separar páginas en archivos independientes.
- Comprimir PDF: reducir tamaño de archivo.
- Editar PDF: modificar texto, imágenes o páginas.
- Firmar PDF: agregar firma digital o electrónica.
- PDF rellenable: formulario con campos editables.
- Escanear a PDF: digitalizar papel.
- OCR PDF: extraer texto de un PDF escaneado.
- Proteger PDF con contraseña: restringir apertura/edición.
- Aplanar PDF: convertir capas/campos en contenido fijo.
- Anotar PDF: resaltar, comentar, subrayar.
- Redactar PDF: ocultar y eliminar datos sensibles.
- Rotar PDF: cambiar orientación de página.
- Recortar PDF: ajustar márgenes/área visible.
Conceptos técnicos esenciales
- PDF nativo: archivo con texto real y seleccionable.
- PDF escaneado: archivo basado en imagen, sin texto real.
- Capa de texto: nivel que permite buscar/copiar contenido.
- Objeto PDF: unidad interna (texto, imagen, fuente, etc.).
- xref: tabla de referencias cruzadas para ubicar objetos.
- Trailer: bloque final con metadatos y referencia raíz.
- Linearized PDF: optimizado para carga progresiva web.
- PDF/A: variante para archivado de largo plazo.
- Tagged PDF: PDF con estructura semántica para accesibilidad.
- Compresión lossless: reduce tamaño sin perder información.
- Compresión lossy: reduce más, con pérdida de calidad.
OCR y conversión
- OCR (Optical Character Recognition): convierte texto en imagen a texto editable.
- Post-OCR QA: revisión de calidad tras reconocimiento.
- Orden de lectura: secuencia en que se interpreta el contenido.
- Reconstrucción de tablas: recuperación de filas/columnas.
- Preservación de layout: mantener diseño al convertir.
Seguridad y cumplimiento
- Cifrado PDF: protección criptográfica del archivo.
- Permisos PDF: reglas de copiar, imprimir, editar.
- Firma digital: firma con validez criptográfica.
- Firma electrónica: aceptación electrónica sin necesariamente criptografía avanzada.
- PII (datos personales): información sensible que debe protegerse.
Accesibilidad
- Texto alternativo (alt text): descripción de imágenes para lectores de pantalla.
- Lectura en voz alta (TTS): síntesis de voz sobre texto digital.
- Contraste: diferencia visual clave para legibilidad.
- Navegación por encabezados: estructura para lectura asistida.
Problemas frecuentes y su término técnico
- “No puedo seleccionar texto” -> PDF escaneado sin OCR.
- “Se desordena al convertir” -> pérdida de layout / mapeo de objetos.
- “No encuentra palabras” -> sin capa de texto.
- “Pesa demasiado” -> compresión ineficiente o multimedia incrustada.
- “No me deja editar” -> permisos/restricciones de seguridad.
Mini FAQ
¿Todos los PDF son editables?
No. Depende de tipo de PDF, permisos y calidad del archivo.
¿OCR siempre es necesario?
Solo cuando el PDF no tiene texto real (normalmente escaneos).
¿PDF/A es mejor que PDF normal?
Es mejor para archivado y compliance, no necesariamente para edición diaria.
¿Por qué un PDF se ve bien pero no se puede buscar?
Porque puede ser una imagen con apariencia de texto, sin capa textual.
Este glosario está pensado como referencia viva para equipos que trabajan con PDF todos los días.