Reparar PDF
Algunos PDF se rompen en tránsito. Algunos al subir. Algunos en almacenamiento archivado.
Intentamos guardar lo que se pueda — y te decimos honestamente qué no se pudo.
Arrastra tu PDF dañado aquí
Totalmente reparado
Bajo — recuperación limpia
pdf-lib cargó tu archivo con cero advertencias del analizador. La salida debería renderizarse de forma idéntica a un PDF no roto.
Parcialmente recuperado
Medio — algo de contenido afectado
Algunos objetos se omitieron durante el análisis. La salida es utilizable pero verifica que coincida con tus expectativas. El inventario de advertencias a continuación muestra qué se vio afectado.
Ver advertencias del analizador (0)
Solo recuperación estructural
Alto — renderización de contenido incierta
La herramienta reconstruyó una cabecera faltante antes de cargar. La estructura del archivo es válida pero la renderización del contenido es incierta. Si la salida no se muestra correctamente, prueba PDF a Texto para extracción de contenido.
Ver advertencias del analizador (0)
Sobre la reparación de PDF
Cómo se rompen los PDF normalmente
El truncamiento en tránsito por correo es la causa más común: los servidores SMTP cortan los archivos adjuntos grandes a mitad de archivo, dejando el PDF sin sus bytes finales. Las interrupciones de red durante la descarga producen la misma forma. Los errores de firmware de escáneres (Xerox, Canon, HP) escriben tablas xref malformadas — el documento es estructuralmente inválido pero el contenido de la página está intacto. Los PDF archivados de 1998-2003 usaban cabeceras pre-aclaración de la especificación que los analizadores estrictos ahora rechazan. Los PDF concatenados con basura de rebotes del sistema de correo son sorprendentemente comunes. Cada una de estas clases tiene un camino de recuperación; la herramienta informa cuál se aplicó y qué tan completo es el resultado.
Qué se puede reparar
El modo de análisis tolerante de pdf-lib maneja cinco clases de corrupción de forma nativa: basura entre objetos indirectos, secciones xref faltantes, dictámenes de tráiler faltantes, referencias Root de catálogo rotas (la herramienta reescanea el documento en busca de un catálogo válido) y objetos indirectos inválidos (la herramienta los omite y continúa). Para una firma de cabecera PDF faltante, la herramienta escanea los primeros 1024 bytes en busca de una firma incrustada y reintenta la carga desde allí. Las estructuras personalizadas no estándar del firmware de escáneres antiguos a menudo se analizan limpiamente porque el modo tolerante es intencionalmente permisivo.
Qué no podemos reparar
Los PDF cifrados sin la contraseña no se pueden reparar — el contenido del archivo está cifrado junto con los metadatos estructurales. Quita la contraseña en tu software de PDF primero y luego súbelo. Los archivos que no son PDF en absoluto (por ejemplo, archivos de texto o imagen renombrados a .pdf) se detectan en el pre-vuelo verificando los bytes mágicos %PDF. Los archivos donde el analizador se detiene por completo (típicamente truncamientos grandes que pierden >50% de bytes) no se pueden salvar estructuralmente. Para casos de pérdida total irreparable, PDF a Texto aún puede extraer cualquier contenido de texto plano como último recurso.
Tres modos de resultado explicados
Totalmente reparado significa que pdf-lib cargó el documento limpiamente con cero advertencias del analizador — el PDF de salida debería renderizarse de forma idéntica a un PDF no roto. Parcialmente recuperado significa que pdf-lib emitió al menos una advertencia durante el análisis (objetos inválidos omitidos, referencias rotas recuperadas) — la salida es utilizable pero algunos objetos pueden haberse perdido; el inventario de advertencias muestra cuáles. Solo recuperación estructural significa que la herramienta tuvo que reconstruir una cabecera faltante antes de cargar — la estructura del archivo es válida pero la renderización del contenido es incierta; considera PDF a Texto como alternativa si el contenido no se renderiza correctamente. Después de cualquier resultado exitoso, Comprimir PDF puede ayudar si el tamaño del archivo importa antes de compartir.
Por qué importa la reparación solo en navegador
Los PDF dañados a menudo contienen el contenido que más quieres recuperar — estados financieros truncados a mitad de transferencia, borradores legales de un escáner que falló, registros archivados de un sistema desaparecido. Subir esos a un servidor de terceros en el momento exacto en que no puedes abrirlos añade riesgo: no sabes qué hay dentro de los bytes dañados, y el servidor tampoco. La reparación de pdfmundo se ejecuta completamente en tu navegador a través de pdf-lib. El archivo dañado nunca sale de tu dispositivo. Las herramientas competidoras o bien suben a servidores (Sejda, PDF24) o tienen muros de pago tras suscripciones (PDFCandy, Adobe). pdfmundo se entrega gratis, ilimitado, solo en navegador.
Preguntas frecuentes
- ¿Qué tipos de corrupción se pueden reparar?
- El modo de análisis tolerante de pdf-lib cubre cinco clases de corrupción de forma nativa: basura entre objetos indirectos, secciones xref faltantes, dictámenes de tráiler faltantes, referencias de catálogo rotas y objetos indirectos inválidos. La herramienta añade dos rutas de recuperación más: detección previa al vuelo de archivos no PDF y un reintento de reconstrucción de cabecera que escanea los primeros 1024 bytes en busca de una firma PDF mal colocada. Los archivos con cifrado que no puedes descifrar o con destrucción total de contenido no se pueden reparar.
- ¿La reparación perderá algo de mi contenido?
- Totalmente reparado significa cero pérdida de contenido — la salida se renderiza de forma idéntica a un PDF no dañado. Parcialmente recuperado significa que algunos objetos inválidos se omitieron durante el análisis — típicamente fuentes o imágenes incrustadas que pdf-lib no pudo decodificar. El contenido de texto de la página normalmente sobrevive. Solo recuperación estructural significa que la herramienta reconstruyó una cabecera faltante antes de cargar — la renderización del contenido es incierta. El inventario de advertencias en el panel de resultados muestra exactamente qué objetos se vieron afectados.
- ¿Por qué no se pueden reparar PDF cifrados?
- El cifrado se aplica sobre la estructura del documento. Sin la contraseña, el Diccionario de Información y los flujos de contenido son ilegibles, incluyendo los metadatos estructurales que la herramienta de reparación necesita para intentar la recuperación. Quita la contraseña en tu software de PDF primero (si la conoces), luego vuelve aquí.
- ¿Qué significa 'parcialmente recuperado'?
- pdf-lib emitió al menos una advertencia del analizador durante la carga — típicamente que un objeto indirecto específico no se pudo analizar (y se omitió), o que una referencia rota se recuperó a un objetivo diferente. El PDF de salida es utilizable pero algunos objetos pueden haberse perdido. El inventario de advertencias en el panel de resultados lista cada advertencia que el analizador emitió, para que puedas verificar qué se vio afectado.
- ¿Mi archivo dañado se sube a tus servidores?
- No. La reparación se ejecuta completamente en tu navegador. El archivo dañado permanece en tu dispositivo. Esto importa específicamente para la reparación: los PDF dañados a menudo contienen el contenido por el que más te preocupas, y las herramientas competidoras o bien suben a servidores o tienen muros de pago. pdfmundo se entrega gratis, ilimitado, solo en navegador.
- ¿Y si el archivo reparado todavía no se abre?
- Algunos PDF están dañados más allá de la recuperación en el navegador. Si el archivo reparado todavía falla al abrir en un lector de PDF: prueba con un lector diferente (Adobe Reader, Vista Previa, el visor integrado de Firefox), o usa PDF a Texto como extracción de contenido de último recurso. PDF a Texto lee en un nivel de abstracción diferente y puede recuperar contenido de texto plano incluso cuando falla la renderización completa de PDF.
- ¿Qué tamaño de archivo puedo reparar?
- Hasta 50 MB. El mismo límite que Editar metadatos, Recortar PDF, Reordenar páginas, Rotar, Eliminar páginas, Extraer páginas, Números de página y Marca de agua. Para archivos dañados de más de 50 MB, la restricción es la memoria del navegador: el costo de análisis de pdf-lib escala con el tamaño del archivo, y el motor en navegador se vuelve poco fiable por encima del límite.
- ¿Cuál es la diferencia entre 'totalmente reparado' y 'parcialmente recuperado'?
- Totalmente reparado significa cero advertencias de pdf-lib durante la carga. Parcialmente recuperado significa que al menos una advertencia se disparó — el analizador encontró algo que no pudo manejar completamente pero lo rodeó. Ambos producen un PDF de salida utilizable; parcialmente recuperado solo señala que deberías verificar que el contenido coincide con tus expectativas. El inventario de advertencias muestra qué se vio afectado específicamente.
Más herramientas PDF, próximamente
30+ herramientas en total — unir, dividir, convertir, OCR, firmar, marca de agua y más. Todas gratis para probar.
Volver al inicio →