Question 1

Onde meu PDF é processado?

Accepted Answer

Inteiramente dentro da aba do navegador. Usamos o pdf.js da Mozilla para ler a camada de texto do PDF. Nada é enviado para o nosso servidor.

Question 2

Por que meu PDF com várias colunas produz texto intercalado?

Accepted Answer

O pdf.js retorna os itens de texto na ordem em que aparecem no fluxo interno do PDF, que em layouts multicoluna pode intercalar as colunas pela posição vertical. Para extração que preserve a ordem de leitura por colunas, use PDF→Word — ele tem lógica dedicada de detecção de colunas.

Question 3

E se meu PDF for uma imagem digitalizada sem camada de texto?

Accepted Answer

Então não há texto para extrair. Detectamos isso e oferecemos um link para nossa ferramenta OCR PDF, que adiciona uma camada de texto a PDFs só de imagem. Rode OCR primeiro, depois volte para extrair texto.

Question 4

E se meu PDF tiver senha?

Accepted Answer

A ferramenta avisará. Remova a senha no seu software de PDF primeiro e depois extraia o texto.

Question 5

A formatação será preservada?

Accepted Answer

Não. A saída em texto puro não tem formatação: sem negrito, itálico, tamanhos de fonte ou títulos. Para extração com formatação e layout, use PDF→Word.

Question 6

Que codificação a saída usa?

Accepted Answer

UTF-8 sempre. Sem perda para qualquer PDF com caracteres Unicode, incluindo emoji, CJK, cirílico, grego, árabe, etc.

Question 7

Qual o tamanho máximo?

Accepted Answer

50 MB e 50 páginas no grátis; 250 MB e 5.000 páginas no Pro.

Question 8

Preciso de conta?

Accepted Answer

Não. A ferramenta é totalmente gratuita sem cadastro.

Converter PDF para Texto

Opções de extração

Extraia documentos maiores e em lote com o Pro

Sobre a extração de PDF para Texto

Perguntas frequentes

Mais ferramentas PDF