Converter PDF para Texto
Extraia o texto de cada página como um único arquivo .txt UTF-8 — no seu navegador.
Intervalos de páginas, sem envios, pronto para copiar e colar.
Opções de extração
Escolha um intervalo de páginas ou deixe vazio para extrair o texto de todas.
Solte mais PDFs para colocar na fila.
Extraia documentos maiores e em lote com o Pro
O plano grátis extrai até 50 páginas por arquivo; o Pro desbloqueia documentos maiores e extração em lote de vários PDFs ao mesmo tempo. Uma única chave desbloqueia todas as ferramentas Pro.
Obter ProJá tem uma chave Pro? Cole aqui
Sobre a extração de PDF para Texto
PDF para Texto lê a camada de texto do PDF e emite um arquivo .txt UTF-8. O plano grátis lida com até 50 páginas; o Pro desbloqueia documentos maiores e conversão em lote. Diferente dos conversores que enviam o PDF para um servidor, a pdfmundo extrai texto localmente com o pdf.js da Mozilla — seu arquivo não sai da aba. PDFs com várias colunas (jornais, artigos acadêmicos em duas colunas) podem produzir texto com as colunas intercaladas; para extração que preserve o layout use PDF→Word. PDFs digitalizados sem camada de texto retornam zero texto — use OCR PDF primeiro para adicionar uma camada de texto.
Perguntas frequentes
- Onde meu PDF é processado?
- Inteiramente dentro da aba do navegador. Usamos o pdf.js da Mozilla para ler a camada de texto do PDF. Nada é enviado para o nosso servidor.
- Por que meu PDF com várias colunas produz texto intercalado?
- O pdf.js retorna os itens de texto na ordem em que aparecem no fluxo interno do PDF, que em layouts multicoluna pode intercalar as colunas pela posição vertical. Para extração que preserve a ordem de leitura por colunas, use PDF→Word — ele tem lógica dedicada de detecção de colunas.
- E se meu PDF for uma imagem digitalizada sem camada de texto?
- Então não há texto para extrair. Detectamos isso e oferecemos um link para nossa ferramenta OCR PDF, que adiciona uma camada de texto a PDFs só de imagem. Rode OCR primeiro, depois volte para extrair texto.
- E se meu PDF tiver senha?
- A ferramenta avisará. Remova a senha no seu software de PDF primeiro e depois extraia o texto.
- A formatação será preservada?
- Não. A saída em texto puro não tem formatação: sem negrito, itálico, tamanhos de fonte ou títulos. Para extração com formatação e layout, use PDF→Word.
- Que codificação a saída usa?
- UTF-8 sempre. Sem perda para qualquer PDF com caracteres Unicode, incluindo emoji, CJK, cirílico, grego, árabe, etc.
- Qual o tamanho máximo?
- 25 MB e 50 páginas no grátis; 100 MB e praticamente sem limite de páginas no Pro.
- Preciso de conta?
- Não. A ferramenta é totalmente gratuita sem cadastro.
Mais ferramentas PDF
Depois do texto pronto, você pode fazer OCR num PDF digitalizado para adicionar uma camada de texto, converter preservando o layout com PDF→Word, ou extrair imagens de páginas com PDF→JPG.
Ver todas as ferramentas