Como processar imagens ou arquivos PDF para um livro digital

Este guia irá mostrar como, a partir de imagens digitalizadas ou fotografadas, ou documentos PDF imagens pode criar um arquivo PDF com o ebook real qualidade, com melhor contraste, páginas separadas e em tamanho real, sem sombra de reboco e capacidade de pesquisar e copiar texto. Importantemente, o resultado final depende muito da qualidade das imagens que são submetidos ao processo, por isso é importante para os manter em boa qualidade.

Conteúdo

Passos
Dicas

passos

Converte imagens. No caso em que as imagens não podem ter, mas um arquivo PDF, a imagem é primeiro necessário convertê-los. Para isso, será utilizado o programa PDF-XChange versátil e livre (ver link para download nas referências). Depois de abrir o arquivo, vá para o menu Arquivo gt; exportação gt; Exportação para a imagem. Na caixa de diálogo que sai pode ser configuradas várias opções, incluindo um intervalo de páginas para exportar, e o formato ea qualidade das imagens. Se o arquivo já está em preto e branco, a minha recomendação é para selecionar o formato PNG e o Tipo de Opções de Imagem está definido como Preto&Branco. Se o arquivo estiver em tons de cinza ou de cor, eu recomendo o formato JP (E) G qualidade entre 55 e 75. É importante verificar cuidadosamente as pastas e arquivos nomes de destino, porque eles precisam para colocá-los no futuro.

Processa as imagens. O segundo passo é a transformação das imagens. Todos devem ser colocados na mesma pasta e ordem alfabética de acordo com a sua ordem no livro. Em seguida, o ScanTailor (link para download nas referências), que é o que faz a maior parte do trabalho aqui ferramenta é usada. O programa abre e clique em Arquivo gt; Novo projeto. Ao encomendar a pasta de entrada procuram aquela em que Imagens- neste momento é possível deixar de fora o projeto de algumas imagens.

Uma vez que as imagens são carregadas, você vai notar que há cinco passos no canto superior esquerdo. Estas podem ser feitas uma a uma ou em bloco para cinco (etapa seis requer que outros têm feito anteriormente). Cada uma dessas etapas pode ser corrigido manualmente para cada imagem após o processamento automático. Dependendo da velocidade do processador e a quantidade de imagens, este processo pode levar um tempo considerável, por isso recomenda-se que a primeira vez que é feito com um pequeno livro (ou uma fração de um livro), a fim de experimentar. Há um guia no You Tube sobre o uso ScanTailor- é em Inglês, mas as imagens são muito descritivo. Uma vez que o guia é dar uma revisão de todas as funções que ele pode ser um pouco esmagadora, mas geralmente apenas alguns dos recursos são usados.

Converter em PDF. O que se segue é processado converter imagens em um arquivo PDF e enviá-lo para um reconhecimento de caracteres olho (OCR Inglês). Isto pode ser feito através de vários métodos-que eu conheço e recomendo colocá-los abaixo. Melhor, para ser melhor reconhecimento de texto, você está usando software comercial ABBYY FineReader. Caso contrário, os únicos programas livres são usados com um resultado muito bom também.

Com ABBYY FineReader

Fazer a conversão usando o ABBYY FineReader. ABBYY FineReader abre e clique em Abrir. Na caixa de diálogo, a pasta onde as imagens já são processados por ScanTailor (por padrão, estão em uma nova pasta "Out" no mesmo lugar de onde foram importados) é selecionada. Não deve selecionar todas as imagens. Antes de dar clique em "Abrir", fazemo-lo no botão "Opções" para se certificar de que as línguas estão processando o documento. Finalmente, você deve desativar na primeira caixa de diálogo ( "Abrir Imagem") as caixas "Detectar a orientação" e "Dividir páginas opostas", como isso tem sido feito no processamento ScanTailor e tente novamente aqui poderia causar problemas. Nós aceitamos e o processo de leitura deve iniciar automaticamente. Se não, nós clique em "Leia".

Criar o arquivo PDF. Depois de reconhecido o texto do documento deve construir o PDF. Para isso, você deve clicar no botão "Save" (certifique-se de que a opção "Exact Copy" é selecionado). No local "Salvar como" e nome do novo PDF- antes de ceder para salvar o arquivo for selecionado, a caixa de diálogo "Opções" é aberta e é importante para selecionar o tamanho original da imagem é usada. Na configuração de imagens "Custom" é selecionado. Na minha experiência, as configurações de melhor tamanho de arquivo bom garantia preservando a qualidade são: manter a resolução da imagem original e perda de qualidade permitem a sair em 10%. Estas definições podem ser alteradas e salvar arquivos diferentes para comparar em qualidade e tamanho.

Usando DjVuToy Maker e OCR

Faça a conversão de arquivos DJVU. O primeiro neste método é converter as imagens para o formato DJVU, que é um formato de arquivo projetado especialmente para livros e outros documentos digitalizados. Infelizmente, uma vez que é um esforço que não é suportado por qualquer grande empresa, não é suportado pela maioria dos leitores digitais, embora haja aplicações para todos os sistemas operacionais de desktop e laptops. Para isso, precisamos de uma ferramenta chamada DjVuToy Maker. Uma vez aberto, vá até a aba "Maker" e no "1. pasta ou arquivo de origem "nós clique no primeiro botão uma vez para selecionar todas as imagens em uma pasta. O segundo botão permite selecionar um único arquivo para converter (se selecionado aqui várias um arquivo DJVU será criado para cada imagem). Você deve selecionar a pasta "Out" onde os arquivos são processados por ScanTailor. Na secção "3. arquivo DjVu Target "pode mudar o nome do arquivo resultante (por padrão, o mesmo que a pasta de arquivo, neste caso," Out "). Por fim, clique em "Go".

Quando você já tem o arquivo DjVu, você vá para a aba "Para PDF" e no "arquivo DjVu a ser convertido" o arquivo recém-criado DJVU está selecionado e clique em "Go".

Reconhece texto PDF com a ferramenta de reconhecimento ocular. Já tendo o arquivo PDF, você precisa enviá-lo para o reconhecimento de caracteres ocular. Para isso, abra o arquivo no PDF-XChange Viewer mencionado na primeira etapa e clique no botão "OCR" ou no menu Documento gt; páginas de OCR. Na tabela pode ser selecionada se você reconhece uma ou mais páginas, a entrada de documentos língua principal Inglês, Francês, Alemão e Espanhol (mais idiomas estão disponíveis na página do programa) e precisão (baixa, média ou alta) do qual depende da velocidade de reconhecimento. Adobe Acrobat Pro também tem a função de OCR, mas, ao contrário XChange, reconstrói o arquivo resultante geralmente em um aumento significativo no tamanho, enquanto XChange só aumenta a camada de texto oculto, mantendo a compressão imagens e aumentando o tamanho pesa apenas de modo a camada de texto.

dicas

Na maioria dos casos, este método também permite uma redução drástica no tamanho do ficheiro PDF, mesmo nos casos em que as imagens são processadas bem. Basta ignorar o processamento com ScanTailor que, aliás, é o mais demorado e tedioso.
Para transformar um arquivo DJVU sob as mesmas condições, altere o primeiro passo (imagens de extrair com XChange) e usar o utilitário "a imagem" de DjVuToy.
No geral, uma grande ferramenta para lidar com PDF (separá-los, juntá-los, adicionar marcas d`água e uma alternativa para extrair imagens, entre outras funções) é Ferramentas PDFill, cujo link está abaixo.

Como processar imagens ou arquivos pdf para fazer um livro digital

passos

dicas