Como processar imagens ou arquivos pdf para fazer um livro digital

Este guia irá mostrar como, a partir de imagens digitalizadas ou fotografadas, ou documentos PDF imagens pode criar um arquivo PDF com o ebook real qualidade, com melhor contraste, páginas separadas e em tamanho real, sem sombra de reboco e capacidade de pesquisar e copiar texto. Importantemente, o resultado final depende muito da qualidade das imagens que são submetidos ao processo, por isso é importante para os manter em boa qualidade.

Conteúdo

passos

1
Converte imagens. No caso em que as imagens não podem ter, mas um arquivo PDF, a imagem é primeiro necessário convertê-los. Para isso, será utilizado o programa PDF-XChange versátil e livre (ver link para download nas referências). Depois de abrir o arquivo, vá para o menu Arquivo gt; exportação gt; Exportação para a imagem. Na caixa de diálogo que sai pode ser configuradas várias opções, incluindo um intervalo de páginas para exportar, e o formato ea qualidade das imagens. Se o arquivo já está em preto e branco, a minha recomendação é para selecionar o formato PNG e o Tipo de Opções de Imagem está definido como Preto&Branco. Se o arquivo estiver em tons de cinza ou de cor, eu recomendo o formato JP (E) G qualidade entre 55 e 75. É importante verificar cuidadosamente as pastas e arquivos nomes de destino, porque eles precisam para colocá-los no futuro.


  • 2
    Processa as imagens. O segundo passo é a transformação das imagens. Todos devem ser colocados na mesma pasta e ordem alfabética de acordo com a sua ordem no livro. Em seguida, o ScanTailor (link para download nas referências), que é o que faz a maior parte do trabalho aqui ferramenta é usada. O programa abre e clique em Arquivo gt; Novo projeto. Ao encomendar a pasta de entrada procuram aquela em que Imagens- neste momento é possível deixar de fora o projeto de algumas imagens.
  • Uma vez que as imagens são carregadas, você vai notar que há cinco passos no canto superior esquerdo. Estas podem ser feitas uma a uma ou em bloco para cinco (etapa seis requer que outros têm feito anteriormente). Cada uma dessas etapas pode ser corrigido manualmente para cada imagem após o processamento automático. Dependendo da velocidade do processador e a quantidade de imagens, este processo pode levar um tempo considerável, por isso recomenda-se que a primeira vez que é feito com um pequeno livro (ou uma fração de um livro), a fim de experimentar. Há um guia no You Tube sobre o uso ScanTailor- é em Inglês, mas as imagens são muito descritivo. Uma vez que o guia é dar uma revisão de todas as funções que ele pode ser um pouco esmagadora, mas geralmente apenas alguns dos recursos são usados.
  • 3


    Converter em PDF. O que se segue é processado converter imagens em um arquivo PDF e enviá-lo para um reconhecimento de caracteres olho (OCR Inglês). Isto pode ser feito através de vários métodos-que eu conheço e recomendo colocá-los abaixo. Melhor, para ser melhor reconhecimento de texto, você está usando software comercial ABBYY FineReader. Caso contrário, os únicos programas livres são usados ​​com um resultado muito bom também.
  • Com ABBYY FineReader
  • Fazer a conversão usando o ABBYY FineReader. ABBYY FineReader abre e clique em Abrir. Na caixa de diálogo, a pasta onde as imagens já são processados ​​por ScanTailor (por padrão, estão em uma nova pasta "Out" no mesmo lugar de onde foram importados) é selecionada. Não deve selecionar todas as imagens. Antes de dar clique em "Abrir", fazemo-lo no botão "Opções" para se certificar de que as línguas estão processando o documento. Finalmente, você deve desativar na primeira caixa de diálogo ( "Abrir Imagem") as caixas "Detectar a orientação" e "Dividir páginas opostas", como isso tem sido feito no processamento ScanTailor e tente novamente aqui poderia causar problemas. Nós aceitamos e o processo de leitura deve iniciar automaticamente. Se não, nós clique em "Leia".
  • Criar o arquivo PDF. Depois de reconhecido o texto do documento deve construir o PDF. Para isso, você deve clicar no botão "Save" (certifique-se de que a opção "Exact Copy" é selecionado). No local "Salvar como" e nome do novo PDF- antes de ceder para salvar o arquivo for selecionado, a caixa de diálogo "Opções" é aberta e é importante para selecionar o tamanho original da imagem é usada. Na configuração de imagens "Custom" é selecionado. Na minha experiência, as configurações de melhor tamanho de arquivo bom garantia preservando a qualidade são: manter a resolução da imagem original e perda de qualidade permitem a sair em 10%. Estas definições podem ser alteradas e salvar arquivos diferentes para comparar em qualidade e tamanho.
  • Usando DjVuToy Maker e OCR
  • Faça a conversão de arquivos DJVU. O primeiro neste método é converter as imagens para o formato DJVU, que é um formato de arquivo projetado especialmente para livros e outros documentos digitalizados. Infelizmente, uma vez que é um esforço que não é suportado por qualquer grande empresa, não é suportado pela maioria dos leitores digitais, embora haja aplicações para todos os sistemas operacionais de desktop e laptops. Para isso, precisamos de uma ferramenta chamada DjVuToy Maker. Uma vez aberto, vá até a aba "Maker" e no "1. pasta ou arquivo de origem "nós clique no primeiro botão uma vez para selecionar todas as imagens em uma pasta. O segundo botão permite selecionar um único arquivo para converter (se selecionado aqui várias um arquivo DJVU será criado para cada imagem). Você deve selecionar a pasta "Out" onde os arquivos são processados ​​por ScanTailor. Na secção "3. arquivo DjVu Target "pode ​​mudar o nome do arquivo resultante (por padrão, o mesmo que a pasta de arquivo, neste caso," Out "). Por fim, clique em "Go".
  • Quando você já tem o arquivo DjVu, você vá para a aba "Para PDF" e no "arquivo DjVu a ser convertido" o arquivo recém-criado DJVU está selecionado e clique em "Go".
  • Reconhece texto PDF com a ferramenta de reconhecimento ocular. Já tendo o arquivo PDF, você precisa enviá-lo para o reconhecimento de caracteres ocular. Para isso, abra o arquivo no PDF-XChange Viewer mencionado na primeira etapa e clique no botão "OCR" ou no menu Documento gt; páginas de OCR. Na tabela pode ser selecionada se você reconhece uma ou mais páginas, a entrada de documentos língua principal Inglês, Francês, Alemão e Espanhol (mais idiomas estão disponíveis na página do programa) e precisão (baixa, média ou alta) do qual depende da velocidade de reconhecimento. Adobe Acrobat Pro também tem a função de OCR, mas, ao contrário XChange, reconstrói o arquivo resultante geralmente em um aumento significativo no tamanho, enquanto XChange só aumenta a camada de texto oculto, mantendo a compressão imagens e aumentando o tamanho pesa apenas de modo a camada de texto.

  • dicas

    • Na maioria dos casos, este método também permite uma redução drástica no tamanho do ficheiro PDF, mesmo nos casos em que as imagens são processadas bem. Basta ignorar o processamento com ScanTailor que, aliás, é o mais demorado e tedioso.
    • Para transformar um arquivo DJVU sob as mesmas condições, altere o primeiro passo (imagens de extrair com XChange) e usar o utilitário "a imagem" de DjVuToy.
    • No geral, uma grande ferramenta para lidar com PDF (separá-los, juntá-los, adicionar marcas d`água e uma alternativa para extrair imagens, entre outras funções) é Ferramentas PDFill, cujo link está abaixo.
    Artigos Relacionados