OCRmyPDF 15 lançado com várias melhorias de desempenho

E foi lançado o OCRmyPDF 15 com várias melhorias de desempenho. Confira as novidades dessa atualização e veja como instalar no Linux.

O OCRmyPDF adiciona uma camada de texto OCR aos arquivos PDF digitalizados, permitindo que eles sejam pesquisados ​​ou copiados e colados.

Principais características do OCRmyPDF:

  • Gera um arquivo PDF/A pesquisável a partir de um PDF normal
  • Coloca o texto OCR com precisão abaixo da imagem para facilitar a cópia/cola
  • Mantém a resolução exata das imagens incorporadas originais
  • Quando possível, insere informações de OCR como uma operação “sem perdas” sem interromper qualquer outro conteúdo
  • Otimiza imagens PDF, muitas vezes produzindo arquivos menores que o arquivo de entrada
  • Se solicitado, enquadra e/ou limpa a imagem antes de executar o OCR
  • Valida arquivos de entrada e saída
  • Distribui o trabalho em todos os núcleos de CPU disponíveis
  • Usa o mecanismo Tesseract OCR para reconhecer mais de 100 idiomas
  • Mantém seus dados privados privados.
  • Dimensiona corretamente para lidar com arquivos com milhares de páginas
  • Testado em batalha em milhões de PDFs

Novidades do OCRmyPDF 15

OCRmyPDF 15 lançado com várias melhorias de desempenho
OCRmyPDF 15 lançado com várias melhorias de desempenho

Uma grande atualização do OCRmyPDF já está disponível, o projeto de código aberto que pode funcionar em PDFs digitalizados e outros documentos PDF para adicionar uma camada de texto de reconhecimento óptico de caracteres (OCR) aos arquivos para permitir que eles sejam pesquisados ou copiados e colados.

O OCRmyPDF facilita muito o trabalho com arquivos de texto PDF digitalizados e agora com o OCRmyPDF v15 é ainda melhor. Para completar, o OCRmyPDF 15 atualiza seus requisitos Python e várias dependências.

Esta versão também decidiu abandonar o suporte para Windows e Linux de 32 bits – agora apenas sistemas operacionais de 64 bits são suportados, com base no fato de que muitas de suas dependências passaram a ser apenas de 64 bits.

Além disso, o OCRmyPDF continua a usar o Tesseract como mecanismo de OCR.

OCRmyPDF 15 também traz várias melhorias de desempenho, atualizações para seu pacote Snap e corrige bugs decorrentes de PDFs onde apenas uma pequena parte de uma imagem em uma página representa um DPI/resolução mais alto.

Para saber mais sobre essa versão do OCRmyPDF 15, acesse a nota de lançamento.

Como instalar ou atualizar o OCRmyPDF

Para instalar a versão mais recente do OCRmyPDF nas principais distribuições Linux, use um dos comandos abaixo:

Sistema operacionalCommando de instalaçao
Debian, Ubuntuapt install ocrmypdf
Windows Subsystem for Linuxapt install ocrmypdf
Fedoradnf install ocrmypdf
macOS (Homebrew)brew install ocrmypdf
macOS (nix)nix-env -i ocrmypdf
LinuxBrewbrew install ocrmypdf
FreeBSDpkg install py-ocrmypdf
Condaconda install ocrmypdf
Ubuntu Snapsnap install ocrmypdf

Para todos os outros, consulte essa documentação para obter as etapas de instalação.

Sobre o Edivaldo Brito

Edivaldo Brito é analista de sistemas, gestor de TI, blogueiro e também um grande fã de sistemas operacionais, banco de dados, software livre, redes, programação, dispositivos móveis e tudo mais que envolve tecnologia.