E foi lançado o Tesseract 5.2 alguns ganhos de desempenho de CPUs com suporte a AVX-512F. Confira as novidades dessa atualização.
Com o passar do tempo, mais projetos de código aberto estão começando a usar melhor o suporte ao AVX-512, mesmo que ele não esteja mais habilitado nos processadores Alder Lake mais recentes.
Depois de relatar as grandes vitórias do AVX-512 para a análise de JSON com simdjson, outro projeto de código aberto encontrando ganhos é o mecanismo de reconhecimento óptico de caracteres (OCR) Tesseract.
Agora, o Tesseract 5.2 foi lançado na quarta-feira (6/7) como o mais novo lançamento de recurso para este mecanismo de OCR de código aberto que está em desenvolvimento desde os anos 80 com a HP, enquanto na última década e meia foi trabalhado como um projeto de código aberto pelo Google.
Novidades do Tesseract 5.2
O Tesseract continua sendo um dos principais mecanismos de OCR e, com a versão v5.2, pode obter alguns ganhos de desempenho de CPUs com suporte a AVX-512F.
O suporte do AVX-512F para o Tesseract foi fundido no início deste ano com o desenvolvedor encontrando uma redução de cerca de 10% no tempo de execução para o benchmark específico que ele estava usando (lstm_squashed_test).
Embora ele tenha notado que o desempenho do Apple M1 ainda era “muito melhor” do que o desempenho habilitado para Intel AVX-512F, por puxar.
O Tesseract OCR 5.2 também possui melhorias em seu sistema de compilação e CI, melhor manipulação de PDFs muito grandes em sistemas de 32 bits, correção da detecção de Arm NEON no FreeBSD e várias outras melhorias e correções.
Para saber mais sobre essa versão do Tesseract, acesse a nota de lançamento.