OpenBLAS 0.3.24 lançado com detecção de Apple M2, e mais

E foi lançado o OpenBLAS 0.3.24 com detecção de Apple M2, e mais. Confira as novidades dessa importante atualização.

OpenBLAS é uma implementação de código aberto das APIs BLAS e LAPACK com muitas otimizações feitas à mão para tipos de processadores específicos. É desenvolvido no Laboratório de Software Paralelo e Ciência Computacional, ISCAS.

O OpenBLAS é conhecida por sua ampla variedade de otimizações de processador, pois adiciona implementações otimizadas de núcleos de álgebra linear para várias arquiteturas de processador, incluindo Intel Sandy Bridge e Loongson.

Ele afirma alcançar um desempenho comparável ao Intel MKL: isso é verdade principalmente na parte BLAS, enquanto a parte LAPACK fica para trás.

Em máquinas que suportam o conjunto de instruções AVX2, o OpenBLAS pode obter desempenho semelhante ao MKL, mas atualmente quase não há bibliotecas de código aberto comparáveis ​​ao MKL em CPUs com o conjunto de instruções AVX512.

Agora, uma nova versão do OpenBLAS já está disponível, OpenBLAS 0.3.24.

Novidades do OpenBLAS 0.3.24

OpenBLAS 0.3.24 lançado com detecção de Apple M2, e mais

Sim. OpenBLAS 0.3.24 agora está disponível para esta mais recente implementação de código aberto BLAS e LAPACK, conhecida por suas otimizações avançadas de CPU e ajuste extensivo para fornecer kernels de álgebra linear muito rápidos.

OpenBLAS 0.3.24 foi lançado no domingo com muitas correções, suporte aprimorado ao compilador NVIDIA HPC, suporte de compilação LLVM 17 incluindo seu compilador Flang Fortran, detecção de modelo de CPU para Intel Alder Lake N, várias correções/melhorias Intel Sapphire Rapids, modelo de CPU automático detecção para processadores Apple M2, várias correções ARMv8, detecção ABI para LoongArch64 e várias correções RISC-V.

O trabalho do compilador NVIDIA HPC inclui suporte nas compilações CMake do OpenBLAS, suporte para construção de kernels AVX-512 com este compilador NVIDIA e também suporte para construção de kernels Arm SVE com este compilador.

Os processadores Intel Xeon Scalable Sapphire Rapids agora desfrutam da ativação do bloco AMX para o kernel SBGEMM, detecção em tempo de execução de Sapphire Rapids no caminho do código DYNAMIC_ARCH e muito mais.

Para saber mais sobre essa versão do OpenBLAS, acesse a nota de lançamento.

Como instalar ou atualizar o OpenBLAS

Para instalar a versão mais recente do OpenBLAS, você precisa baixar o código fonte na página do projeto no GitHub e compilá-lo.

Deixe um comentário

Sair da versão mobile