E o VMware ESXi teve uma regressão de desempenho com o kernel 5.13, o que prova que nem sempre uma atualização de kernel pode ser boa para todos.
A VMware descobriu que o kernel Linux 5.13, lançado como estável há um mês, levou a uma séria regressão de desempenho para seu hipervisor empresarial ESXi.
VMware ESXi teve uma regressão de desempenho com o kernel 5.13
É isso mesmo. A VMware descobriu que há uma grande regressão de desempenho com o Linux 5.13 em seu software ESXi.
Eles descobriram que as cargas de trabalho de computação do ESXi poderiam ser afetadas em até 3x, enquanto as cargas de trabalho de rede estavam em uma regressão de apenas 40%.
Suas tarefas de computação eram tão simples quanto os tempos de compilação do kernel do Linux, que foram severamente afetados.
Os engenheiros da VMware descobriram que essa regressão de desempenho muito significativa veio de uma mudança no agendador…
Embora o patch em questão “sched: Move SCHED_DEBUG sysctl to debugfs” pareça um tanto mundano, ele acabou impactando o valor padrão de sched_wakeup_granularity_ns
.
Alterar a granularidade de ativação do agendador padrão de 15 ms para 4 ms (e a granularidade mínima de 10 ms para 3 ms) está fazendo com que as cargas de trabalho de computação e rede sejam prejudicadas significativamente, pelo menos no ESXi.
A crença é que esses novos valores mais baixos por padrão estão causando mais preempção e interrupções involuntárias.
Os detalhes podem ser encontrados nesta postagem da lista de discussão.
A VMware agora está buscando informações sobre por que essa alteração padrão ocorreu, se foi mesmo intencional e se pode ser alterado de volta para o padrão anterior, devido ao grave impacto no desempenho que estão observando nesta última compilação de kernel estável.
Fora de seu hipervisor ESXi, não ouvi falar do Linux 5.13 causando qualquer impacto grave no desempenho, nem vi tal em meus testes em muitos sistemas diferentes, embora não focado em ambientes virtualizados.