<div dir="ltr">Hello,<br><div>I am trying to run a calculation on a 2D slab with a bit of adsorbate (119 atoms in total), and I would like to parallelize it as much as possible. I am using a 3 3 1 Monkhorst-Pack grid (so I have 5 k-points). </div><div>I tried using -npool 5 -nt 4 using 20 MPI processes and 5 threads per process but, as it seems, the speedup was just 3.7x:</div><div>   PWSCF        :   1d 4h27m CPU      7h43m WALL<br></div><div>What could have gone wrong, is there anything "obvious" I can do to diagnose the problem? I am using QE 6.4rc, compiled with gcc and OpenMPI, without ELPA.<br></div><div><br></div><div>Best regards,</div><div><br></div><div>Michal Krompiec</div><div><br></div><div>Merck KGaA and University of Southampton</div></div>