<div dir="ltr"><div>Dear all,</div><div><br></div><div>GPU enabled QE v.6.7 is compiled on a VOLTA card. I am trying to run a vc-relax for a bulk containing 48 atoms. Although diagonalization (davidson) is about 3x faster than CPU, it takes a lot of time (a couple of hours) to compute force and stress. Is this something related to the code itself?</div><div><br></div><div>Best,</div><div><br></div><div>Mohammad Moaddeli</div><div>ShirazU<br></div></div>