<div>Hello,</div><div> </div><div>I have an access to IBM Power9 cluster with 6 V100 GPUs cores/node, and 40 CPU cores/node. I have a CPU version of QE-6.7 running, but I would like to explore GPU version.</div><div> </div><div>We have Nvidia compilers installed (PGI 21.2, cuda 11.1, ESSL 6.2).  When I ran congifure script, in the way described on Wiki page for QE-GPU, it creates 'make.inc' file with internal FFTW and USE_CUSOLVER. Also, configure give blas/lapack libraries from PGI.</div><div> </div><div>Is it the way it should be? I see that there are cublas, cufft and other cuda libraries, but can they be used in QE? ESSL also has "libesslsmcuda" library, but I don't know if it is relevant. All examples on QE-GPU Wiki page seems to be outdated, or I may be wrong.</div><div> </div><div>Also, since every computing node has 6 GPUs, I could use CUDA-aware MPI (enabled with __GPU_MPI flag). Should I provide OMP_NUM_THREADS variable (=40), to utilize CPU cores? BTW, configure script for some reason does not activate OpenMP (even if --enable-openmp) is used.</div><div> </div><div>Thanks,</div><div> Sergey</div>