Dear Friends,<br />​I am trying to vc-relax a 40 atom supercell using a 40 processor/256GB RAM (Dell 7910) computer equipped with open-mpi. Following is the command I used to run the QE<br />​mpirun pw.x -np 40 < XXX.in > XXX.out<br /><br />​​I noticed that the processing speed is slightly better than single processor, but nowhere close to expected 30 - 40 times. Also the dynamic RAM allocated per process is ~ 950 MB (total ~ 39 GB), the rest > 210 GB remains unused. <br /><br />​Will be thankful if someone can point out if I am doing anything wrong or for any suggestion to improve the performance of the system.<br /><br />thanks<br />​Amar, DMJR Univ. Chennai<br>