Dear Lorenzo Paulatto & Sitangshu Bhattacharya,<br />​Thanks for your suggestions.<br />​I did try to check the computing performance with respect to no of processors for a ten atom unit. I found that computation time is minimum for 8 processors (k 4 4 4) and increases on moving on either side. Similarly, varying -nk and -ni from 1 - 8 for -np 8 also does not effect the performance much. <br />Looking forwarward for your further help. Am I missing something here ? Following is the typical command I use.<pre>mpirun -np 8 ./pw.x -ni 8 <my.inp>my.out
</pre>thanks<br />Amar<br>