<div dir="ltr"><div>This is not a QE problem: the fortran code knows nothing about nodes and cores. It's the software setup for parallel execution on your machine that has a problem.<br><br></div>Paolo<br></div><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Jul 16, 2015 at 2:25 PM, mohaddeseh abbasnejad <span dir="ltr"><<a href="mailto:m.abbasnejad@gmail.com" target="_blank">m.abbasnejad@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><br clear="all"><div>Dear all,</div><div><br></div><div>I have recently installed PWscf (version 5.1) on our cluster (4 nodes, 32 cores).</div><div>Ifort & mkl version 11.1 has been installed.</div><div>When I run pw.x command on every node individually, for both the following command, it will work properly.</div><div>1- /opt/exp_soft/espresso-5.1/bin/pw.x -in <a href="http://scf.in" target="_blank">scf.in</a></div><div>2- mpirun -n 4 /opt/exp_soft/espresso-5.1/bin/pw.x -in <a href="http://scf.in" target="_blank">scf.in</a></div><div>However, when I use the following command (again for each of them, separately),</div><div>3- mpirun -n 8 /opt/exp_soft/espresso-5.1/bin/pw.x -in <a href="http://scf.in" target="_blank">scf.in</a></div><div>it gives me such an error:</div><div><br></div><div><div>[cluster:14752] *** Process received signal ***</div><div>[cluster:14752] Signal: Segmentation fault (11)</div><div>[cluster:14752] Signal code:  (128)</div><div>[cluster:14752] Failing at address: (nil)</div><div>[cluster:14752] [ 0] /lib64/libpthread.so.0() [0x3a78c0f710]</div><div>[cluster:14752] [ 1] /opt/intel/Compiler/11.1/064/mkl/lib/em64t/libmkl_mc3.so(mkl_blas_zdotc+0x79) [0x2b5e8e37d4f9]</div><div>[cluster:14752] *** End of error message ***</div><div>--------------------------------------------------------------------------</div><div>mpirun noticed that process rank 4 with PID 14752 on node cluster.khayam.local exited on signal 11 (Segmentation fault).</div><div>--------------------------------------------------------------------------</div></div><div><br></div><div>This error also exists when I use all the node with each other in parallel mode (using the following command):</div><div>4- mpirun -n 32 -hostfile testhost /opt/exp_soft/espresso-5.1/bin/pw.x -in <a href="http://scf.in" target="_blank">scf.in</a><br></div><div>The error:<br></div><div><br></div><div><div>[cluster:14838] *** Process received signal ***</div><div>[cluster:14838] Signal: Segmentation fault (11)</div><div>[cluster:14838] Signal code:  (128)</div><div>[cluster:14838] Failing at address: (nil)</div><div>[cluster:14838] [ 0] /lib64/libpthread.so.0() [0x3a78c0f710]</div><div>[cluster:14838] [ 1] /opt/intel/Compiler/11.1/064/mkl/lib/em64t/libmkl_mc3.so(mkl_blas_zdotc+0x79) [0x2b04082cf4f9]</div><div>[cluster:14838] *** End of error message ***</div><div>--------------------------------------------------------------------------</div><div>mpirun noticed that process rank 24 with PID 14838 on node cluster.khayam.local exited on signal 11 (Segmentation fault).</div><div>--------------------------------------------------------------------------</div></div><div><br></div><div>Any help will be appreciated.</div><div><br></div><div>Regards,</div><div>Mohaddeseh</div><div><br></div><div>---------------------------------------------------------<br><br>Mohaddeseh Abbasnejad, <br>Room No. 323, Department of Physics, <br>University of Tehran, North Karegar Ave.,<br>Tehran, P.O. Box: 14395-547- IRAN <br>Tel. No.: <a href="tel:%2B98%2021%206111%208634" value="+982161118634" target="_blank">+98 21 6111 8634</a>  & Fax No.: <a href="tel:%2B98%2021%208800%204781" value="+982188004781" target="_blank">+98 21 8800 4781</a><br>Cellphone: <a href="tel:%2B98%20917%20731%207514" value="+989177317514" target="_blank">+98 917 731 7514</a><br>E-Mail:     <a href="mailto:m.abbasnejad@gmail.com" target="_blank">m.abbasnejad@gmail.com</a><br>Website:  <a href="http://physics.ut.ac.ir" target="_blank">http://physics.ut.ac.ir</a><br><br>---------------------------------------------------------<br></div>
</div>
<br>_______________________________________________<br>
Pw_forum mailing list<br>
<a href="mailto:Pw_forum@pwscf.org">Pw_forum@pwscf.org</a><br>
<a href="http://pwscf.org/mailman/listinfo/pw_forum" rel="noreferrer" target="_blank">http://pwscf.org/mailman/listinfo/pw_forum</a><br></blockquote></div><br><br clear="all"><br>-- <br><div class="gmail_signature"><div dir="ltr"><div><div dir="ltr"><span><span><font color="#888888">Paolo Giannozzi, Dept. Chemistry&Physics&Environment,<br>
Univ. Udine, via delle Scienze 208, 33100 Udine, Italy<br>
Phone <a href="tel:%2B39-0432-558216" value="+390432558216" target="_blank">+39-0432-558216</a>, fax <a href="tel:%2B39-0432-558222" value="+390432558222" target="_blank">+39-0432-558222</a></font></span></span></div></div></div></div>
</div>