<div class="gmail_quote">---------- Forwarded message ----------<br>From: "mohaddeseh abbasnejad" <<a href="mailto:m.abbasnejad@gmail.com">m.abbasnejad@gmail.com</a>><br>Date: Jul 16, 2015 4:55 PM<br>Subject: error in running pw.x command<br>To: "PWSCF Forum" <<a href="mailto:pw_forum@pwscf.org">pw_forum@pwscf.org</a>><br>Cc: <br><br type="attribution"><div dir="ltr"><br clear="all"><div>Dear all,</div><div><br></div><div>I have recently installed PWscf (version 5.1) on our cluster (4 nodes, 32 cores).</div><div>Ifort & mkl version 11.1 has been installed.</div><div>When I run pw.x command on every node individually, for both the following command, it will work properly.</div><div>1- /opt/exp_soft/espresso-5.1/bin/pw.x -in <a href="http://scf.in" target="_blank">scf.in</a></div><div>2- mpirun -n 4 /opt/exp_soft/espresso-5.1/bin/pw.x -in <a href="http://scf.in" target="_blank">scf.in</a></div><div>However, when I use the following command (again for each of them, separately),</div><div>3- mpirun -n 8 /opt/exp_soft/espresso-5.1/bin/pw.x -in <a href="http://scf.in" target="_blank">scf.in</a></div><div>it gives me such an error:</div><div><br></div><div><div>[cluster:14752] *** Process received signal ***</div><div>[cluster:14752] Signal: Segmentation fault (11)</div><div>[cluster:14752] Signal code:  (128)</div><div>[cluster:14752] Failing at address: (nil)</div><div>[cluster:14752] [ 0] /lib64/libpthread.so.0() [0x3a78c0f710]</div><div>[cluster:14752] [ 1] /opt/intel/Compiler/11.1/064/mkl/lib/em64t/libmkl_mc3.so(mkl_blas_zdotc+0x79) [0x2b5e8e37d4f9]</div><div>[cluster:14752] *** End of error message ***</div><div>--------------------------------------------------------------------------</div><div>mpirun noticed that process rank 4 with PID 14752 on node cluster.khayam.local exited on signal 11 (Segmentation fault).</div><div>--------------------------------------------------------------------------</div></div><div><br></div><div>This error also exists when I use all the node with each other in parallel mode (using the following command):</div><div>4- mpirun -n 32 -hostfile testhost /opt/exp_soft/espresso-5.1/bin/pw.x -in <a href="http://scf.in" target="_blank">scf.in</a><br></div><div>The error:<br></div><div><br></div><div><div>[cluster:14838] *** Process received signal ***</div><div>[cluster:14838] Signal: Segmentation fault (11)</div><div>[cluster:14838] Signal code:  (128)</div><div>[cluster:14838] Failing at address: (nil)</div><div>[cluster:14838] [ 0] /lib64/libpthread.so.0() [0x3a78c0f710]</div><div>[cluster:14838] [ 1] /opt/intel/Compiler/11.1/064/mkl/lib/em64t/libmkl_mc3.so(mkl_blas_zdotc+0x79) [0x2b04082cf4f9]</div><div>[cluster:14838] *** End of error message ***</div><div>--------------------------------------------------------------------------</div><div>mpirun noticed that process rank 24 with PID 14838 on node cluster.khayam.local exited on signal 11 (Segmentation fault).</div><div>--------------------------------------------------------------------------</div></div><div><br></div><div>Any help will be appreciated.</div><div><br></div><div>Regards,</div><div>Mohaddeseh</div><div><br></div><div>---------------------------------------------------------<br><br>Mohaddeseh Abbasnejad, <br>Room No. 323, Department of Physics, <br>University of Tehran, North Karegar Ave.,<br>Tehran, P.O. Box: 14395-547- IRAN <br>Tel. No.: +98 21 6111 8634  & Fax No.: +98 21 8800 4781<br>Cellphone: +98 917 731 7514<br>E-Mail:     <a href="mailto:m.abbasnejad@gmail.com" target="_blank">m.abbasnejad@gmail.com</a><br>Website:  <a href="http://physics.ut.ac.ir" target="_blank">http://physics.ut.ac.ir</a><br><br>---------------------------------------------------------<br></div>
</div>
</div>