<div dir="ltr">On Tue, May 22, 2018 at 1:14 AM, Martina Lessio <span dir="ltr"><<a href="mailto:ml4132@columbia.edu" target="_blank">ml4132@columbia.edu</a>></span> wrote:<br><div class="gmail_extra"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><br><div>I recently started running the parallel version of QE 5.4.0</div></div></blockquote><div><br></div><div>old version<br> <br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div> and I am getting the following error message in my output file (the error never appeared when I run the code serial on one processor):</div><div><div><br>[compute-0-6.local:31540] 23 more processes have sent help message help-mpi-btl-base.txt / btl:no-nics<br><br>[compute-0-6.local:31540] Set MCA parameter "orte_base_help_aggregate" to 0 to see all help / error messages<br><br>where "compute-0-1" is the name of the node I run my calculation on. </div><div>After the message is printed in the output the calculation typically continues normally and in same cases gets successfully to the end. I other cases, usually when I had large supercell with about 100 atoms, the calculation becomes extremely slow and does not get to the end in a reasonable time. Therefore, I suspect that the error being printed also signals that the calculation will start running only on one processor.</div></div></div></blockquote><div><br></div><div>Those messages mean something like "processors other than the first one have issued a message, you won't see them, if you want to see them, do the following". I have seen similar messages on some machines with some mis-configuration that causes a warning to be issued. This is typically harmless<br><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><div> However, upon checking, I noticed that all the processors I requested are still busy with the calculation after the error message shows up. <br></div><div><br></div><div>I tried to search the forum and the FAQs for this type of issue but did not find much. I would really appreciate if anybody could share their experience with this type of error. </div><div>I am providing below my submission script and input file (for a large calculation that runs very slowly after the error message is printed).</div><div><br></div><div>Thanks so much,</div><div>Martina</div><div><br></div>-- <br>Martina Lessio, Ph.D.<br>Frontiers of Science Lecturer in Discipline<br>Postdoctoral Research Scientist<br>Department of Chemistry<br>Columbia University<div class="m_-4021840733734329933gmail_signature"><div dir="ltr"><div dir="ltr"><div><br></div><b>Submission script:</b><br>#!/bin/bash<br>#SBATCH --job-name=QErun<br>#SBATCH -n 24 # node count<br>#SBATCH -p New # node count<br>#SBATCH -o MoTe2ml_super551OPT.out<br>#SBATCH --mem=60000<br>module load openmpi<br>module load mkl<br>module load compilers<br>mpirun -np 24 pw.x < MoTe2ml_super551OPT.in</div><div dir="ltr"><br></div><b>Input file:</b><br> &control<br> calculation = 'relax'<br> restart_mode='from_scratch',<br> prefix='MoTe2ml_super5x5relax'<wbr>,<br> pseudo_dir = '/home/mlessio/espresso-5.4.0/<wbr>pseudo/',<br> outdir='/home/mlessio/<wbr>espresso-5.4.0/tempdir/'<br> /<br><br> &system<br> ibrav= 4, A=17.65, B=17.65, C=16.882, cosAB=-0.5, cosAC=0, cosBC=0,<br> nat= 75, ntyp= 2,<br> ecutwfc =60.<br> lspinorb =.true., noncolin=.true.<br> /<br><br> &electrons<br> mixing_mode = 'plain'<br> mixing_beta = 0.7<br> conv_thr = 1.0d-10<br> diago_david_ndim=2<br> diagonalization='cg'<br> /<br><br> &ions<br> /<br><br>ATOMIC_SPECIES<br> Te 127.6 Te_ONCV_PBE_FR-1.1.upf<br> Mo 95.96 Mo_ONCV_PBE_FR-1.0.upf<br><br>ATOMIC_POSITIONS {crystal}<br>Te 0.133333330 0.066666657 0.313489588<br>Te 0.133333336 0.266666661 0.313489588<br>Te 0.133333334 0.466666672 0.313489588<br>Te 0.133333325 0.666666683 0.313489588<br>Te 0.133333336 0.866666694 0.313489588<br>Te 0.333333312 0.066666657 0.313489588<br>Te 0.333333306 0.266666661 0.313489588<br>Te 0.333333310 0.466666672 0.313489588<br>Te 0.333333304 0.666666683 0.313489588<br>Te 0.333333319 0.866666694 0.313489588<br>Te 0.533333329 0.066666657 0.313489588<br>Te 0.533333336 0.266666661 0.313489588<br>Te 0.533333320 0.466666672 0.313489588<br>Te 0.533333317 0.666666683 0.313489588<br>Te 0.533333335 0.866666694 0.313489588<br>Te 0.733333372 0.066666657 0.313489588<br>Te 0.733333352 0.266666661 0.313489588<br>Te 0.733333390 0.466666672 0.313489588<br>Te 0.733333374 0.666666683 0.313489588<br>Te 0.733333385 0.866666694 0.313489588<br>Te 0.933333361 0.066666657 0.313489588<br>Te 0.933333341 0.266666661 0.313489588<br>Te 0.933333379 0.466666672 0.313489588<br>Te 0.933333363 0.666666683 0.313489588<br>Te 0.933333347 0.866666694 0.313489588<br>Te 0.133333330 0.066666657 0.097661430<br>Te 0.133333336 0.266666661 0.097661430<br>Te 0.133333334 0.466666672 0.097661430<br>Te 0.133333325 0.666666683 0.097661430<br>Te 0.133333336 0.866666694 0.097661430<br>Te 0.333333312 0.066666657 0.097661430<br>Te 0.333333306 0.266666661 0.097661430<br>Te 0.333333310 0.466666672 0.097661430<br>Te 0.333333304 0.666666683 0.097661430<br>Te 0.333333319 0.866666694 0.097661430<br>Te 0.533333329 0.066666657 0.097661430<br>Te 0.533333336 0.266666661 0.097661430<br>Te 0.533333320 0.466666672 0.097661430<br>Te 0.533333317 0.666666683 0.097661430<br>Te 0.533333335 0.866666694 0.097661430<br>Te 0.733333372 0.066666657 0.097661430<br>Te 0.733333352 0.266666661 0.097661430<br>Te 0.733333390 0.466666672 0.097661430<br>Te 0.733333374 0.666666683 0.097661430<br>Te 0.733333385 0.866666694 0.097661430<br>Te 0.933333361 0.066666657 0.097661430<br>Te 0.933333341 0.266666661 0.097661430<br>Te 0.933333379 0.466666672 0.097661430<br>Te 0.933333363 0.666666683 0.097661430<br>Te 0.933333347 0.866666694 0.097661430<br>Mo 0.066666675 0.133333330 0.205570934<br>Mo 0.066666667 0.333333310 0.205570934<br>Mo 0.066666685 0.533333321 0.205570934<br>Mo 0.066666655 0.733333332 0.205570934<br>Mo 0.066666666 0.933333343 0.205570934<br>Mo 0.266666695 0.133333330 0.205570934<br>Mo 0.266666683 0.333333310 0.205570934<br>Mo 0.266666698 0.533333321 0.205570934<br>Mo 0.266666678 0.733333332 0.205570934<br>Mo 0.266666696 0.933333343 0.205570934<br>Mo 0.466666671 0.133333330 0.205570934<br>Mo 0.466666666 0.333333310 0.205570934<br>Mo 0.466666690 0.533333321 0.205570934<br>Mo 0.466666668 0.733333332 0.205570934<br>Mo 0.466666681 0.933333343 0.205570934<br>Mo 0.666666687 0.133333330 0.205570934<br>Mo 0.666666655 0.333333310 0.205570934<br>Mo 0.666666666 0.533333321 0.205570934<br>Mo 0.666666650 0.733333332 0.205570934<br>Mo 0.666666674 0.933333343 0.205570934<br>Mo 0.866666676 0.133333330 0.205570934<br>Mo 0.866666644 0.333333310 0.205570934<br>Mo 0.866666682 0.533333321 0.205570934<br>Mo 0.866666666 0.733333332 0.205570934<br>Mo 0.866666650 0.933333343 0.205570934<br><br>K_POINTS {automatic}<br> 2 2 1 0 0 0</div></div>
</div></div>
<br>______________________________<wbr>_________________<br>
users mailing list<br>
<a href="mailto:users@lists.quantum-espresso.org">users@lists.quantum-espresso.<wbr>org</a><br>
<a href="https://lists.quantum-espresso.org/mailman/listinfo/users" rel="noreferrer" target="_blank">https://lists.quantum-<wbr>espresso.org/mailman/listinfo/<wbr>users</a><br></blockquote></div><br><br clear="all"><br>-- <br><div class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div>Paolo Giannozzi, Dip. Scienze Matematiche Informatiche e Fisiche,<br>Univ. Udine, via delle Scienze 208, 33100 Udine, Italy<br>Phone +39-0432-558216, fax +39-0432-558222<br><br></div></div></div></div></div>
</div></div>