<div dir="ltr"><div>Hi,</div><div><br></div><div>I am doing the convergence test against ecutwfc. I got the energies for ecutwfc 40, 50 and 60. But when I run it for ecutwfc 70, I have got the errors (sdc.rxt attached). Would you please suggest me where the problems are? I have attached the error file (sdc.txt), input file (<a href="http://si.scf.in">si.scf.in</a>) and part of the inputs and errors I have copied here. <br></div><div><b>Here is my job file:</b></div><div>#!/usr/bin/env bash<br>#SBATCH --job-name=hasanjob<br>#SBATCH --nodes=3                       # node count<br>#SBATCH --ntasks-per-node=24         # number of tasks per node<br>#SBATCH --cpus-per-task=1            # cpu-cores per task (>1 if multi-threaded tasks)<br>#SBATCH --mem-per-cpu=5gb                    # Job memory request<br>#SBATCH --time=120:00:00               # Time limit hrs:min:sec<br>#SBATCH --output=sdc.txt              # Standard output and error log<br>#SBATCH --partition=skylake           # MOAB/Torque called these queues<br></div><div><br></div><div>module load quantum-espresso/7.3.1-intel</div><div>srun pw.x < <a href="http://si.scf.in">si.scf.in</a> > sc.scf.out</div><div>%%%%%%%</div><div><br></div><div>&control<br>  calculation = 'scf'<br>  restart_mode = 'from_scratch'<br>  prefix = 'si'<br>  pseudo_dir = './'<br>  outdir = './out'<br>/<br>&system<br>  ibrav = 0<br>  nat =   1024<br>  ntyp =    1<br>  ecutwfc =  70.00<br>/<br>&electrons<br>  diagonalization = 'david'<br>  mixing_mode= 'plain'<br>  mixing_beta = 0.70<br>  conv_thr =   1D-06<br>/<br>ATOMIC_SPECIES<br>   Si   28.085 Si.pz-hgh.UPF<br>K_POINTS automatic<br>   1   1   1   0   0   0<br>CELL_PARAMETERS (angstrom)<br>       30.7206764221         0.0000000000         0.0000000000<br>       15.3603364397        26.6048872257         0.0000000000<br>       15.3603364397         8.8682950601        25.0833284677<br>ATOMIC_POSITIONS crystal</div><div>%%%%%%%%%%<br></div><div><b>errors</b></div><div>Abort(671693317) on node 2 (rank 2 in comm 0): Fatal error in PMPI_Comm_free: Invalid communicator, error stack:<br>PMPI_Comm_free(137): MPI_Comm_free(comm=0x7ffe7c808e28) failed<br>PMPI_Comm_free(85).: Null communicator<br>srun: Job step aborted: Waiting up to 32 seconds for job step to finish.<br>Abort(604584453) on node 4 (rank 4 in comm 0): Fatal error in PMPI_Comm_free: Invalid communicator, error stack:<br>PMPI_Comm_free(137): MPI_Comm_free(comm=0x7fff54684228) failed<br>PMPI_Comm_free(85).: Null communicator<br>Abort(201931269) on node 55 (rank 55 in comm 0): Fatal error in PMPI_Comm_free: Invalid communicator, error stack:<br>PMPI_Comm_free(137): MPI_Comm_free(comm=0x7fffb5d73228) failed<br>PMPI_Comm_free(85).: Null communicator<br>Abort(604584453) on node 29 (rank 29 in comm 0): Fatal error in PMPI_Comm_free: Invalid communicator, error stack:<br>PMPI_Comm_free(137): MPI_Comm_free(comm=0x7ffc11f603a8) failed<br>PMPI_Comm_free(85).: Null communicator<br>Abort(604677) on node 6 (rank 6 in comm 0): Fatal error in PMPI_Comm_free: Invalid communicator, error stack:<br>PMPI_Comm_free(137): MPI_Comm_free(comm=0x7fffe3ee30a8) failed<br>PMPI_Comm_free(85).: Null communicator<br>Abort(336148997) on node 1 (rank 1 in comm 0): Fatal error in PMPI_Comm_free: Invalid communicator, error stack:<br>PMPI_Comm_free(137): MPI_Comm_free(comm=0x7fff40805828) failed<br>PMPI_Comm_free(85).: Null communicator<br>Abort(269040133) on node 3 (rank 3 in comm 0): Fatal error in PMPI_Comm_free: Invalid communicator, error stack:<br>PMPI_Comm_free(137): MPI_Comm_free(comm=0x7ffca9146f28) failed<br>PMPI_Comm_free(85).: Null communicator<br>Abort(873019909) on node 5 (rank 5 in comm 0): Fatal error in PMPI_Comm_free: Invalid communicator, error stack:<br>PMPI_Comm_free(137): MPI_Comm_free(comm=0x7fffe52c1a28) failed<br>PMPI_Comm_free(85).: Null communicator<br>PMPI_Comm_free(85).: Null communicator<br>Abort(67713541) on node 12 (rank 12 in comm 0): Fatal error in PMPI_Comm_free: Invalid communicator, error stack:<br>PMPI_Comm_free(137): MPI_Comm_free(comm=0x7ffe32fbf328) failed<br>PMPI_Comm_free(85).: Null communicator<br>Abort(873019909) on node 14 (rank 14 in comm 0): Fatal error in PMPI_Comm_free: Invalid communicator, error stack:<br>PMPI_Comm_free(137): MPI_Comm_free(comm=0x7ffc649f9ca8) failed<br>PMPI_Comm_free(85).: Null communicator<br>Abort(537475589) on node 13 (rank 13 in comm 0): Fatal error in PMPI_Comm_free: Invalid communicator, error stack:<br>PMPI_Comm_free(137): MPI_Comm_free(comm=0x7ffe15cbaa28) failed<br>PMPI_Comm_free(85).: Null communicator<br>Abort(873019909) on node 15 (rank 15 in comm 0): Fatal error in PMPI_Comm_free: Invalid communicator, error stack:<br>PMPI_Comm_free(137): MPI_Comm_free(comm=0x7ffffc29d928) failed<br>PMPI_Comm_free(85).: Null communicator<br>Abort(604677) on node 21 (rank 21 in comm 0): Fatal error in PMPI_Comm_free: Invalid communicator, error stack:<br>PMPI_Comm_free(137): MPI_Comm_free(comm=0x7ffd23c5d6a8) failed<br>PMPI_Comm_free(85).: Null communicator<br>Abort(403257861) on node 20 (rank 20 in comm 0): Fatal error in PMPI_Comm_free: Invalid <br>PMPI_Comm_free(85).: Null communicator<br>Abort(201931269) on node 19 (rank 19 in comm 0): Fatal error in PMPI_Comm_free: Invalid communicator, error stack:<br>PMPI_Comm_free(137): MPI_Comm_free(comm=0x7ffdb5e63428) failed<br>PMPI_Comm_free(85).: Null communicator<br>slurmstepd: error: *** STEP 2016210.0 ON node-146 CANCELLED AT 2024-08-22T11:20:37 ***<br>Abort(671693317) on node 28 (rank 28 in comm 0): Fatal error in PMPI_Comm_free: Invalid communicator, error stack:<br>Abort(336148997) on node 30 (rank 30 in comm 0): Fatal error in PMPI_Comm_free: Invalid communicator, error stack:<br>PMPI_Comm_free(137): MPI_Comm_free(comm=0x7ffd8c4427a8) failed<br>PMPI_Comm_free(85).: Null communicator<br>Abort(1007237637) on node 38 (rank 38 in comm 0): Fatal error in PMPI_Comm_free: Invalid communicator, error stack:<br>PMPI_Comm_free(137): MPI_Comm_free(comm=0x7ffc5033b928) failed<br>PMPI_Comm_free(85).: Null communicator<br>srun: error: node-149: tasks 25,27,29,31,33,35: Killed<br>srun: error: node-150: tasks 48-71: Killed<br>srun: error: node-146: tasks 1,3,5,7,9,11: Killed<br>srun: error: node-146: tasks 0,2,4,6,8,10,12-23: Killed<br>srun: error: node-149: tasks 24,26,28,30,32,34,36-47: Killed<br>%%%%%%%%%%%%%%%%%%%%%%%</div><div><br></div><div>Best</div><div>M J Hasan</div><div>PhD student<br></div><div>Mechanical Engineering</div><div>University of Maine<br></div></div>