<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN">
<html><body style='font-size: 10pt'>
<p>Dear all,</p>
<p>I am currently attempting to perform several structural relaxation calculations on supercells that contain at least ~70 atoms (and even more, say hundreds). My calculations are being done on a single node with 40 cores, <span>2.4 GHz, Intel Xeon E5-2676v3 and 160 GiB memory (m4.10xlarge Amazon EC2). I am just wondering if my implementation for parallelism is 'reasonable' in the sense that the resources are fully utilised, and not in some way underutilised or poorly distributed. I'm pretty new to this so I'm not sure what to expect... Should I be happy with the current performance, can it be better, or should I consider deploying more resources and is it worth it? Currently one scf iteration takes around 5-7 minutes. Scf-convergence is achieved after around 50 scf iterations, and I'm not sure how long it's going to take for the vc-relax iterations to converge...</span></p>
<p><span>The input file is shown below. I use this command to initiate the job:</span></p>
<blockquote type="cite" style="padding-left:5px; border-left:#1010ff 2px solid; margin-left:5px">
<p><span>mpirun -np 40 pw.x -npool 2 -ndiag 36 < skutU0.125_vc.vc2 > skutU0.125_vc.vc2.out</span></p>
</blockquote>
<p>Thank you for your help.</p>
<p> </p>
<p>Regards,</p>
<div>-- <br />
<pre><strong>Bang C. Huynh<br /></strong>Peterhouse<br />University of Cambridge<br />CB2 1RD<br />The United Kingdom<br /><br /></pre>
<p>========input=======</p>
<blockquote type="cite" style="padding-left:5px; border-left:#1010ff 2px solid; margin-left:5px">
<p>&CONTROL<br />title = skutterudite-U-doped ,<br />calculation = 'vc-relax' ,<br />outdir = './' ,<br />wfcdir = './' ,<br />pseudo_dir = '../pseudo/' ,<br />prefix = 'skutU0.125_vc' ,<br />etot_conv_thr = 1.0D-5 ,<br />forc_conv_thr = 1.95D-6 ,<br />nstep = 250 ,<br />dt = 150 ,<br />/<br />&SYSTEM<br />ibrav = 6,<br />celldm(1) = 17.06<br />celldm(3) = 2,<br />nat = 66,<br />ntyp = 3,<br />ecutwfc = 93 ,<br />ecutrho = 707 ,<br />occupations = 'smearing' ,<br />starting_spin_angle = .false. ,<br />degauss = 0.02 ,<br />smearing = 'methfessel-paxton' ,<br />/<br />&ELECTRONS<br />conv_thr = 1D-10 ,<br />/<br />&IONS<br />/<br />&CELL<br />cell_dynamics = 'damp-w' ,<br />cell_dofree = 'all' ,<br />/<br />ATOMIC_SPECIES<br />Co 58.93000 Co.pz-nd-rrkjus.UPF <br />Sb 121.76000 Sb.pz-bhs.UPF <br />U 238.02891 U.pz-spfn-rrkjus_psl.1.0.0.UPF <br />ATOMIC_POSITIONS crystal <br />Co 0.250000000 0.250000000 0.125000000 0 0 0 <br />Co 0.250000000 0.250000000 0.625000000 0 0 0 <br />Co 0.750000000 0.750000000 0.375000000 0 0 0 <br />Co 0.750000000 0.750000000 0.875000000 0 0 0 <br />Co 0.750000000 0.750000000 0.125000000 0 0 0 <br />Co 0.750000000 0.750000000 0.625000000 0 0 0 <br />Co 0.250000000 0.250000000 0.375000000 0 0 0 <br />Co 0.250000000 0.250000000 0.875000000 0 0 0 <br />Co 0.750000000 0.250000000 0.375000000 0 0 0 <br />Co 0.750000000 0.250000000 0.875000000 0 0 0 <br />Co 0.250000000 0.750000000 0.125000000 0 0 0 <br />Co 0.250000000 0.750000000 0.625000000 0 0 0 <br />Co 0.250000000 0.750000000 0.375000000 0 0 0 <br />Co 0.250000000 0.750000000 0.875000000 0 0 0 <br />Co 0.750000000 0.250000000 0.125000000 0 0 0 <br />Co 0.750000000 0.250000000 0.625000000 0 0 0 <br />Sb 0.000000000 0.337592989 0.078553498 <br />Sb 0.000000000 0.337592989 0.578553498 <br />Sb 0.000000000 0.662407041 0.421446502 <br />Sb 0.000000000 0.662407041 0.921446502 <br />Sb 0.000000000 0.662407041 0.078553498 <br />Sb 0.000000000 0.662407041 0.578553498 <br />Sb 0.000000000 0.337592989 0.421446502 <br />Sb 0.000000000 0.337592989 0.921446502 <br />Sb 0.157106996 0.000000000 0.168796495 <br />Sb 0.157106996 0.000000000 0.668796480 <br />Sb 0.842893004 0.000000000 0.331203520 <br />Sb 0.842893004 0.000000000 0.831203520 <br />Sb 0.157106996 0.000000000 0.331203520 <br />Sb 0.157106996 0.000000000 0.831203520 <br />Sb 0.842893004 0.000000000 0.168796495 <br />Sb 0.842893004 0.000000000 0.668796480 <br />Sb 0.337592989 0.157106996 0.000000000 <br />Sb 0.337592989 0.157106996 0.500000000 <br />Sb 0.662407041 0.842893004 0.000000000 <br />Sb 0.662407041 0.842893004 0.500000000 <br />Sb 0.662407041 0.157106996 0.000000000 <br />Sb 0.662407041 0.157106996 0.500000000 <br />Sb 0.337592989 0.842893004 0.000000000 <br />Sb 0.337592989 0.842893004 0.500000000 <br />Sb 0.500000000 0.837592959 0.328553498 <br />Sb 0.500000000 0.837592959 0.828553498 <br />Sb 0.500000000 0.162407011 0.171446502 <br />Sb 0.500000000 0.162407011 0.671446502 <br />Sb 0.500000000 0.162407011 0.328553498 <br />Sb 0.500000000 0.162407011 0.828553498 <br />Sb 0.500000000 0.837592959 0.171446502 <br />Sb 0.500000000 0.837592959 0.671446502 <br />Sb 0.657106996 0.500000000 0.418796480 <br />Sb 0.657106996 0.500000000 0.918796480 <br />Sb 0.342893004 0.500000000 0.081203505 <br />Sb 0.342893004 0.500000000 0.581203520 <br />Sb 0.657106996 0.500000000 0.081203505 <br />Sb 0.657106996 0.500000000 0.581203520 <br />Sb 0.342893004 0.500000000 0.418796480 <br />Sb 0.342893004 0.500000000 0.918796480 <br />Sb 0.837592959 0.657106996 0.250000000 <br />Sb 0.837592959 0.657106996 0.750000000 <br />Sb 0.162407011 0.342893004 0.250000000 <br />Sb 0.162407011 0.342893004 0.750000000 <br />Sb 0.162407011 0.657106996 0.250000000 <br />Sb 0.162407011 0.657106996 0.750000000 <br />Sb 0.837592959 0.342893004 0.250000000 <br />Sb 0.837592959 0.342893004 0.750000000 <br />U 0.000000000 0.000000000 0.000000000 <br />U 0.000000000 0.000000000 0.500000000 <br />K_POINTS automatic <br />4 4 2 0 0 0</p>
</blockquote>
</div>
</body></html>