<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style>
<!--
@font-face
        {font-family:"Cambria Math"}
@font-face
        {font-family:Calibri}
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif}
span.EmailStyle17
        {font-family:"Calibri",sans-serif;
        color:windowtext}
.MsoChpDefault
        {font-family:"Calibri",sans-serif}
@page WordSection1
        {margin:72.0pt 72.0pt 72.0pt 72.0pt}
div.WordSection1
        {}
-->
</style>
</head>
<body lang="EN-GB" link="#0563C1" vlink="#954F72" style="word-wrap:break-word">
<div dir="auto">Most likely the processes are killed because they try to allocate more memory per node than allowed in this SKU. This should reported on stderr. </div>
<div class="gmail_extra"><br>
<div class="gmail_quote">Il 14 ago 2023 2:09 PM, Luis Cebamanos <lcebamanos@lenovo.com> ha scritto:<br type="attribution">
</div>
</div>
<div>
<div class="WordSection1">
<p class="MsoNormal"><span style="">Hello,</span></p>
<p class="MsoNormal"><span style=""> </span></p>
<p class="MsoNormal"><span style="">I am trying to find out why QE crashes right after printing out the following:</span></p>
<p class="MsoNormal"><span style=""> </span></p>
<p class="MsoNormal"><span style="">     number of k points=     1<br>
                       cart. coord. in units 2pi/alat<br>
        k(    1) = (   0.0000000   0.0000000   0.0000000), wk =   2.0000000<br>
<br>
     Dense  grid: 27637241 G-vectors     FFT dimensions: ( 540, 540, 540)<br>
<br>
     Smooth grid:  9771712 G-vectors     FFT dimensions: ( 375, 375, 375)<br>
<br>
     Estimated max dynamical RAM per process >       4.42 GB<br>
<br>
     Estimated total dynamical RAM >    1125.78 GB<br>
<br>
     Initial potential from superposition of free atoms<br>
<br>
     starting charge    5231.9496, renormalised to    5232.0000<br>
<br>
     negative rho (up, down):  6.436E-01 0.000E+00<br>
     Starting wfcs are 5168 randomized atomic wfcs<br>
<br>
===================================================================================<br>
=   BAD TERMINATION OF ONE OF YOUR APPLICATION PROCESSES</span></p>
<p class="MsoNormal"><span style="">=   RANK 13 PID 220321 RUNNING AT maryland<br>
=   KILLED BY SIGNAL: 9 (Killed)</span></p>
<p class="MsoNormal"><span style="">===================================================================================</span></p>
<p class="MsoNormal"><span style=""> </span></p>
<p class="MsoNormal"><span style="">I cannot see anything in the logs and I can run well on a different SKU with less cores/node. How could I get a bit more info about this crash? Is there a way to find out what the problem could be?</span></p>
<p class="MsoNormal"><span style=""> </span></p>
<p class="MsoNormal"><span style="">Regards,</span></p>
<p class="MsoNormal"><span style=""> </span></p>
<p class="MsoNormal"><span style="">Chris</span></p>
<p class="MsoNormal"><span style=""> </span></p>
<p class="MsoNormal"> </p>
</div>
</div>
</body>
</html>