<br><br><div class="gmail_quote">On Sat, Dec 29, 2012 at 11:02 PM, Filippo Spiga <span dir="ltr"><<a href="mailto:spiga.filippo@gmail.com" target="_blank">spiga.filippo@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div style="word-wrap:break-word">Dear Jean,<div><br></div><div>please refer to <a href="http://qe-forge.org/gf/project/q-e-gpu/" target="_blank">http://qe-forge.org/gf/project/q-e-gpu/</a></div><div>in order to configure and install QE-GPU on your machine.  The procedure is easy and lot of details are reported in the file GPU/READEME.GPU</div>
</div></blockquote><div><br>Thanks that is helpful.<br> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word"><div><br></div><div><br>
<div><div class="im"><div>On Dec 29, 2012, at 11:48 AM, Jean Martel <<a href="mailto:john.martel9@gmail.com" target="_blank">john.martel9@gmail.com</a>> wrote:</div><blockquote type="cite"><div>I need some help with building and installing Quantum Espresso on my desktop running under Ubuntu 12.04. I am interested in running GPU accelerated TD-DFT calculations to compute excited-state properties, with occasional B3LYP geometry optimizations. </div>
</blockquote><div><br></div></div><div>TDDFT is not entirely supported. Only part of it can exploit GPU acceleration thanks to some libraries and shared modules. <br></div></div></div></div></blockquote><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div style="word-wrap:break-word"><div><div><div class="im"><div><br></div><br><blockquote type="cite"><div>One of the main issues I am having is the with the two different QE-GPU versions, there are version 5.01 and 5.02. However 5.02 contains much fewer and totally different files, and I am not sure which one to use. </div>
</blockquote><div><br></div></div><div>I do not thing you are really interested to understand too much details about the implementation. If you have run calculations using QE 5.0.1 and you need to restart/resume from that version then pick up the QE-GPU-5.0.1. If you have to run new calculations use the QE-GPU-5.0.2. Latest version always means better code, less bug, sometimes better/improved performance, less "problems".</div>
</div></div></div></blockquote><div><br>In the download page there are two files 'espresso-5.0.1-GPU-build2.tar.gz' and 'QE-GPU-5.0.2-build1.tar.gz' the first one is 18 MB and the second is 3 MB, are you saying that 'QE-GPU-5.0.2-build1.tar.gz' supplements  'espresso-5.0.1-GPU-build2.tar.gz' ?<br>
 </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word"><div><div><div class="im"><div><br></div><div><br></div><blockquote type="cite">
<div>Any guidance or pointers on how to build and install QE  on my system for the types of calculations i am looking for would be great. </div>
<div><br></div><div>My System Specifications:</div><div>Ubuntu12.04</div><div>gcc 4.6.3 with gfortran</div><div>Intel MKL version 11 update 1</div><div>Cuda 5.0</div><div>Hexacore i7-3930K</div><div>Dual Gtx 690</div><div>

64 GB RAM</div></blockquote><div><br></div><div><br></div></div>What it is not clear is if you have a single GTX690 card (that has 2 GPU die on the same board) or two different cards. If I understand correctly, the GTX 690 comes with 2 integrate GPU in the same board and 4 GByte of RAM. QE-GPU will detect two distinct GPUs and we will manage them safely. Since your system has so much RAM I do suggest to run QE-GPU in MPI+OpenMP mode in order to use both GPUs together as better as possible. So</div>
</div></div></blockquote><div><br>I actually have 2 different GTX 690 cards (so total of 4 GPUs and 8 GB of RAM). <br> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div style="word-wrap:break-word"><div><div><br></div><div><div>$ cd GPU</div><div>$ ./configure --enable-parallel --enable-openmp --enable-cuda --with-gpu-arch=30 --with-cuda-dir=<where your CUDA is installed> --enable-magma --enable-phigemm</div>
<div>$ cd ..</div><div>$ make -f Makefile.gpu all-gpu</div><div><br></div><div>Then you should run using 2 MPI and 3 OpenMP per thread (or 6 OpenMP if hyper-threading is enabled). Please install Open MPI on your system (latest version is fine). I have no idea what kind of binding settings suggest because I have not found any detail about the NUMA topology of the processor. Please read the RREADME.GPU file.</div>
</div></div></div></blockquote><div><br>Thanks will do <br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word"><div><div><div><br></div>
<div>The only TDDFT executable will be turbo_lanczos-gpu.x. I never tested it so.. good luck. Actually I will be happy to receive a test case and some feedback about it.</div></div></div></div></blockquote><div><br>Great, i will be happy to report the results <br>
</div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word"><div><div><div><br></div><div>Few words about some performance expectation: the GTX 690 uses a GK104 GPU chip. This chip has been designed for gaming mainly. So its double precision peak is quite poor compared to another GPU generation chip (GK1110). So please do not expect speedups like 2 or 3 times. GPU will help to have a less time-to-solution but not a big improvement in performance. Moreover the GPU implementation targets compute intensive calculation. If you have small systems composed by less than ~50 atoms then there is not guarantee about any performance benefit.</div>
</div></div></div></blockquote><div><br>Yeah, I know that the double precision peak for GK104 chips is not too high on paper, however users have reported only an average speed increase of 2 between the K10(GK104) and the K20(GK110). I have systems with about 75 heavy atoms, so I am hoping to get some speed up gains. <br>
 </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word"><div><div><div><br></div><div>Happy New Year and Happy Computing</div><div><br>
</div><div>(PLEASE subscribe the QE-GPU mailing list, I will not reply to any further email on this one)</div><div><br></div><div>Cheers,</div><div>Filippo</div></div><div><br></div><div>
<div style="text-indent:0px;letter-spacing:normal;font-variant:normal;text-align:-webkit-auto;font-style:normal;font-weight:normal;line-height:normal;text-transform:none;font-size:medium;white-space:normal;font-family:Helvetica;word-wrap:break-word;word-spacing:0px">
<div style="text-indent:0px;letter-spacing:normal;font-variant:normal;text-align:-webkit-auto;font-style:normal;font-weight:normal;line-height:normal;text-transform:none;font-size:medium;white-space:normal;font-family:Helvetica;word-wrap:break-word;word-spacing:0px">
<div style="text-indent:0px;letter-spacing:normal;font-variant:normal;text-align:-webkit-auto;font-style:normal;font-weight:normal;line-height:normal;text-transform:none;font-size:medium;white-space:normal;font-family:Helvetica;word-wrap:break-word;word-spacing:0px">
<div style="text-indent:0px;letter-spacing:normal;font-variant:normal;text-align:-webkit-auto;font-style:normal;font-weight:normal;line-height:normal;text-transform:none;font-size:medium;white-space:normal;font-family:Helvetica;word-wrap:break-word;word-spacing:0px">
<span style="border-collapse:separate;border-spacing:0px"><div style="word-wrap:break-word"><span style="border-collapse:separate;text-align:-webkit-auto;text-indent:0px;border-spacing:0px"><div style="word-wrap:break-word">
<span style="border-collapse:separate;text-align:-webkit-auto;text-indent:0px;border-spacing:0px"><div style="word-wrap:break-word"><span style="border-collapse:separate;text-align:-webkit-auto;text-indent:0px;border-spacing:0px"><div style="word-wrap:break-word">
<span style="border-collapse:separate;text-indent:0px;border-spacing:0px"><div style="word-wrap:break-word"><span style="border-collapse:separate;text-indent:0px;border-spacing:0px"><div style="word-wrap:break-word"><span style="border-collapse:separate;text-indent:0px;border-spacing:0px"><div style="word-wrap:break-word">
<span style="border-collapse:separate;text-indent:0px;border-spacing:0px"><div style="word-wrap:break-word"><span style="border-collapse:separate;text-indent:0px;border-spacing:0px"><div style="word-wrap:break-word"><span style="border-collapse:separate;text-indent:0px;border-spacing:0px"><div style="word-wrap:break-word">
<span style="border-collapse:separate;text-indent:0px;border-spacing:0px"><div style="word-wrap:break-word"><span style="border-collapse:separate;text-indent:0px;border-spacing:0px"><div style="word-wrap:break-word"><span style="border-collapse:separate;text-indent:0px;border-spacing:0px"><div style="word-wrap:break-word">
<span style="border-collapse:separate;text-indent:0px;border-spacing:0px"><div style="word-wrap:break-word">--<br>Mr. Filippo SPIGA, M.Sc.</div><div style="word-wrap:break-word"><a href="http://filippospiga.me" target="_blank">http://filippospiga.me</a> ~ skype: filippo.spiga<br>
<br>«Nobody will drive us out of Cantor's paradise.» ~ David Hilbert</div></span></div></span></div></span></div></span></div></span></div></span></div></span></div></span></div></span></div></span></div></span></div>
</span></div></span></div></span></div></div></div></div>
</div>
<br></div></div><br>_______________________________________________<br>
Pw_forum mailing list<br>
<a href="mailto:Pw_forum@pwscf.org">Pw_forum@pwscf.org</a><br>
<a href="http://pwscf.org/mailman/listinfo/pw_forum" target="_blank">http://pwscf.org/mailman/listinfo/pw_forum</a><br></blockquote></div><br>