<br><font size=2 face="sans-serif">Hi, good holidays, there ?</font>
<br><font size=2 face="sans-serif">I have applied the patch below.</font>
<br><font size=2 face="sans-serif">It works now:</font>
<br>
<br><font size=2 face="sans-serif">padbr345P -O rmgr=slurm &nbsp;--proc-summary &nbsp;-a</font>
<br><font size=2 face="sans-serif">Warning, remote process state differs across ranks</font>
<br><font size=2 face="sans-serif">state : ranks</font>
<br><font size=2 face="sans-serif">R (running) : [2]</font>
<br><font size=2 face="sans-serif">S (sleeping) : [0-1,3-7]</font>
<br><font size=2 face="sans-serif">rank &nbsp;hostname &nbsp;pid &nbsp; &nbsp;vmsize &nbsp; &nbsp; vmrss &nbsp; &nbsp; S &nbsp;uptime &nbsp;%cpu &nbsp;lcore &nbsp;command &nbsp; &nbsp; &nbsp; </font>
<br><font size=2 face="sans-serif">&nbsp; &nbsp;0 &nbsp; &nbsp; &nbsp; vb8 &nbsp;24595 &nbsp;133440 kB &nbsp;47296 kB &nbsp;S &nbsp; &nbsp;0.01 &nbsp; &nbsp; 0 &nbsp; &nbsp; &nbsp;0 &nbsp;pp_sndrcv_spbl</font>
<br><font size=2 face="sans-serif">&nbsp; &nbsp;1 &nbsp; &nbsp; &nbsp; vb9 &nbsp;17406 &nbsp;111616 kB &nbsp;25536 kB &nbsp;S &nbsp; &nbsp;0.01 &nbsp; &nbsp; 0 &nbsp; &nbsp; &nbsp;0 &nbsp;pp_sndrcv_spbl</font>
<br><font size=2 face="sans-serif">&nbsp; &nbsp;2 &nbsp; &nbsp; &nbsp;vb10 &nbsp;12521 &nbsp;133440 kB &nbsp;47296 kB &nbsp;R &nbsp; &nbsp;0.93 &nbsp; &nbsp;99 &nbsp; &nbsp; &nbsp;1 &nbsp;pp_sndrcv_spbl</font>
<br><font size=2 face="sans-serif">&nbsp; &nbsp;3 &nbsp; &nbsp; &nbsp; vb8 &nbsp;24588 &nbsp;111616 kB &nbsp;25728 kB &nbsp;S &nbsp; &nbsp;0.01 &nbsp; &nbsp; 0 &nbsp; &nbsp; &nbsp;2 &nbsp;pp_sndrcv_spbl</font>
<br><font size=2 face="sans-serif">&nbsp; &nbsp;4 &nbsp; &nbsp; &nbsp; vb9 &nbsp;17411 &nbsp;111616 kB &nbsp;25600 kB &nbsp;S &nbsp; &nbsp;0.01 &nbsp; &nbsp; 0 &nbsp; &nbsp; &nbsp;5 &nbsp;pp_sndrcv_spbl</font>
<br><font size=2 face="sans-serif">&nbsp; &nbsp;5 &nbsp; &nbsp; &nbsp;vb10 &nbsp;12522 &nbsp;111616 kB &nbsp;25600 kB &nbsp;S &nbsp; &nbsp;0.93 &nbsp; &nbsp; 0 &nbsp; &nbsp; &nbsp;0 &nbsp;pp_sndrcv_spbl</font>
<br><font size=2 face="sans-serif">&nbsp; &nbsp;6 &nbsp; &nbsp; &nbsp; vb8 &nbsp;24589 &nbsp;111616 kB &nbsp;25600 kB &nbsp;S &nbsp; &nbsp;0.01 &nbsp; &nbsp; 0 &nbsp; &nbsp; &nbsp;3 &nbsp;pp_sndrcv_spbl</font>
<br><font size=2 face="sans-serif">&nbsp; &nbsp;7 &nbsp; &nbsp; &nbsp; vb9 &nbsp;17407 &nbsp;112640 kB &nbsp;25728 kB &nbsp;S &nbsp; &nbsp;0.01 &nbsp; &nbsp; 0 &nbsp; &nbsp; &nbsp;0 &nbsp;pp_sndrcv_spbl</font>
<br><font size=2 face="sans-serif">[thipa@vb0 openmpi]$ </font>
<br>
<br><font size=2 face="sans-serif">Thipadin.</font>
<br>
<br>
<br>
<br>
<table width=100%>
<tr valign=top>
<td>
<td><font size=1 face="sans-serif"><b>Ashley Pittman &lt;ashley@pittman.co.uk&gt;</b></font>
<p><font size=1 face="sans-serif">12/03/2009 12:08 PM</font>
<br>
<td><font size=1 face="Arial">&nbsp; &nbsp; &nbsp; &nbsp; </font>
<br><font size=1 face="sans-serif">&nbsp; &nbsp; &nbsp; &nbsp; Pour : &nbsp; &nbsp; &nbsp; &nbsp;thipadin.seng-long@bull.net</font>
<br><font size=1 face="sans-serif">&nbsp; &nbsp; &nbsp; &nbsp; cc : &nbsp; &nbsp; &nbsp; &nbsp;florence.vallee@bull.net, francois.wellenreiter@bull.net, padb-devel@pittman.org.uk, Sylvain.JEAUGEY@bull.net</font>
<br><font size=1 face="sans-serif">&nbsp; &nbsp; &nbsp; &nbsp; Objet : &nbsp; &nbsp; &nbsp; &nbsp;Re: Réf. : Re: [padb] Patch of support of Slurm + Openmpi Orte manager</font></table>
<br>
<br><font size=2 face="Courier New"><br>
I'm just running out of the door myself and will be away until Sunday<br>
now.<br>
<br>
On Thu, 2009-12-03 at 11:45 +0100, thipadin.seng-long@bull.net wrote:<br>
&gt; You have mpirun which has rank0, this shouldn't, and you miss 3,6.<br>
<br>
ranks 3 and 6 are on the same node as rank 0, can you try the following<br>
additional patch which should cause it to skip over the mpirun process<br>
and look for local ones based on their environment.<br>
<br>
If this patch doesn't work take a look at the the contents<br>
of /proc/$pid/status for the process it's erroneously reporting as rank<br>
0 to see what Name is set to. &nbsp;In the example you sent it's pid 22210<br>
<br>
--- padb-slurm-open-3 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; 2009-12-03 11:03:08.500044734 +0000<br>
+++ padb &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; 2009-12-03 11:03:15.333036493 +0000<br>
@@ -8187,6 +8187,7 @@<br>
 &nbsp; &nbsp; &nbsp; &nbsp; next unless ( $job eq $jobid );<br>
 &nbsp; &nbsp; &nbsp; &nbsp; next unless ( $step == $inner_conf{slurm_job_step} );<br>
 &nbsp; &nbsp; &nbsp; &nbsp; next if( find_from_status( $pid, 'Name' ) eq 'orted');<br>
+ &nbsp; &nbsp; &nbsp; &nbsp;next if( find_from_status( $pid, 'Name' ) eq 'mpirun');<br>
 &nbsp; &nbsp; &nbsp; &nbsp; maybe_show_pid( $global, $pid );<br>
 &nbsp; &nbsp; &nbsp; &nbsp; $found_target = 1;<br>
 &nbsp; &nbsp; }<br>
<br>
<br>
-- <br>
<br>
Ashley Pittman, Bath, UK.<br>
<br>
Padb - A parallel job inspection tool for cluster computing<br>
http://padb.pittman.org.uk<br>
<br>
</font>
<br>
<br>