<html><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div><br></div>Hi&nbsp;Randy,<div><br></div><div>I&nbsp;don't&nbsp;have&nbsp;any&nbsp;ideas&nbsp;where&nbsp;the&nbsp;problem&nbsp;is,&nbsp;but&nbsp;could&nbsp;you&nbsp;try&nbsp;running&nbsp;the&nbsp;server&nbsp;in&nbsp;gdb? &nbsp;That may give you a better backtrace. &nbsp;The code that generates the backtrace and writes it to the log when a segfault occurs isn't that reliable and may not work on your system. &nbsp;Also, you could try running the server in&nbsp;valgrind&nbsp;to&nbsp;see&nbsp;if&nbsp;there's&nbsp;memory&nbsp;errors&nbsp;elsewhere.&nbsp;&nbsp;That&nbsp;may&nbsp;pinpoint&nbsp;the&nbsp;problem&nbsp;better.</div><div><br></div><div>Was&nbsp;PVFS&nbsp;configured&nbsp;with&nbsp;optimizations&nbsp;(--enable-fast),&nbsp;or&nbsp;without&nbsp;(--enable-strict)?&nbsp;&nbsp;And&nbsp;did&nbsp;you&nbsp;specify&nbsp;CFLAGS=-g when running configure? &nbsp;For debugging environments I usually run configure like this:</div><div><br></div><div>CFLAGS=-g ./configure --enable-strict</div><div><br></div><div>That will enable the most debugging, and hopefully get better backtraces.</div><div><br></div><div>-sam</div><div><br><div><div>On Jul 15, 2009, at 7:47 AM, Randall Martin wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite"><div> <font face="Courier, Courier New"><span style="font-size:11pt">I occasionally get a server crash in what appears to be src/io/flow/flowproto-bmi-trove/flowproto-multiqueue.c. &nbsp;The backtrace is useless. &nbsp;I’m running off the head branch code that I compiled on 7/3.<br> <br> [E 07/14 18:06] PVFS2 server: signal 11, faulty address is (nil), from (nil)<br> [E 07/14 18:06] [bt] [(nil)]<br> [D 07/15 08:19] PVFS2 Server version 2.8.1pre1-2009-07-03-123548 starting.<br> <br> I added a few extra gossip_err statements in the handle_io_error routine and narrowed it down to the following few lines:<br> <br> &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;else if (src == TROVE_ENDPOINT &amp;&amp; dest == BMI_ENDPOINT)<br> &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;{<br> &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;ret = cancel_pending_trove(&amp;flow_data-&gt;src_list, flow_data-&gt;parent-&gt;src.u.trove.coll_id);<br> &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;flow_data-&gt;cleanup_pending_count += ret;<br> <br> Any ideas?<br> <br> Thanks,<br> Randy</span></font> </div>  _______________________________________________<br>Pvfs2-developers mailing list<br><a href="mailto:Pvfs2-developers@beowulf-underground.org">Pvfs2-developers@beowulf-underground.org</a><br>http://www.beowulf-underground.org/mailman/listinfo/pvfs2-developers<br></blockquote></div><br></div></body></html>