<div dir="ltr">I finally narrowed it down. It turns out we had a problem merging the previous release, but it did not show up since we never got a chance to test it. Sam added an op_release in namei.c to fix a <span class="csComment">kmem_cache leak, and i</span>t sneaked in twice without warning. Taking that out fixed the problem. <br>
<br>Bart.<br><br><br><br><div class="gmail_quote">On Tue, Jul 29, 2008 at 8:03 AM, Phil Carns <span dir="ltr">&lt;<a href="mailto:carns@mcs.anl.gov">carns@mcs.anl.gov</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
I&#39;m having a hard time thinking of anything specific that would have impacted this. &nbsp;You could maybe try to narrow it down some by taking a diff of just the src/kernel/linux-2.6 directory and apply that to a 2.7.1 tree to test and see if it is something specifically in the kernel module code.<br>

<br>
-Phil<br>
<br>
Bart Taylor wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div class="Ih2E3d">
I ran the test the same way you mentioned - outside of the LTP framework - and still had the problem. I have applied the patch that fixed the rename06 test as well as the kernel buffer overflow fix from a few days ago and still have the problem.<br>

<br>
I did a CVS export of head this morning and used the same configure and build as last time. I ran the open file test against a file system created from head and against a 271 file system (with some recent patches) and both tests succeed, so it seems like the fix is somewhere between the 271 release and head, but I am not sure where. Do you have an idea where it might be lurking?<br>

<br>
Bart.<br>
<br>
<br>
<br></div><div><div></div><div class="Wj3C7c">
On Fri, Jul 25, 2008 at 7:16 AM, Phil Carns &lt;<a href="mailto:carns@mcs.anl.gov" target="_blank">carns@mcs.anl.gov</a> &lt;mailto:<a href="mailto:carns@mcs.anl.gov" target="_blank">carns@mcs.anl.gov</a>&gt;&gt; wrote:<br>

<br>
 &nbsp; &nbsp;Phil Carns wrote:<br>
<br>
 &nbsp; &nbsp; &nbsp; &nbsp;Bart Taylor wrote:<br>
<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;I am having a problem with an LTP test from the 20080630 set<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;of LTP tests. The<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;&#39;openfile01&#39; test does 10 threaded opens of 10 files. It is<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;attached in case you<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;need a copy. The test completes successfully, but an &#39;ls&#39;<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;command immediately<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;after that &nbsp;hangs and cannot be killed. Eventually the node<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;hangs as well. Any<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;command that touches the file system will trigger the problem.<br>
<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;We also tried this with the 2.7.1 release tarball and see<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;the same problem. A<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;single node file system running RHEL4 and a 2.6.9-67 kernel.<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;The client was on<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;the same node.<br>
<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;Here is the configure line used:<br>
<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;./configure --with-kernel=/lib/modules/`uname -r`/build<br>
<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;and how the client was started:<br>
<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;./pvfs2-client -p ./pvfs2-client-core<br>
<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;The fs.conf file is attached.<br>
<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;The client debug mask was set to &#39;all&#39;, and<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;/proc/sys/pvfs2/debug had a value of<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;32767. But once the &#39;ls&#39; command was issued, there were no<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;log messages.<br>
<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;Does anyone else see this error?<br>
<br>
 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;Bart.<br>
<br>
<br>
 &nbsp; &nbsp; &nbsp; &nbsp;Are you able to reproduce this running openfile by itself after<br>
 &nbsp; &nbsp; &nbsp; &nbsp;a fresh boot? &nbsp;It looks like openfile operates on a file in the<br>
 &nbsp; &nbsp; &nbsp; &nbsp;current working directory, so I have been trying to run it like<br>
 &nbsp; &nbsp; &nbsp; &nbsp;this:<br>
<br>
 &nbsp; &nbsp; &nbsp; &nbsp;&lt;mount pvfs2 on /mnt/pvfs2&gt;<br>
 &nbsp; &nbsp; &nbsp; &nbsp;cd /mnt/pvfs2<br>
 &nbsp; &nbsp; &nbsp; &nbsp;~/openfile -f10 -t10<br>
 &nbsp; &nbsp; &nbsp; &nbsp;ls -alh<br>
<br>
 &nbsp; &nbsp; &nbsp; &nbsp;So far I haven&#39;t had any trouble with that particular<br>
 &nbsp; &nbsp; &nbsp; &nbsp;combination. &nbsp;I&#39;m running it on a centos4 box with a very<br>
 &nbsp; &nbsp; &nbsp; &nbsp;similar kernel. &nbsp;The openfile tests looks fairly innocent- with<br>
 &nbsp; &nbsp; &nbsp; &nbsp;those arguments each of 10 separate threads open the same single<br>
 &nbsp; &nbsp; &nbsp; &nbsp;file 10 times (for a total of 100 file descriptors open to the<br>
 &nbsp; &nbsp; &nbsp; &nbsp;same file) if I understand correctly.<br>
<br>
 &nbsp; &nbsp; &nbsp; &nbsp;If I try to run a full LTP test, however, I do have other<br>
 &nbsp; &nbsp; &nbsp; &nbsp;problems. &nbsp;In particular the rename06 test hangs. &nbsp;I can trigger<br>
 &nbsp; &nbsp; &nbsp; &nbsp;that one by itself as follows:<br>
<br>
 &nbsp; &nbsp; &nbsp; &nbsp;export TMPDIR=/mnt/pvfs2<br>
 &nbsp; &nbsp; &nbsp; &nbsp;~/rename06<br>
<br>
 &nbsp; &nbsp; &nbsp; &nbsp;The same suite of tests runs fine on a 2.6.24 kernel and a trunk<br>
 &nbsp; &nbsp; &nbsp; &nbsp;build of PVFS. &nbsp;I&#39;m not sure yet if the difference is between<br>
 &nbsp; &nbsp; &nbsp; &nbsp;pvfs versions or between kernel versions.<br>
<br>
<br>
 &nbsp; &nbsp;The rename06 test passes with pvfs trunk; I think that particular<br>
 &nbsp; &nbsp;problem has already been fixed. &nbsp;I still haven&#39;t figured out why<br>
 &nbsp; &nbsp;openfile01 would be a problem, though.<br>
<br>
 &nbsp; &nbsp;-Phil<br>
<br>
<br>
</div></div></blockquote>
<br>
</blockquote></div><br></div>