No, but now that you say that if the system is unable to write to the RAID5 which contains the log file would this even happen?<div><br></div><div>e.g. /var is the problematic RAID5 partition and when it locks up it takes out one or more of the physical disks.</div>
<div><br></div><div>An interesting observation is that when the problem occurs it either locks up both sda &amp; sdb, or sdc by itself.</div><div>I am guessing that this is because sda &amp; sdb are on the same channel, so either the channel itself is going or one of the disks is which is taking the other with it.</div>
<div><br></div><div><br>David</div><div><br></div><div><br><br><div class="gmail_quote">On Thu, Mar 25, 2010 at 12:14 AM, Daniel Reurich <span dir="ltr">&lt;<a href="mailto:daniel@centurion.net.nz">daniel@centurion.net.nz</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">Does anything show up in the syslog or dmesg that indicates sata i/o<br>
port resets or anything like that??<br>
<font color="#888888"><br>
Daniel Reurich<br>
</font><div><div></div><div class="h5"><br>
On Wed, 2010-03-24 at 20:53 +1300, David Harrison wrote:<br>
&gt; On Wed, Mar 24, 2010 at 6:36 PM, Daniel Pittman &lt;<a href="mailto:daniel@rimspace.net">daniel@rimspace.net</a>&gt;<br>
&gt; wrote:<br>
&gt;         David Harrison &lt;<a href="mailto:david.harrison@stress-free.co.nz">david.harrison@stress-free.co.nz</a>&gt; writes:<br>
&gt;<br>
&gt;<br>
&gt;         &gt; I will try the deadline scheduler tonight and see if that<br>
&gt;         makes a<br>
&gt;         &gt; difference.<br>
&gt;<br>
&gt;<br>
&gt;         You should be able to make the change at run-time, through<br>
&gt;         sysfs, I believe.<br>
&gt;         It is a property of the hardware devices, IIRC, in sysfs.<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; I tried out a few of the schedulers and none of them helped the<br>
&gt; problem.<br>
&gt; If anything I&#39;d have to say it got worse.<br>
&gt;<br>
&gt;<br>
&gt; As a final test I have switched to the kernel that was installed<br>
&gt; originally by Ubuntu (2.6.24-24-server).<br>
&gt; The problem still exists and I know for sure it didn&#39;t when things<br>
&gt; were first setup.<br>
&gt; - There&#39;s just no way we could have migrated 400gig of data onto the<br>
&gt; RAID if it was this flakey.<br>
&gt;<br>
&gt;<br>
&gt; Whatever it is is hardware related, and it seems to be getting worse<br>
&gt; over time...<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; David<br>
&gt;<br>
&gt;<br>
</div></div><div class="im">&gt; --<br>
&gt; Wellington Linux Users Group Mailing List: <a href="mailto:wellylug@lists.wellylug.org.nz">wellylug@lists.wellylug.org.nz</a><br>
&gt; To Leave:  <a href="http://lists.wellylug.org.nz/mailman/listinfo/wellylug" target="_blank">http://lists.wellylug.org.nz/mailman/listinfo/wellylug</a><br>
<br>
<br>
</div>--<br>
<div class="im">Daniel Reurich.<br>
<br>
Centurion Computer Technology (2005) Ltd<br>
Mobile 021 797 722<br>
<br>
<br>
<br>
<br>
--<br>
</div><div><div></div><div class="h5">Wellington Linux Users Group Mailing List: <a href="mailto:wellylug@lists.wellylug.org.nz">wellylug@lists.wellylug.org.nz</a><br>
To Leave:  <a href="http://lists.wellylug.org.nz/mailman/listinfo/wellylug" target="_blank">http://lists.wellylug.org.nz/mailman/listinfo/wellylug</a><br>
</div></div></blockquote></div><br></div>