最近在處理公司老舊設備的 NFS 服務偶爾會有 timeout 的問題,關鍵是 /var/logs/message 出現以下訊息:
Apr 10 10:18:01 hostname mountd[5747]: export request from 10.51.23.31 failed.
Apr 10 10:18:04 hostname mountd[5747]: dump request from 10.51.23.31 failed.
然後 rpcbind 跟 nfs 的服務就死掉了,要 mount 的話就會出現 timeout 訊息,但重啟就會恢復。
拿了錯誤訊息餵狗之後馬上找到 RedHat 的 KB 文件「What is these nfs mountd messages “export / dump request from x.x.x.x failed” on Red Hat Enterprise Linux 5」,可是 RedHat 的 KB 要有帳號才能看 (掯)
另尋他路找到另一篇寫到 RedHat 的 bug「Bug 236823 – exportfs gives inconsistent results when run immediately after nfs service is restarted」
文內最後有講到該 bug 修在 nfs-utils-1.0.9-18 版本
Fixed in nfs-utils-1.0.9-18.el5
yum 升級 nfs-utils 後果然就沒再遇到這個問題了 …