さて、以前、共有メモリの方の並列計算機がコンパイラだか MPI 用のだかのパッチを当てた後に使えなくなったという話を書いた。その後、コンパイル時の最適化っぷりを下げれば使えることが判明したのだが...
昨日からまたメンテだった。昨日帰る時に計算機のヒトが「分散メモリさんの方はまだだけど、共有メモリくんは使えるから。これでもう完璧よん。」と言っていた。今朝ちょっと試してみた。
おおー!どんな低い最適化レベルでもクラッシュする、完璧に使えない状態になっていた。
計算機のヒトは何にも分かってないということだけが良く分かった。回復の見込みナス。業者さん呼んで〜。
悲劇を通り越して喜劇に化けてしまいましたな。
しかし、、、その彼はテストしていないのかね。
いや、普通に悲劇だよ。それと♂ではなく♀。自分で計算するヒトじゃないからテストはできないみたい。
自分以外はみんな喜劇だと思っているっていうツライ状況に陥った経験を?(戸田奈津子風)
ワリトミンナヒドイモノデスヨ。
しつれい、ネカマ語で書いてあったから♂かと。
しかし、簡単なコードが動くかどうかもせずに完璧とはこれいかに?
「ものすごくかんたん」なのは動いちゃったのかねぇ。
少なくともユーザーは誰も喜劇だとは思っていないだろう。
ものすごく簡単なコードではおこらないのかも。発生条件が良くわなのだけど、しばらく流してると配列がぶっこわれる。
うー、しばらくってのが引っかかるね、やっぱコンパイラの問題なのかな?
古いやつに戻せないのかな、、、ということはすでに試しているか・・・
あるいは、どれかのCPUファンとか電源ファンがとまっていて熱暴走?
OSがとまらないからそれも脈なしかな。
わからんちんねぇ。
OMPは大丈夫みたいなので MPI 関係の不具合のよう。
古いのに戻すって発想はないみたいよ。さっき、トラブル報告をしたら「よし、ではあとふたつパッチを当てるわん!」と意気込んでいたから。ま、これ以上悪くなるとしたらハードディスクが飛ぶくらいしかないから好きにすればいいと思う。
そして最初からきれいさっぱり環境構築と・・・
なんか、ぜつぼーてきですな。
個人的にはコンパイラではないと思ってるんだけど。2日前まではおぷちまいずれべるを下げればちゃんと使えたんだ。で、同じばいなりーを実行してる間に計算機のヒトが何かを変更したらしく、その計算も途中からおかしくなった。以後、くらっしゅまくり。故に通信をなんかしてる部分がどーかなってると思うのだ。
とりあえずシステム全体を再起動とかいかが?
そんなことはもう何度も何度も何度も何度もしていて、その度にジョブが中断され、なおかつ状況が悪くなって行ってるんだよ。