九州大学 情報基盤研究開発センター 研究用計算機システムニュース   No.294                                 2013.07.19

+--------------------------------------------------------------------------+ |1.MPI ライブラリの実行結果異常について                 | |  (スーパーコンピュータシステム, 高性能演算サーバシステム)       | +--------------------------------------------------------------------------+ ----------------------------------------------------------------- 情報基盤研究開発センター研究用計算機システムWWWホームページ     http://www.cc.kyushu-u.ac.jp/scp/ ----------------------------------------------------------------- 1.MPI ライブラリの実行結果異常について   (スーパーコンピュータシステム, 高性能演算サーバシステム)  スーパーコンピュータシステムFX10, 高性能演算サーバシステムCX400 の MPI ライブラリのファイル操作関数において,実行結果異常となる障害が見つかり ました.障害は Technical Computing Suite のみが該当し,9月末に修正予定 です.心当たりのある方はセンター( E-mail: request@iii.kyushu-u.ac.jp) までご相談願います. <現象と条件> 以下の条件を全て満たすとき,MPI-IOで作成されるファイルに対して書き込む 場合にファイル破壊,読み込む場合は結果異常を引き起こす場合があります. 1. 以前に以下の事象が発生し,共有ファイルポインタのテンポラリファイル (ファイル名が . で始まって .shfp. が付くファイル)が残っている. 1-1) 共有ファイルポインタによるファイルアクセスを実施している.かつ, 1-2) MPI_File_closeが行われる前に,次のいずれかの事象が発生した ‐コマンドによるジョブの削除 ‐ユーザプログラムの異常終了 ‐ MPI_Abortによるプログラムの終了 2. 共有ファイルポインタのテンポラリファイルが存在するディレクトリ上で, 同じファイル名で共有ファイルポインタによるファイルアクセスを実施する. 3. MPI_File_open 後に MPI_File_seek_shared を利用してファイルオフセット を調整していない. 共有ファイルポインタによるファイルアクセスを行う関数は以下の通りです. │非集団的 │集団的 ────────┼───────────┼────────────── ブロッキング │MPI_FILE_READ_SHARED │MPI_FILE_READ_ORDERED │MPI_FILE_WRITE_SHARED │MPI_FILE_WRITE_ORDERED ────────┼───────────┼────────────── ノンブロッキング│MPI_FILE_IREAD_SHARED │MPI_FILE_READ_ORDERED_BEGIN │MPI_FILE_IWRITE_SHARED│MPI_FILE_READ_ORDERED_END │ │MPI_FILE_WRITE_ORDERED_BEGIN │ │MPI_FILE_WRITE_ORDERED_END <回避方法> プログラム実行前に MPI-IOファイルを作成するディレクトリに対し,以下の コマンドを実施することで回避可能です.MPI-IOファイルを作成するディレク トリを mydir とします. % find mydir -regex ".*/\.[^/]+\.shfp\.[0-9]+" -exec /bin/rm {} \;