CentOS7.9、論理クラッシュによる再インストール(2021/02/23復旧)

疲れました。。。(_ _;)
それは2021/02/12(Fri)夕刻、一瞬の出来事でした。
UPSがバッテリ寿命でピーピー鳴いていたので、バッテリ交換の為に一旦シャットダウン、
ついでにメンテナンスの為にAC直結していた電源ラインをリブータ経由につなぎ替えた後、
恐らくは2つの問題がありました。
1つはサーバPCのPowerAssy.に接続される3PのACラインコードの緩み?
そしてもう1つはリブータの挙動不具合です。

結果としてサーバはブートプロセスの最中に何度も強制AC電源断となり、最後には起動すらしなくなってしまいました。
別のWin10PCで修復法をググってみましたが、CentOS7のデフォルトファイルシステム「xfs」に関しては「xfs_repair」というツールは用意されているものの、起動HDDのsuperblockがクラッシュしている場合、予備のsuperblockを探しに行く(ここで4TBのHDDだと丸1日近くの時間が必要)・・・そして、その結果「見つからなかったので修復不能」だとのたまうのです(T_T)

また、推察ですが、ここに至るまでにも何度か電源断などにより、xfsファイルシステム(inodeなど)の一部が不整合となっており「ブートパーティションを修復」するより、CentOS7.9を再びクリーンインストールしてバックアップデータ系をリストアした方が早いという結論に達しました。

ここで問題になるのは、昨年2020年末にVine6(x86)からCentOS7.9(x64)へマイグレーションを行った際のプロセス記録が、「なんちゃって管理者」の鳥頭の中にしか残ってないという事でした。最低限早急に復旧させたいパッケージは当たり前ですが、dns(named)、web(apache2)、mail(postfix/dovecot)、ftp(vsftpd)、mailinglist(mailman)といったあたりでしたが、まぁ素直にサクっとは動いてくれないのがLInuxの世の常なのでしょう。

さらに結果としてデータファイル群は別パーティションを切っていたので友人の復旧屋に頼み、物理的にはある程度復旧できましたが、Linux系のOSでは当然の仕組み「パーミッション」の復旧には至らず、ここで相当苦しむ事になりました。
/home系のユーザディレクトリはまぁそれなりに「chown -R hoge.ftponly /home/hoge」 などで何とかなるものの、問題は実行パッケージ系(/etc配下とか)及び、httpd/htmlホーム配下の(例えばこのWordPressのような)フォルダが、どのようなパーミッションで無ければならないか、まずは所有者とグループ(chown系)と、読み書き実行(chmod系)の設定がそれぞれのパッケージによって要求仕様が異なっている為、あーでもないこーでもない・・・を繰り返し、グーグル先生にお尋ねしながらトライ&エラーを繰り返し、ダウンタイムは過去最悪・最長の2021/02/12(Fri)夕刻~2021/02/23(Tue)18:00頃迄の約11日間の長きにわたりました。

本日2/24(Wed)は後始末的な設定変更をチマチマ行っていたら、突然外部networkへの接続が出来ない(見えない)状況になり、どのプロセスでそれが起こったのか解らず、昨日2/23夕刻にフリーズミラーとして残しておいたHDDに取り替え、緊急リペアリブート、別HDDにミラーリビルドしながら今に至ります。
(その後、iptablesの設定スクリプトのどこかにに問題があると判明、暫定的に軽い設定に変更)

で、更にWordPressを起動して、いつものように更新をかけようとすると、これがまた見た事の無い認証画面が出てきて先に進まない始末。。
こちらに関しては幸い下記先達者の教えにたどり着きました・・・

「WordPress更新時にFTP情報入力画面が表示される場合の対処方法3つ」
https://www.sandalot.com/wordpress%E6%9B%B4%E6%96%B0%E3%81%A7ftp%E5%85%A5%E5%8A%9B%E7%94%BB%E9%9D%A2%E3%81%8C%E8%A1%A8%E7%A4%BA%E3%81%95%E3%82%8C%E3%82%8B%E5%A0%B4%E5%90%88%E3%81%AE%E5%AF%BE%E5%87%A6%E6%B3%95/

・・/httpd/html/Wordpress/配下の所有者パーミッションが「apache.apache」では無い場合に発生する現象だった模様です。
「chown -R apache.apache ・・・/httpd/html/Wordpress/」
にて所有者情報を修正した結果、認証画面は発生せず、何事も無かったようにWebUIから更新出来るように戻りました。

某SNSには投稿済みですが「Linuxのシステム管理とは人生の縮図のようなもの」
(決して自分の思い通りには事は進まない、山あり谷あり乗り越えるべき壁がある)
と更に実感させられた日になりました。

ミラーリビルド完了までは大きな変更は危険なので、本日はこちらでボヤいて作業終了にします。

---本日までの再インストールプロセスで大きな単元として述べられる物(パッケージ)
×boot HDD起動不可
×/var/配下の一部フォルダ消失
×/home,/etcのパーミッション系消失

・CentOS7.9(2009_Everythingサーバ)・・2h程度?
・yum updateで上記への差分当て・・3h程度?
以下順不同で概ね10day以上?
・samba
・named(dns)
・postfix(MTA)
・dovecot(pop3/imap)
・iptables(firewalldから置き換え)
・fail2ban(データセットはバックアップから戻し)
・swatch(データセットはバックアップから戻し)
・apache2(httpd/web)
・php7.4へのリプレイス
・webmin
・webminstat
・vsftpd(ftp)
・chrony(ntpd)
・monit
・nmap
・ipset
・sshd(利用はローカルPCからのみ限定)
・telnet(利用はローカルホストからのテスト用途限定)
・boot画面の完全CUI化
・mailman(mailing list)データセットは旧Vine6/fml4次代の物から手作業入力戻し
・sasl2
・letsencrypt(データセットはバックアップから戻し)

ちなみに上記を動かすために必要要件とされる関連詳細パッケージ類
(perl CPANなど)は省略してます。

・・・でも多分まだまだ不足しており、気が遠くなります(T_T)

カテゴリー: 未分類 パーマリンク

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください