VPS障害時の復旧手順:トラブルシューティング完全ガイド
VPSに障害が発生した際の復旧手順を徹底解説。SSH接続不可や再起動が必要な場合のトラブルシューティング方法をステップバイステップで紹介。
VPS障害とは?よくある原因と症状
VPS(Virtual Private Server)は、仮想化技術を用いて1台の物理サーバーを複数の仮想サーバーに分割したサービスです。障害が発生すると、Webサイトの表示不可、SSH接続不能、アプリケーションの応答停止などが起こります。主な原因は、OSやソフトウェアの不具合、リソース不足、ネットワーク障害、セキュリティ問題などです。
障害発生時の初期対応
1. 冷静に状況を把握する
* 最新の操作や変更を思い出す(設定変更、アップデート、新規インストールなど) * 障害の範囲を確認(特定のサービスだけか、全体か) * 管理パネル(コントロールパネル)にログインできるか確認
2. 管理パネルからVPSの状態を確認
ほとんどのVPSプロバイダーは、Webベースの管理パネルを提供しています。ここで以下の情報を確認します。
* ステータス: 起動中・停止中・サスペンド中 * リソース使用率: CPU、メモリ、ディスク、帯域幅 * ネットワーク: IPアドレス、ポート開放状況 * コンソール: ブラウザから直接OSにアクセス可能(VNCやシリアルコンソール)
SSH接続不可の場合の復旧手順
SSHで接続できない場合、まずは管理パネルのコンソール機能を使ってサーバーにアクセスします。
ステップ1: コンソールにログイン
管理パネルから「コンソール」や「VNC」を選択し、ユーザー名とパスワードでログインします。
ステップ2: SSHサービスの状態確認
systemctl status sshd
<h1>または</h1>
service sshd status
停止している場合は起動します。
sudo systemctl start sshd
sudo systemctl enable sshd
ステップ3: ファイアウォールの確認
sudo iptables -L -n
<h1>または ufw の場合</h1>
sudo ufw status
SSHポート(デフォルト22)が許可されているか確認します。許可されていない場合は追加します。
sudo ufw allow 22/tcp
sudo ufw reload
ステップ4: SSHの設定ファイル確認
/etc/ssh/sshd_config を確認し、Port や PermitRootLogin などの設定が適切か確認します。変更後はサービス再起動。
VPSの再起動手順
管理パネルからの再起動
最も簡単な方法は、管理パネルにある「再起動」ボタンをクリックすることです。
コンソールからの再起動
コンソールにログイン後、以下のコマンドを実行します。
sudo reboot
強制再起動(最終手段)
管理パネルから「強制再起動」または「電源オフ/オン」を選択します。データ破損のリスクがあるため、通常の再起動が効かない場合のみ使用します。
よくあるトラブルと解決策
1. ディスク容量不足
df -h で確認し、不要なログファイルやキャッシュを削除します。
sudo journalctl --vacuum-size=100M # ログを100MBに制限
sudo apt autoremove # 不要パッケージ削除
2. メモリ不足(OOM Killer)
free -m で確認し、不要なプロセスを停止します。スワップを有効にするのも有効です。
sudo fallocate -l 2G /swapfile
sudo chmod 600 /swapfile
sudo mkswap /swapfile
sudo swapon /swapfile
3. ネットワーク設定ミス
ip a でIPアドレスを確認し、/etc/netplan/ や /etc/network/interfaces の設定を見直します。
障害復旧後のチェックリスト
* SSH接続が正常に行えるか * Webサーバー(Apache/Nginx)が起動しているか * データベース(MySQL/PostgreSQL)が動作しているか * メールサービスが正常か * ログにエラーが残っていないか
予防策
* 定期的なバックアップ(管理パネルのスナップショット機能を活用) * リソース監視ツールの導入(Munin, Nagiosなど) * セキュリティアップデートの自動適用 * SSHの鍵認証設定とポート変更 * 障害時対応手順書の作成
*この記事は実際のVPS環境での構築経験に基づいています。料金・スペックは執筆時点のものであり、最新情報は各事業者の公式サイトでご確認ください。*
まとめ
VPS障害は誰にでも起こり得ます。重要なのは、落ち着いて管理パネルから状況を把握し、段階的に復旧を試みることです。本ガイドで紹介した手順を参考に、日頃から準備と予防策を徹底しましょう。