2024年7月19日に発生したWindowsブルースクリーン障害(BSoD)の余波が完全には収束していません。全世界で同時に発生し約850万台のWindows PCに影響を及ぼしたのみならず、Windowsベースの商用システムにも波及し、フライト運行システムが停止して空港で足止めされるニュース映像がテレビに流れるなど、社会的にも大きな問題として捉えられています。

私を含め当社では影響なく、当日も普段どおりにPCを使って業務をしており、世間の”ブルスク祭り”を早い復旧を祈りながら見守っていました。報道に触れてCitrixの影響範囲を整理し、改めて仮想アプリケーション、仮想デスクトップ(今回はまとめてVDIと総称)の有効性を考えてみました。

当社ではなぜ影響を回避できたのか?
CrowdStrikeのアップデートが原因とされ、Windows OSが異常を検知したことでPCの通常操作ができなくなった訳ですが、当社ではCrowdStrikeを使っておらず障害は発生しませんでした。仮に発生したとしても、障害が発生していない別のデバイスからVDIに接続すれば、通常の自分用Windowsデスクトップが利用できます。パニックに陥る必要はありません。管理者側で復旧対応が可能です。
今回のBSoDは不幸な障害ですが、これもビジネス継続性計画(BCP)で想定される範囲の事象といえるでしょう。VDIはBCPに効くのです。

VDIの仕組みとアドバンテージ
物理PCではOS、ユーザープロファイル、アプリケーション、データが同じPCという環境にあり、相互に連携して業務処理を行います。下図で示す利用環境と実行環境が同じ(= PC)です。
VDIではOS, プロファイル、アプリケーション、データを物理PCから分離し、クラウドまたはデータセンターで動的に構成します。仮想デスクトップあるいは仮想PCと呼ばれる環境がクラウド/データセンターに用意される(= クラウドまたはデータセンターでPCが起動する)と、その画面イメージを利用環境へ転送します。

ユーザーは手元にある任意のデバイス画面で転送された画面イメージを表示し、キーボード、マウス、トラックパッドを使い、通常のPCと同じように操作します。

実行環境での各構成要素をいかに効率よく必要数を構成するか、画面イメージ転送のパフォーマンスをいかに高めるかが、シトリックスのノウハウでありアドバンテージです。

いつでもどこにいてもPC環境につながり業務を遂行できること、セキュリティを含めたPC端末のメンテナンスの大部分がセンター側に集約されることで、ユーザー生産性とIT管理性が両立します。

先日聞いたお客様の言葉、「6万台あまりのPCメンテナンスが本当にラク。セキュリティチームはVDIが最強と言っている」はリアリティがあります。

VDIならブルースクリーン障害(BSoD)は回避できたか?
Windows Server上でさまざまな仕組みを展開することから、CrowdStrikeも利用する環境であれば今回の障害の影響を受けた可能性がありますが、Citrix Cloudのサービスには影響ありません。
Cirix DaaSのお客様でWorkspaceやGateway Serviceを経由して利用するお客様は、自社内のインフラ(Active Directory, Cloud Connectorなど)を確認してください。
一方、オンプレミスでお客様自身(インテグレータ等に委託することを含む)が管理・運用する場合は、以下のコンポーネントを順番に確認してください。

Cloud Connector
StoreFrontワークロードとWorkspaceワークロードの両方で、ユーザーログインやリソース提示に問題が発生する可能性があります。

Delivery Controller
ユーザーログインやリソース提示に問題が発生する可能性があります。

VDA
アプリケーションやデスクトップを起動できない可能性があります。

StoreFront
ユーザーはStoreFrontのURLにアクセスできず、目的のアプリケーションやデスクトップを選択できない可能性があります。

Federated Authentication Services
VDAへログインできない可能性があります。

Director
管理者は実行中のセッションへのアクション実行やレポート表示ができない可能性があります(監視データはSQLに記録されます)。

SQL Server
他のコンポーネントが機能していれば、LHCモードに(サイト接続仲介操作を継続できるように)切り替わる可能性があります。

License Server
他のコンポーネントが機能していれば、ライセンスキャッシュモードに(ライセンス払い出しをキャッシュによって暫定的に維持)切り替わる可能性があります。

永続VDA
ユーザー用設定済みWindows環境を固定して使う場合、信頼できるバックアップからリストアするか、CrowdStrike推奨の修正を適用してください。

非永続VDA

自動アップデートしないので、障害は発生していません。もし発生した場合は、VDAを再起動するとゴールデンイメージにリセットされます。

App Layering
このアプリケーション配信アプライアンスはWindowsベースでなく、障害は発生しません。App Layeringの配信イメージは非永続マシンとして扱われます。

ユーザー利用端末
Windows端末であれば、CrowdStrike推奨の修正を適用してください。Mac, Linux, Chromebook, シンクライアント、スマートフォンなどWindows以外の端末は影響を受けません。

上記を確認することで、障害が発生しても影響を最小限に留め早く復旧することができます。

プロビジョニングサービス(PVS)が面目躍如
VMイメージを、ネットブートの仕組みをベースに、大量に高速に展開するツールがPVS。新規展開はもちろん、不具合発生のVMをロールバックする、あるいは改修済みの新たなイメージを一斉展開する際に威力を発揮します。
以下はPVSを使って2240個のVMをAzure East USに展開した際の実測値です。

8分以内に、2240個のうち99.96%の展開が完了!
(Standard D4as v4インスタンス x 2240個)

今、VDIは買いか?
今もVDIは「買い」です。
ITの世界でもトレンドは数年周期でいったりきたり。サーバー集約が進んだ後には分散が、クラウド化も進むけどオンプレミス回帰も見られる。
VDIは過去のテクノロジートレンドだと思っている方、トレンドと捉えるのではなく、その本質を理解し自社のIT目的に必要かどうかを判断してください。

CitrixのVDIの本質は、
高いセキュリティ
高い柔軟性
高い生産性
適切なROI
です。

同時に、普段は前面に出ないBCP対策にも、その役割を果たしてくれます。

古くて新しいテクノジー、CitrixをプラットフォームにVDIを全社員のワークスペースに!(このブログは2024年7月22日に執筆されました)