yamamototis1105’s tech blog

ネットワークを中心とした技術ブログです

AWS ハイブリッドクラウドの障害テスト

はじめに

 オンプレミスネットワークの場合は機器筐体やリンクなどのシングルポイント障害に加えて、電源系統障害、拠点障害、地域障害などもテストするのが定番かと思います。

 クラウドネットワークの場合はどうでしょうか。特に、クラウド~オンプレミス間が接続されるハイブリッドクラウドでどうやってテストしてる?とよく質問いただくので整理してみました。

障害テストの必要性

 AWSマネージドのためテストできない場合もありますが、ユーザが指定したパラメータが誤っていると回復しない可能性もありますので、障害テストは可能な限り実施すべきかと思います。

 AWS Well-Architectedフレームワークの信頼性の柱、基盤や障害管理などのベストプラクティス領域でも以下のような障害テストの必要性が謳われています。

  • REL02-BP02 クラウド環境とオンプレミス環境間の冗長接続をプロビジョニングする
    許容可能な復旧時間を定義し、その要件を満たすかどうかをテストする必要があります。
  • REL12-BP05 カオスエンジニアリングを使用して回復力をテストする
    予期せぬ中断から影響を最小限に抑えて回復できることへの信頼を得ることができます。
docs.aws.amazon.com

障害テストのターゲット

 ターゲットは、①オンプレミス機器、②キャリア回線、③クラウドリソース、④リージョン/アベイラビリティゾーン、⑤オンプレミス拠点/接続ロケーションなどの構成要素単位で検討します。

障害テストのサービスおよび方法

オンプレミス機器

 機器の電源ケーブル抜線によって障害を再現させます。電源OFFでは終了処理が行われて、切替動作が変わってしまう可能性があるためです。従来の方法と変わりなし。

キャリア回線

 ONU~オンプレミス機器間のLANケーブル抜線によって障害を再現させます。I/F閉塞では終了処理が行われて、切替動作が変わってしまう可能性があるためです。従来の方法と変わりなし。

クラウドリソース

 ユーザが冗長化しているサービスは、障害テストが必要かつ実施可能です。一方、AWSマネージドで冗長化しているサービスは、障害テストが不要かつ実施不可能です。

障害テストが実施できるサービス障害テストが実施できないサービス
など
など

DirectConnect

  • BGPフェイルオーバーテスト機能を用い、VIF単位でBGPピア間の障害(1分間~72時間)を再現させます。障害テスト目的だけでなく、通信不安定時の強制切り替えでも有効か。

Site-to-Site VPN

  • BGPフェイルオーバーテストのような機能は無く、VGWやTGWのトンネル接続オプション変更やオンプレミス機器のアクセスフィルタなどで障害を再現させます。

EC2(SD-WANアプライアンスなど)

  • AWS FIS(Fault Injection Simulator)サービスを用い、インスタンス停止により障害を再現させます。その他のCPU/メモリの高騰等は、インスタンスへSSMエージェントがインストールできず、障害を再現できない場合があります。

リージョン/AZ

 リージョン/AZ内のインスタンス停止やルート削除によって障害を再現させます。リソース削除および再作成は作業リスクが大きいため避けるようにします。

 (2024-01-20 追記)
 AWS FIS(Fault Injection Simulator)サービスを用い、「aws:network:disrupt-connectivity」アクションですべてのサブネットへのトラフィックを止めた方がスマートですね。

docs.aws.amazon.com

オンプレミス拠点/接続ロケーション

 各オンプレミス機器の障害を再現させます。ただし、接続ロケーションがパートナー提供の場合にはユーザが制御できないため、各DirectConnectの障害で代替します。

まとめ

 障害テストはAWSマネージドによりユーザ負担が軽減される一方、どのようなテストが必要かつ実施可能か整理することが大事です。

おわりに

 AWS ハイブリッドクラウドの障害テストを実施される方にとって、本記事の考え方や方法等がご参考になりますと幸いです。

AWS DirectConnectパートナー選定時のチェックポイント

はじめに

 AWS DirectConnectパートナー選定時のチェックポイントを見かけなかったため、自らの経験を踏まえて本記事で整理してみました。
(2023/10/31時点の情報に基づいており、またチェックポイントは人や組織に依りますので、あくまで一例としてお捉え下さい。)

チェックポイント

接続ロケーション

 接続ロケーションやエリアの障害による全断を回避するため、以下を確認します。

  • 冗長化されたDirectConnect同士で異なる接続ロケーションが選択可能か
  • 接続先オンプレミスサイトと近しいエリアの接続ロケーションが選択可能か

 接続ロケーションの対応状況は、AWSオフィシャルサイトで確認できます。

aws.amazon.com

接続方法/仮想インタフェース

 必要な構成要件を充足するため、以下を確認します。

  • 接続帯域を1G未満に抑えたい場合、専用接続だけでなくホスト接続やホストVIFが選択可能か
    AWS側は1Gで専用接続ですが、オンプレミス側が1G未満で提供されるサービスもあります。)
  • TGWで複数VPCへ中継したい場合、PrivateVIFやPublicVIFだけでなくTransitVIFが選択可能か
    (専用接続でVLAN多重、PrivateVIFでTransitVPC中継でも代替できます。)

 接続方法/仮想インタフェースの構成は、以下の通りです。

L2/L3サービス

 AWSに対するオンプレミスサイトの多重度に応じて、以下を確認します。

  • 1:1あるいは1:少数サイトで接続する場合、専用線やIPVPNによるL2サービスが選択可能か
  • 1:多数サイトで接続する場合、AWS接続+IPVPNによるL3サービスが選択可能か

 L2/L3サービスのメリット/デメリットは、以下の通りです。

L2サービスL3サービス
メリット・通信経路が論理分割されてセキュア。
・パートナー網のルーティング検討が不要。
・費用が安い。
・パートナー網のオプション機能が利用可。
デメリット・費用が高い。
・オンプレミス追加の都度AWS作業が必要。
・パートナー網のルーティング検討が必要。
 

回線メニュー/速度

 必要な性能要件を充足するため、以下を確認します。

  • 回線メニューとして、ギャランティのほかベストエフォートがあるか
  • 回線速度として、低帯域から高帯域までのラインナップがあるか

ルーティングパラメータ

 パートナー網内のルーティング機能に関して、以下を確認します。

  • DirectConnectが冗長化される場合、パートナー網のタイマやBFD仕様で切替時間は問題無いか、メトリックやコミュニティやオーバーライド仕様で経路制御は問題無いか
  • アドバタイズされるルート数がパートナー網の上限を超過する場合、AWSやオンプレミスのほかパートナー網内でフィルタや集約は利用可能か

その他

 パートナー網内の運用機能に関して、以下を確認します。

  • トラフィックやルーティングテーブルなどのメトリックや状態をモニタリング可能か
  • リンクやネイバーのアップやダウンなどのログを記録可能か
  • APIなどで情報取得や設定変更を自動化可能か
  • BGPなどのパラメータをエクスポート可能か
  • 故障発生やメンテナンス計画などのイベントを通知可能か

おわりに

 AWS DirectConnectパートナーを選定される方にとって、本記事のチェックポイントがご参考になりますと幸いです。

ネットワークエンジニアによるAWS認定12冠達成に向けた取り組みと考え方

はじめに

 本記事は、ネットワークエンジニアがAWS認定12冠達成に向け、どのような取り組みを行ったか、どのような考え方で行ったか、自らの体験をまとめたものです。
(2023/10/1時点の情報に基づいており、また考え方や取り組みは人に依るところのため、あくまでも一例としてお捉え下さい。)

資格概要

資格体系

 ネットワークエンジニアにとっては、Advanced Networking Specialty (ANS) の関連性が最も大きいですが、その他にもネットワークの設計/運用/セキュリティなど関連する資格は多数あります。

区分資格ロール関連性
ファンダメンタルCloud Practitioner Fundamental (CLF)ラクティショナー★★☆
アソシエイトSolution Architect Associate (SAA)ソリューションアーキテクト★★☆
アソシエイトSysOps Administrator Associate (SOA)運用者★★☆
アソシエイトDeveloper Associate (DVA)開発者★☆☆
プロフェッショナルSolution Architec Professional (SAP)ソリューションアーキテクト★★☆
プロフェッショナルDevOps Engineer Professional (DOP)DevOpsエンジニア★★☆
専門知識Advanced Networking Specialty (ANS)ネットワークスペシャリスト★★★
専門知識Security Specialty (SCS)セキュリティスペシャリスト★★☆
専門知識Database Specialty (DBS)データベーススペシャリスト★☆☆
専門知識Data Analytics Specialty (DAS)データアナリスト★☆☆
専門知識Machine Learning Specialty (MLS)データサイエンティスト★☆☆
専門知識SAP on AWS Specialty (PAS)SAPスペシャリスト★☆☆

資格を取得する順序

 資格取得は、テスト範囲が被っている資格を連続して受験することがオススメです。

  1. CLF/SAAは、AWSサービス概要全体と考え方を押さえます。
  2. ANS/SCS/DBSは、どのようなシステムも関わ有用スキルのため、早期段階で身に付けることで、後続資格で繰り返し目に留めることになって、スキル定着化を図ります。
    ANSは、一般的にDirectConnectなどのサービスへ関わる機会が少なく難しいとされていますが、ネットワークエンジニアにとってはネットワークの経験がある分マシかと思います。
  3. SOA/DVA/DOP/SAPは、アソシエイトからプロフェッショナルへの流れで押さえます。
    DVA/DOPは、ネットワークエンジニアにとっては開発の経験が乏しく苦労するかもです。
  4. MLS/DASは、出題範囲が被っていますので、DBS/DAS/MLSの順に受けると良いです。
  5. PASは、オンプレミスからの移行が出題範囲のため、SAPの後で受けると良いです。

バックグラウンド

業務経歴

 業務経歴は、クラウドと関わりのあるプロジェクトへ携わることができて恵まれていました。

生活リズム

 生活リズムは、ほぼ毎日時間を確保するようにしつつも無理をしないようにしてました。

  • 平日は朝と夜の自由枠で勉強しましたが、フルリモートで通勤時間が無いことは大きかったです。
  • 休日は不規則ですが、テスト直前はカフェへ引き籠ることもありました。
  • プロジェクト繁忙期間やトラブル対応期間は無理をせずにお休みしてました。

資格に対する考え方

 資格勉強は、プロフェッショナルとして幅広く深い知識やスキル習得のための一手段だと思います。

  • 「資格を取得した」 からと言って 「仕事がデキる」 とは限りません。じゃあ資格が必要ないかと言うと、そういう訳でもありません。
  • プロフェッショナルとしてより優れた提案やデザインを行う上では、通常業務だけでは得られない幅広く深い知識やスキル習得が必要となります。
  • その実現方法の一つが資格勉強であり、その確認方法・証明方法が資格取得だと思います。

全冠を目指したきっかけ

 きっかけは、特に目標を掲げた訳でなく好奇心で始めたものだからこそ、やらされ感無く継続できたと思います。

  1. AWS All Certified Engineer 認定
    • APN企業は全ての資格を取得することで認定されますが、技術を売りにする自組織のメンバが居なかったので自分が頑張ってみようかなと奮起したこと。
  2. ネットワーク以外へ拡がる自業務
    • 自業務がネットワークだけではなくセキュリティや開発も関わるようになり、力試しで受けたセキュリティ試験も合格し、意外と全冠いけるかも?と調子こいたこと。
  3. re:Invent 2022での認定ホルダへ配布されたステッカー
    • re:Invent 2022にて自分が好きなレトロゲーっぽいドット絵のステッカーが配布されて、来年欲しいなあと思ったこと。

勉強方法

勉強の流れ

 勉強資材が多ければ合格率も上げるかと思いますが、勉強時間を抑えたく以下の通り絞りました。

勉強資材採用理由
書籍資格範囲のAWSサービスの概要や体系を学べるため。
AWSSkillBuilder無償かつ資格と関連するAWSサービス説明があり、問題も付いているため。
Blackbelt-業務でお世話になっているが、動画や資料のボリュームが大きいため。
(Blackbelt自体は素晴らしく、Cloudwatch動画などは勉強になりました。)
ガイドライン-業務でお世話になっているが、コンテンツのボリュームが大きいため。
Web問題集問題のボリュームがあり、より実践に近い問題にアップデートされるため。


 勉強の流れは勉強資材を組み合わせ、以下の通り進めました。

書籍

 書籍は「要点整理から攻略するシリーズ」「AWS認定資格試験テキストシリーズ」がオススメです。 ただし、全ての資格は対策本でカバーしてませんので、その他の技術専門書を参考にしました。

  • 書籍は1冊あたり約300~400ページですが、3~4日のペースで流し読みしました。
    読んだ時点で書いてある内容が理解できればOK、暗記しなくてOKとしました。
  • 問題集を解く中で、分からない/忘れたAWSサービス等があった場合に書籍を見返しました。
  • 時間都合上、原則としてノートやファイルにメモしませんでした。
    ただし、機械学習用語は見返すことが多かったので、1行説明メモを作ってました。

Skill Builder

 Skill Builderは「Exam Readiness」「Official Practice Question Set」がオススメです。

  • 「Exam Readiness」は、テスト範囲をカバーした解説と問題で構成されます。解説は流し読み、問題は1週目に1問も問題解かずに解答確認し、2週目以降に100%得点率を目指しました。
  • Official Practice Question Set」は、20の問題で構成されます。問題は1週目に1問も問題解かずに解答確認し、2週目以降に100%得点率を目指しました。
  • 1週目に1問も問題解かずに解答確認していた理由は、書籍や説明を読み終えた状態でも分からない問題が多く、勘で答えるなど時間の無駄だと思ったためでした。

Web問題集

 Web問題集は「CloudTech」「Web問題集で学習しよう(TechStock)」がオススメです。

  • 1週目に1問も問題解かずに解答確認し、2週目以降に100%の得点率を目指しました。
  • 問題数が多い場合は、最新200~300問程のみ実施しました。
  • 解説が分からない場合、最終的には理解することを諦めるなど、時間を費やさないことが大事です(結局、問題を覚えて解けてしまう)


 実際、各Web問題集を使ってみた結果は以下の通りです。

CloudTechWeb問題集で学習しよう(TechStock)
URLhttps://kws-cloud-tech.com/https://techstock.jp/
自ら試した
資格群
SOA/DVA/DOP/SAP/SCS/DBSDAS/MLS/PAS
問題・ 1セット7問と少なく短時間でも勉強できる
・ 1問ずつ正否判定される
・ 傾向と難易度は実際と同等
・ 1セット10問と少なく短時間でも勉強できる
・ 1問ずつ正否判定される
・ 傾向と難易度は実際と同等
解答・ 間違い理由の記載がある
・ 解説が短め
・ 間違い理由の記載がない場合がある
・ 解説が長め
費用・ 4,680円 / 3ヶ月(12資格)・4,580円 / 3ヶ月(12資格)
その他-
 
・ フラグ機能で特定の問題だけ再学習できる
・ 合格記があり安心感がある

テストの解き方

  • 時間が足りずに回答を見直しできないことがあります。そのような場合、熟読・熟考したい問題は初見でサッと回答しつつフラグを立てて、後からフラグ付き問題のみ見直すようにしましょう。
  • 最初から難しい問題が続いて心が折れることがあります。そのような場合、採点対象外問題であると自己暗示をかけて落ち着いたうえで、ベストエフォートで回答することに努めましょう。
    • 採点対象外問題は試験ガイドへ記載されている通り、今後採用可能かの評価が目的であるため採点されません。問題数が75問の場合は10問、65問の場合は15問が該当します。
  • 長文は読解するうえで時間がかかるし意味も分からないことがあります。そのような場合、AWSサービスや技術・要件キーワードを抽出し、AWS構成全体がイメージできるようにしましょう。

結果

 今までご紹介した勉強方法やテストの解き方を実践し、ペースは5ヶ月で10資格(2資格は元々持っていたもの)、自得点は合格点の平均1割増し以上で進めることができました。

区分資格取得日自得点合格点
ファンダメンタルCloud Practitioner Fundamental (CLF)2023/04/27867700
アソシエイトSolution Architect Associate (SAA)2023/12/23747720
アソシエイトSysOps Administrator Associate (SOA)2023/04/24816720
アソシエイトDeveloper Associate (DVA)2023/05/08849720
プロフェッショナルSolution Architec Professional (SAP)2023/06/27793750
プロフェッショナルDevOps Engineer Professional (DOP)2023/05/29829750
専門知識Advanced Networking Specialty (ANS)2022/07/11847750
専門知識Security Specialty (SCS)2023/04/10845750
専門知識Database Specialty (DBS)2023/05/15823750
専門知識Data Analytics Specialty (DAS)2023/08/11851750
専門知識Machine Learning Specialty (MLS)2023/08/29842750
専門知識SAP on AWS Specialty (PAS)2023/09/051,000750

まとめ

  • 資格勉強は、プロフェッショナルとして幅広く深い知識やスキル習得のための一手段です。
  • 勉強方法は、以下の書籍、SkillBuilder、Web問題集がオススメです。
    • 書籍は、「要件整理からはじめるシリーズ」「AWS認定資格試験テキストシリーズ」。
    • SkillBuilderは、「ExamReadiness」「Official Practice Question Set」。
    • Web問題集は、「CloudTech」「Web問題集で学習しよう(TechStock)」。
  • テストの解き方は、時間不足/高難度/長文読解といった問題に対して本記事を参考までに。

おわりに

 12冠達成によって何か変わったかと聞かれますが、まだ1ヶ月ですが変わったと感じることはなく、むしろ今までと変わらない新しい学びばかりです。
 AWSを勉強される方にとって、本記事の取り組みや考え方がご参考になりますと幸いです。