☁️ クラウド・データ基盤 徹底解説

クラウドモデル/データアーキテクチャ/エッジコンピューティング/データガバナンス/FinOps・グリーンIT

📋 目次

  1. クラウドモデル・戦略
  2. データアーキテクチャ
  3. エッジコンピューティング
  4. データガバナンス
  5. FinOps・グリーンIT
  6. 試験直前チェック

1. クラウドモデル・戦略

責任共有モデル

クラウドの責任共有モデルでは、クラウドプロバイダーはインフラ(ハード・ネットワーク・物理施設)の安全性を責任を持ち、利用者はデータ・アプリ・アクセス管理の安全性に責任を持ちます。SaaSではプロバイダーの責任範囲が最も広く、IaaSでは利用者の責任範囲が最も広い。

マルチクラウド戦略の狙い

ソブリン・クラウドの選択動機

ソブリン・クラウドは国・地域内でデータ主権を確保するためのクラウド環境。主な選択動機はデータの国内保管要件・規制対応(金融・医療・政府機関)・地政学的リスク管理です。

SASE(Secure Access Service Edge)

ネットワークとセキュリティ機能をクラウドで統合した概念。従来は別々だったSD-WAN(ネットワーク)とCASB・SWG・ZTNA(セキュリティ)を一体化し、どこからでも安全にクラウド・SaaSにアクセスできる環境を実現します。

2. データアーキテクチャ

データレイク vs データウェアハウス

比較データレイクデータウェアハウス(DWH)
データ形式生データ(構造化・非構造化・半構造化)構造化データのみ
スキーマSchema-on-Read(読み込み時に定義)Schema-on-Write(書き込み時に定義)
用途探索的分析・ML・データサイエンス定型レポート・BIダッシュボード
コスト低コストストレージ高コスト・最適化済

CDP(Customer Data Platform)

CDPは複数のチャネル(Web・アプリ・CRM・POS等)から顧客データを統合し、統一された顧客プロファイル(ゴールデンレコード)を構築・活用するプラットフォーム。マーケティングのパーソナライゼーション基盤として機能します。

データメッシュの中核原則

データメッシュは従来の中央集権型データ管理に代わり、ドメイン(事業部門)が自らのデータを「データプロダクト」として所有・管理・提供する分散アーキテクチャです。

📌 データプロダクト思考の価値

アナリティクスのボトルネック(中央データチームへの依頼待ち)を解消する。ドメインが自律的にデータを整備・提供するため、データ利活用のスピードと品質が向上する。

データメッシュの4原則

3. エッジコンピューティング

エッジコンピューティングが適した状況

エッジコンピューティングはデータをクラウドへ送らず発生源(端末・現場)の近くで処理する手法。適しているのは:

オンデバイスAIの利点

スマートフォン等のデバイス上でAI推論を実行する手法。主な利点は①オフライン動作(通信不要)②プライバシー保護(データがデバイス外に出ない)③低遅延(通信往復なし)④通信コスト削減

レイテンシ敏感なアプリの設計

金融取引・リアルタイムゲーム・医療機器など、ミリ秒単位の遅延が致命的なアプリでは、エッジ処理+インメモリDB+ネットワーク最適化(anycast・CDN)の組み合わせが適切な設計選択です。

4. データガバナンス

データリネージ

データリネージとは、データがどこから来て、どのような変換を経て、どこに使われているかの追跡可能性(トレーサビリティ)を指します。データ品質問題の根本原因特定・規制対応・影響範囲分析に不可欠。

越境データ移転とコンプライアンス

グローバルにCDPや広告計測を運用する場合、データ発生地域の規制要件(GDPR・CCPA等)をマッピングし、SCCや十分性認定を活用した法的根拠を管轄ごとに整備することが実務的対応。域内処理を原則とし、必要最小限の越境に留める設計が重要。

オルタナティブデータの活用とリスク

衛星画像・クレジットカード取引・SNS・位置情報など非伝統的データを投資判断に活用するオルタナティブデータ。注意すべきリスクは個人情報・インサイダー情報に該当するデータの混入リスク・取得の適法性・データ品質の不確実性

5. FinOps・グリーンIT

FinOps(クラウドコスト最適化)

FinOpsはクラウドコストの可視化・最適化・文化変容を推進する実践フレームワーク。コストが可視化されても削減効果が出にくい典型理由は、エンジニアリングチームが最適化よりも機能開発を優先し、コスト責任の所在が曖昧なため。FinOpsは技術だけでなくアカウンタビリティの文化変容が鍵。

グリーンIT

グリーンITとは、ITシステム・データセンターのエネルギー消費・CO₂排出量を削減する取り組みです。主目的は環境負荷の低減であり、コスト削減はその副次的効果。

グリーンソフトウェアの実践

AI・データ基盤の環境負荷を下げつつビジネス価値を損ねない方策として、推論の効率化(モデル軽量化・量子化)・不要なデータ収集・学習の削減・エネルギー効率の高いリージョン選択・ワークロードのスケジューリング最適化が有効です。

📌 試験ポイント

FinOps失敗の原因=「可視化で止まる」「コスト責任が不明確」。グリーンITの目的=環境負荷低減(省コストは副次効果)。混同しないこと。

6. 試験直前チェックポイント

キーワード正解の方向性
責任共有モデルインフラ=プロバイダー責任 / データ・アクセス=利用者責任
マルチクラウドの狙いベンダーロックイン回避・コスト最適化・レジリエンス向上
SASEネットワーク+セキュリティのクラウド統合
データレイク生データ・Schema-on-Read・探索的分析・ML
DWH構造化データ・スキーマ定義済・定型レポートBIツール
データメッシュドメインがデータを自律管理(データプロダクト)
エッジコンピューティング低遅延・オフライン・プライバシー保護・帯域節約
FinOps失敗の原因可視化で満足・コスト責任の曖昧さ・文化変容の欠如
グリーンITの目的環境負荷低減(省コストは副次効果)