MENU

【AWS Certified Cloud Practitioner】AWS DataSync・Amazon Data Firehose・AWS Data Exchange・AWS Transfer Familyの違いを試験対策向けに整理

目次

AWS Certified Cloud Practitionerで押さえたい4サービスの全体像

AWS Certified Cloud Practitionerでは、AWSの各サービスを「何に使うのか」で見分ける力が重要です。今回扱う4サービスはすべてデータに関係しますが、役割はかなり異なります。

  • AWS DataSync:ファイルやオブジェクトデータをストレージ間で移行・同期するサービス
  • Amazon Data Firehose:リアルタイムのストリーミングデータを宛先に配信するサービス
  • AWS Data Exchange:外部組織のデータを見つけて購読・利用・共有するサービス
  • AWS Transfer Family:SFTP/FTPS/FTP/AS2でAWSストレージとファイルをやり取りするサービス

試験では、似たように見える選択肢の中から「その要件に最も合うサービス」を選ばせる問題が多く出ます。まずは4つを混同しないことが重要です。

まずは結論:最短で覚える選び分け

サービス何をするか試験での見分け方
AWS DataSyncストレージ間でファイル/オブジェクトデータを移行・同期するオンプレのNAS、NFS、SMB、HDFS、オブジェクトストレージ、S3、EFS、FSxなどが出たら有力
Amazon Data Firehoseログやイベントなどのストリーミングデータを配信先へ届けるリアルタイムログ、イベント、ストリーミング、S3やRedshiftへの継続配送なら有力
AWS Data Exchangeサードパーティーデータを見つけて購読し、AWS上で利用する外部データの契約、購読、データ製品、データ共有が出たら有力
AWS Transfer FamilySFTP/FTPS/FTP/AS2でAWSストレージと安全にファイル転送する既存のSFTP/FTPクライアントや取引先とのファイル連携が出たら有力

1. AWS DataSync

AWS DataSyncは、ファイルやオブジェクトデータをAWSストレージへ、あるいはAWSストレージ間で移行・同期するためのサービスです。AWS公式では、高速かつ安全にデータ転送を行えるサービスとして説明されています。

ポイント

  • 主な用途はデータ移行定期同期
  • オンプレミスのストレージや他の保存先からAWSへデータを移したい場面で使う
  • S3、EFS、FSxなどAWSのストレージサービスと組み合わせて使う

具体例

  • 社内のWindowsファイルサーバー(SMB)からAmazon S3へ移行する
  • オンプレミスのNASからAmazon EFSへデータを移す
  • 大量ファイルを一度だけ移すのではなく、定期的に差分同期する

試験での覚え方

問題文に「オンプレミスのファイルサーバー」「NFS」「SMB」「HDFS」「ストレージ移行」「同期」が出たら、まずDataSyncを疑います。

混同しやすいサービスとの違い

DataSyncはストレージ間の移行・同期が主役です。SFTPで外部とファイルの受け渡しをしたい場合はTransfer Familyの方が適切です。ログやイベントを継続的に配信したい話ならFirehoseです。

2. Amazon Data Firehose

Amazon Data Firehoseは、リアルタイムのストリーミングデータを受け取り、バッファリングしたうえで宛先へ配信するフルマネージドサービスです。以前はAmazon Kinesis Data Firehoseという名称で呼ばれていたため、古い教材では旧称が出ることがあります。

ポイント

  • 主な用途はログ・イベント・メトリクスなどの継続的な配送
  • データを受け取って、そのまま分析先や保存先へ流す役割
  • 配信先としてS3、Amazon Redshift、Amazon OpenSearch Serviceなどを使える

具体例

  • WebアプリのアクセスログをリアルタイムでS3へ蓄積する
  • イベントデータをAmazon Redshiftへ配信して分析する
  • 監視用ログを分析基盤へ継続的に送る

試験での覚え方

問題文に「リアルタイム」「ストリーミング」「ログを配信」「イベントを継続的に送る」があればFirehoseが有力です。

混同しやすいサービスとの違い

DataSyncはファイル移行です。一方、Firehoseは流れ続けるデータを扱います。つまり、DataSyncは「既存データを移す」寄り、Firehoseは「発生し続けるデータを届ける」寄りです。

3. AWS Data Exchange

AWS Data Exchangeは、AWS上でサードパーティーのデータセットを見つけ、購読し、利用できるサービスです。自分のデータをどこかへ転送するというより、外部データを契約して使うことに重点があります。

ポイント

  • 主な用途は外部データの購読・共有・利用権管理
  • データファイル、データテーブル、データAPIなどのデータ製品を扱う
  • AWS上の分析サービスや機械学習サービスと組み合わせやすい

具体例

  • 市場データ、金融データ、位置情報データ、業界統計データを購読する
  • ベンダーが提供するデータ製品を契約して分析に使う
  • データ提供者側として、購読可能なデータ製品を公開する

試験での覚え方

問題文に「サードパーティーデータ」「外部データの購読」「データ製品」「データの利用権」があればData Exchangeを考えます。

混同しやすいサービスとの違い

Firehoseはデータを配信するサービスです。Data Exchangeはデータそのものを見つけて契約し、使うためのサービスです。用途がまったく違います。

4. AWS Transfer Family

AWS Transfer Familyは、SFTP、FTPS、FTP、AS2、ブラウザベースの転送を使ってAWSストレージとファイルをやり取りできるフルマネージドサービスです。既存のファイル転送ワークフローを大きく変えずにAWSへ移行しやすい点が強みです。

ポイント

  • 主な用途は既存のファイル転送プロトコルをそのまま使ったAWS連携
  • 取引先や社外システムがSFTP/FTPしか使えないときに便利
  • 保存先として主にAmazon S3やAmazon EFSを利用できる

具体例

  • 取引先がSFTPで送ってくるファイルをAmazon S3で受け取る
  • 既存のFTPサーバー運用をやめて、マネージドな形でAWSへ移行する
  • B2Bのファイル受け渡しをAWS上で安全に行う

試験での覚え方

問題文に「SFTP」「FTP」「FTPS」「AS2」「取引先とのファイル連携」があればTransfer Familyが最有力です。

混同しやすいサービスとの違い

DataSyncもファイルを扱いますが、中心は移行・同期です。Transfer Familyはプロトコル互換を保って受け渡しする窓口として考えると整理しやすくなります。

4サービスの違いを一気に整理

  • DataSync:ストレージ間で大量のデータを移す・同期する
  • Firehose:リアルタイムのデータを配信先へ届ける
  • Data Exchange:外部データを見つけて購読・活用する
  • Transfer Family:SFTP/FTP系プロトコルでAWSとファイル連携する

試験で狙われやすいひっかけパターン

1. ファイル移行なのにFirehoseを選ばせるパターン

「オンプレミスのファイルサーバーからAWSへ移したい」という要件は、継続的なログ配信ではないのでFirehoseではなくDataSyncが適切です。

2. SFTPという単語を見落とすパターン

問題文にSFTP/FTP/FTPS/AS2が書かれていたら、Transfer Familyをまず確認してください。ここを見落とすとDataSyncと混同しやすくなります。

3. 外部データ利用なのにデータ転送サービスを選ぶパターン

「外部ベンダーのデータを契約して利用したい」という話は、転送ではなく購読・利用権の話です。この場合はData Exchangeが適切です。

直前復習用の一問一答

  • オンプレのSMBファイルサーバーをS3へ移行したい → AWS DataSync
  • アプリログをリアルタイムでS3やRedshiftへ送りたい → Amazon Data Firehose
  • 外部ベンダーの市場データを購読したい → AWS Data Exchange
  • 取引先がSFTPでしか送れないファイルをAWSで受けたい → AWS Transfer Family

この4サービスを覚えるための短い暗記フレーズ

  • DataSync = 移行・同期
  • Firehose = リアルタイム配送
  • Data Exchange = 外部データの購読
  • Transfer Family = SFTP/FTP連携

まとめ

AWS Certified Cloud Practitionerでは、サービス名を丸暗記するよりも、「何を移すのか」「誰とやり取りするのか」「どの形式で扱うのか」を軸に整理する方が得点につながります。

特に今回の4つは次のように整理すると迷いにくくなります。

  • ストレージ間のデータ移行・同期なら AWS DataSync
  • ログやイベントのリアルタイム配信なら Amazon Data Firehose
  • 外部データの購読・共有なら AWS Data Exchange
  • SFTP/FTP系でのファイル受け渡しなら AWS Transfer Family

この4つの違いを正確に言い分けられるようになると、Cloud Practitionerの選択問題でかなり強くなります。

参考情報(AWS公式)

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次