AWS Certified Cloud PractitionerでAI系の周辺サービスを押さえる理由
AWS Certified Cloud Practitionerでは、各サービスの細かな実装手順よりも、「どの課題に対して、どのサービスを選ぶべきか」を見分けられることが重要です。特に AI・音声・画像・文書系のサービスは、名前が似ていなくても用途が近く見えるため、選択肢問題で混同しやすい分野です。
この記事では、Amazon Comprehend、Amazon Polly、Amazon Rekognition、Amazon Transcribe を中心に、関連サービスも含めて整理します。なお、「マイナーサービス」という表現は AWS の公式分類ではありません。本記事では、EC2 や Amazon S3 などの定番サービスに比べると学習優先度が下がりやすい一方で、試験では用途の理解が問われやすい周辺サービス、という意味で使います。
最初に覚える4サービス
| サービス | 主な入力 | 主な出力 | 何をするか | 試験での覚え方 |
|---|---|---|---|---|
| Amazon Comprehend | テキスト | 感情、キーフレーズ、エンティティ、言語など | 文章の意味や特徴を分析する自然言語処理サービス | 「文章を理解する」サービス |
| Amazon Polly | テキスト | 音声 | テキストを自然な音声に変換する音声合成サービス | 「文字 → 音声」 |
| Amazon Rekognition | 画像・動画 | 物体、顔、シーン、ラベル、テキスト検出結果など | 画像や動画を分析するコンピュータビジョンサービス | 「画像・映像を認識」 |
| Amazon Transcribe | 音声 | テキスト | 音声を文字起こしする自動音声認識サービス | 「音声 → 文字」 |
関連して覚えたい周辺サービス
| サービス | 何をするか | 4サービスとの違い |
|---|---|---|
| Amazon Textract | 文書画像や PDF から、テキスト、表、フォームを抽出する | Rekognition が広く画像分析を行うのに対し、Textract は文書の読み取りに強い |
| Amazon Translate | テキストを別言語に翻訳する | Comprehend は文章の意味分析、Translate は翻訳 |
| Amazon Lex | 音声やテキストで会話するチャットボットを構築する | Polly や Transcribe が音声入出力の一部を担うのに対し、Lex は会話の窓口全体を作る |
試験での見分け方
- 文章の内容を分析したいなら Amazon Comprehend
- 文章を音声で読み上げたいなら Amazon Polly
- 画像や動画の中身を認識したいなら Amazon Rekognition
- 会話や録音音声を文字にしたいなら Amazon Transcribe
- 請求書や申込書などの文書から項目を抽出したいなら Amazon Textract
- 多言語対応の翻訳をしたいなら Amazon Translate
- チャットボットや音声ボットを作りたいなら Amazon Lex
よくある混同ポイント
1. Amazon Transcribe と Amazon Polly
この2つはセットで出されやすい組み合わせです。Transcribe は音声を文字にする、Polly は文字を音声にする、と入出力の向きを対で覚えると迷いにくくなります。
2. Amazon Rekognition と Amazon Textract
Rekognition は画像・動画全般の分析サービスです。一方で Textract は、請求書、申込書、帳票、身分証のような文書の文字・表・フォーム抽出に向いています。試験では「画像認識」なのか「文書読み取り」なのかを切り分けるのがポイントです。
3. Amazon Comprehend と Amazon Translate
Comprehend は文章の意味を分析するサービスで、Translate は文章を別言語に変換するサービスです。たとえば、レビューの感情分析は Comprehend、英語から日本語への翻訳は Translate が適しています。
4. Amazon Lex と他のAIサービス
Lex は単独で「翻訳」や「画像認識」をするサービスではありません。会話インターフェイスを構築するサービスであり、必要に応じて他の AWS サービスと連携して機能を広げる、という位置づけで覚えると整理しやすくなります。
試験直前に確認したい暗記ポイント
- Comprehend = テキストの意味分析
- Polly = テキストから音声
- Rekognition = 画像・動画の分析
- Transcribe = 音声から文字
- Textract = 文書から文字・表・フォーム抽出
- Translate = テキスト翻訳
- Lex = 会話型ボット構築
Cloud Practitioner では、深い機械学習知識よりも、ユースケースとサービス名を正しく対応づけられるかが重要です。問題文を読んだら、まず「入力は何か」「出力は何か」を整理すると、正答にたどり着きやすくなります。
参考URL(AWS公式)
- https://aws.amazon.com/jp/certification/certified-cloud-practitioner/
- https://docs.aws.amazon.com/pdfs/aws-certification/latest/cloud-practitioner-02/cloud-practitioner-02.pdf
- https://aws.amazon.com/jp/ai/services/
- https://docs.aws.amazon.com/ja_jp/comprehend/
- https://docs.aws.amazon.com/ja_jp/polly/latest/dg/what-is.html
- https://docs.aws.amazon.com/ja_jp/rekognition/latest/dg/what-is.html
- https://docs.aws.amazon.com/ja_jp/transcribe/latest/dg/what-is.html
- https://docs.aws.amazon.com/ja_jp/textract/latest/dg/what-is.html
- https://docs.aws.amazon.com/ja_jp/translate/latest/dg/what-is.html
- https://docs.aws.amazon.com/ja_jp/lex/
