【AWS Certified Cloud Practitioner】Comprehend・Polly・Rekognition・TranscribeなどAI系の周辺サービスを整理

2026年4月9日

AWS Certified Cloud PractitionerでAI系の周辺サービスを押さえる理由

AWS Certified Cloud Practitionerでは、各サービスの細かな実装手順よりも、「どの課題に対して、どのサービスを選ぶべきか」を見分けられることが重要です。特に AI・音声・画像・文書系のサービスは、名前が似ていなくても用途が近く見えるため、選択肢問題で混同しやすい分野です。

この記事では、Amazon Comprehend、Amazon Polly、Amazon Rekognition、Amazon Transcribe を中心に、関連サービスも含めて整理します。なお、「マイナーサービス」という表現は AWS の公式分類ではありません。本記事では、EC2 や Amazon S3 などの定番サービスに比べると学習優先度が下がりやすい一方で、試験では用途の理解が問われやすい周辺サービス、という意味で使います。

最初に覚える4サービス

サービス	主な入力	主な出力	何をするか	試験での覚え方
Amazon Comprehend	テキスト	感情、キーフレーズ、エンティティ、言語など	文章の意味や特徴を分析する自然言語処理サービス	「文章を理解する」サービス
Amazon Polly	テキスト	音声	テキストを自然な音声に変換する音声合成サービス	「文字 → 音声」
Amazon Rekognition	画像・動画	物体、顔、シーン、ラベル、テキスト検出結果など	画像や動画を分析するコンピュータビジョンサービス	「画像・映像を認識」
Amazon Transcribe	音声	テキスト	音声を文字起こしする自動音声認識サービス	「音声 → 文字」

サービス	何をするか	4サービスとの違い
Amazon Textract	文書画像や PDF から、テキスト、表、フォームを抽出する	Rekognition が広く画像分析を行うのに対し、Textract は文書の読み取りに強い
Amazon Translate	テキストを別言語に翻訳する	Comprehend は文章の意味分析、Translate は翻訳
Amazon Lex	音声やテキストで会話するチャットボットを構築する	Polly や Transcribe が音声入出力の一部を担うのに対し、Lex は会話の窓口全体を作る

試験での見分け方

文章の内容を分析したいなら Amazon Comprehend
文章を音声で読み上げたいなら Amazon Polly
画像や動画の中身を認識したいなら Amazon Rekognition
会話や録音音声を文字にしたいなら Amazon Transcribe
請求書や申込書などの文書から項目を抽出したいなら Amazon Textract
多言語対応の翻訳をしたいなら Amazon Translate
チャットボットや音声ボットを作りたいなら Amazon Lex

よくある混同ポイント

1. Amazon Transcribe と Amazon Polly

この2つはセットで出されやすい組み合わせです。Transcribe は音声を文字にする、Polly は文字を音声にする、と入出力の向きを対で覚えると迷いにくくなります。

2. Amazon Rekognition と Amazon Textract

Rekognition は画像・動画全般の分析サービスです。一方で Textract は、請求書、申込書、帳票、身分証のような文書の文字・表・フォーム抽出に向いています。試験では「画像認識」なのか「文書読み取り」なのかを切り分けるのがポイントです。

3. Amazon Comprehend と Amazon Translate

Comprehend は文章の意味を分析するサービスで、Translate は文章を別言語に変換するサービスです。たとえば、レビューの感情分析は Comprehend、英語から日本語への翻訳は Translate が適しています。

4. Amazon Lex と他のAIサービス

Lex は単独で「翻訳」や「画像認識」をするサービスではありません。会話インターフェイスを構築するサービスであり、必要に応じて他の AWS サービスと連携して機能を広げる、という位置づけで覚えると整理しやすくなります。

試験直前に確認したい暗記ポイント

Comprehend = テキストの意味分析
Polly = テキストから音声
Rekognition = 画像・動画の分析
Transcribe = 音声から文字
Textract = 文書から文字・表・フォーム抽出
Translate = テキスト翻訳
Lex = 会話型ボット構築

Cloud Practitioner では、深い機械学習知識よりも、ユースケースとサービス名を正しく対応づけられるかが重要です。問題文を読んだら、まず「入力は何か」「出力は何か」を整理すると、正答にたどり着きやすくなります。

参考URL（AWS公式）

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！