MENU

【AWS Certified Cloud Practitioner】Comprehend・Polly・Rekognition・TranscribeなどAI系の周辺サービスを整理

目次

AWS Certified Cloud PractitionerでAI系の周辺サービスを押さえる理由

AWS Certified Cloud Practitionerでは、各サービスの細かな実装手順よりも、「どの課題に対して、どのサービスを選ぶべきか」を見分けられることが重要です。特に AI・音声・画像・文書系のサービスは、名前が似ていなくても用途が近く見えるため、選択肢問題で混同しやすい分野です。

この記事では、Amazon Comprehend、Amazon Polly、Amazon Rekognition、Amazon Transcribe を中心に、関連サービスも含めて整理します。なお、「マイナーサービス」という表現は AWS の公式分類ではありません。本記事では、EC2 や Amazon S3 などの定番サービスに比べると学習優先度が下がりやすい一方で、試験では用途の理解が問われやすい周辺サービス、という意味で使います。

最初に覚える4サービス

サービス主な入力主な出力何をするか試験での覚え方
Amazon Comprehendテキスト感情、キーフレーズ、エンティティ、言語など文章の意味や特徴を分析する自然言語処理サービス文章を理解する」サービス
Amazon Pollyテキスト音声テキストを自然な音声に変換する音声合成サービス文字 → 音声
Amazon Rekognition画像・動画物体、顔、シーン、ラベル、テキスト検出結果など画像や動画を分析するコンピュータビジョンサービス画像・映像を認識
Amazon Transcribe音声テキスト音声を文字起こしする自動音声認識サービス音声 → 文字

関連して覚えたい周辺サービス

サービス何をするか4サービスとの違い
Amazon Textract文書画像や PDF から、テキスト、表、フォームを抽出するRekognition が広く画像分析を行うのに対し、Textract は文書の読み取りに強い
Amazon Translateテキストを別言語に翻訳するComprehend は文章の意味分析、Translate は翻訳
Amazon Lex音声やテキストで会話するチャットボットを構築するPolly や Transcribe が音声入出力の一部を担うのに対し、Lex は会話の窓口全体を作る

試験での見分け方

  • 文章の内容を分析したいなら Amazon Comprehend
  • 文章を音声で読み上げたいなら Amazon Polly
  • 画像や動画の中身を認識したいなら Amazon Rekognition
  • 会話や録音音声を文字にしたいなら Amazon Transcribe
  • 請求書や申込書などの文書から項目を抽出したいなら Amazon Textract
  • 多言語対応の翻訳をしたいなら Amazon Translate
  • チャットボットや音声ボットを作りたいなら Amazon Lex

よくある混同ポイント

1. Amazon Transcribe と Amazon Polly

この2つはセットで出されやすい組み合わせです。Transcribe は音声を文字にするPolly は文字を音声にする、と入出力の向きを対で覚えると迷いにくくなります。

2. Amazon Rekognition と Amazon Textract

Rekognition は画像・動画全般の分析サービスです。一方で Textract は、請求書、申込書、帳票、身分証のような文書の文字・表・フォーム抽出に向いています。試験では「画像認識」なのか「文書読み取り」なのかを切り分けるのがポイントです。

3. Amazon Comprehend と Amazon Translate

Comprehend は文章の意味を分析するサービスで、Translate は文章を別言語に変換するサービスです。たとえば、レビューの感情分析は Comprehend、英語から日本語への翻訳は Translate が適しています。

4. Amazon Lex と他のAIサービス

Lex は単独で「翻訳」や「画像認識」をするサービスではありません。会話インターフェイスを構築するサービスであり、必要に応じて他の AWS サービスと連携して機能を広げる、という位置づけで覚えると整理しやすくなります。

試験直前に確認したい暗記ポイント

  • Comprehend = テキストの意味分析
  • Polly = テキストから音声
  • Rekognition = 画像・動画の分析
  • Transcribe = 音声から文字
  • Textract = 文書から文字・表・フォーム抽出
  • Translate = テキスト翻訳
  • Lex = 会話型ボット構築

Cloud Practitioner では、深い機械学習知識よりも、ユースケースとサービス名を正しく対応づけられるかが重要です。問題文を読んだら、まず「入力は何か」「出力は何か」を整理すると、正答にたどり着きやすくなります。

参考URL(AWS公式)

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次