AWS Certified Cloud Practitioner対策:AWSのAI/MLサービスを初心者向けに整理|SageMaker・Lex・Kendra・Textractの違いが分かる
AWS Certified Cloud Practitioner(CLF-C02)では、AI/ML分野で「各サービスが何をするのか」を見分けられることが重要です。AWS公式の試験ガイドでも、Task Statement 3.7 として AWSのAI/MLサービスと、それぞれが実行するタスクを識別すること が挙げられています。
この記事では、初学者が混同しやすい AWS の AI/ML サービスを、役割・使いどころ・覚え方 の順で整理します。実装の細かい手順ではなく、試験で問われやすい「この要件ならどのサービスか」を判断できることを目標にします。
まず押さえたい結論:AWSのAI/MLは大きく2系統ある
AWSのAI/MLサービスは、大きく次の2つに分けて考えると理解しやすくなります。
1. 目的別にすぐ使えるAIサービス
すでに用途がある程度決まっているAI機能を、APIやコンソールから利用するタイプです。たとえば、次のようなものがあります。
- 音声を文字にする:Amazon Transcribe
- 文字を音声にする:Amazon Polly
- 画像や動画を解析する:Amazon Rekognition
- 文書から文字や表を抽出する:Amazon Textract
- 文章を分析する:Amazon Comprehend
- 会話ボットを作る:Amazon Lex
- 社内文書をAI検索する:Amazon Kendra
- 文章を翻訳する:Amazon Translate
これらは特定の作業をすぐ実現したいときに向いています。自分で機械学習モデルをゼロから設計・学習させる前提ではありません。
2. 自分で機械学習モデルを作るための基盤
代表が Amazon SageMaker です。SageMaker は、データ準備、モデル構築、トレーニング、評価、デプロイまでを支援する機械学習プラットフォームです。
たとえば「自社の購買データから離脱しそうな顧客を予測したい」「自社データで独自の分類モデルを作りたい」といった場合は、目的別AIサービスよりも SageMaker の出番になりやすいです。
Cloud Practitionerでの見方:細かい実装よりも“用途の識別”が大事
この試験では、機械学習アルゴリズムの詳細実装やパラメータ調整を深く問うよりも、「どのサービスがどの仕事を担当するか」 を判別できることが重要です。
たとえば、次のように判断できる状態を目指します。
- 会議音声を文字起こししたい → Amazon Transcribe
- PDFの請求書から表やフォーム項目を抜き出したい → Amazon Textract
- チャットボットを作りたい → Amazon Lex
- 社内文書を自然文で検索したい → Amazon Kendra
- 自社データで予測モデルを作りたい → Amazon SageMaker
Amazon SageMakerを初心者向けに整理
SageMaker は「機械学習をするための総合基盤」です。参考書では、SageMaker の中でも Canvas、JumpStart、Studio が並べて紹介されることがあります。ここは試験向けに役割を切り分けて覚えると混乱しません。
Amazon SageMaker Canvas
ノーコードで予測モデルを扱いやすい機能です。コードを書かずに、データを読み込んで予測やモデル構築を進められます。
たとえば、過去の顧客データを取り込み、「この顧客は解約しそうか」 を予測する、といった使い方ができます。機械学習の専門家ではない業務担当者が入りやすいのが特徴です。
イメージしやすい例
- 売上データから在庫を予測したい
- 顧客データから解約リスクを予測したい
- 価格や需要を予測したい
Amazon SageMaker JumpStart
事前学習済みモデル、ソリューションテンプレート、サンプルノートブックを使って、すばやく始めるための機能です。
ゼロから全部作るのではなく、「まず動くものを早く用意したい」「既存モデルを出発点にしたい」ときに向いています。
イメージしやすい例
- 画像分類のサンプルを土台に試してみる
- 既存モデルを使って短時間でPoCを始める
- サンプルノートブックを見ながら学習する
Amazon SageMaker Studio
機械学習開発のための統合開発環境(IDE)です。ノートブック、コードエディタ、各種ツールをまとめて扱えます。
Canvas が「ノーコード寄り」、JumpStart が「すぐ始めるための入口」だとすると、Studio は本格的に開発や実験を進める作業場という理解がしやすいです。
イメージしやすい例
- ノートブックで特徴量を作る
- モデルを学習・評価する
- 実験結果を見ながら改善する
試験向けのSageMaker覚え方
- Canvas:コードなしで予測・モデル作成
- JumpStart:事前学習済みモデルやテンプレートで早く始める
- Studio:本格的なML開発の作業場
AWSの主要AI関連サービスを一気に整理
| サービス | 何をするサービスか | 初心者向けの一言 |
|---|---|---|
| Amazon Lex | 会話型インターフェイスの構築 | チャットボット・音声ボット |
| Amazon Kendra | AI検索・情報検索 | 社内文書を賢く探す |
| Amazon Comprehend | テキスト分析 | 文章の意味を分析する |
| Amazon Polly | テキストを音声に変換 | 読み上げ |
| Amazon Rekognition | 画像・動画解析 | 画像の中身を見る |
| Amazon Textract | 文書の文字・表・フォーム抽出 | OCR+帳票理解 |
| Amazon Transcribe | 音声をテキストに変換 | 文字起こし |
| Amazon Translate | テキスト翻訳 | 多言語化 |
| Amazon SageMaker | 機械学習モデルの構築・学習・デプロイ | 自分でMLモデルを作る基盤 |
各サービスを例つきでやさしく解説
Amazon Lex:会話型AIを作る
Amazon Lex は、音声やテキストを使う会話型インターフェイスを作るサービスです。いわゆるチャットボットや音声ボットの構築に使います。
例
「配送状況を教えて」「予約を変更したい」といった質問に答えるサポートボットを作る場合に向いています。
試験での見分け方
“会話する仕組み” が必要なら Lex と考えると覚えやすいです。
Amazon Kendra:AI検索を行う
Amazon Kendra は、自然な言葉で社内文書やナレッジを検索するためのサービスです。従来のキーワード一致だけではなく、意味や文脈を踏まえて関連情報を見つけやすくします。
例
社内ポータルで「育休申請の手順は?」と入力すると、関連する規程や申請手順書を探しやすくする、といった用途です。
試験での見分け方
“検索” が主目的なら Kendra です。文章分析そのものが目的の Comprehend とは役割が違います。
Amazon Comprehend:文章を分析する
Amazon Comprehend は、文章から意味のある情報を抽出するテキスト分析サービスです。感情分析、キーフレーズ抽出、エンティティ抽出などを行えます。
用語のミニ定義
- 感情分析:文章がポジティブか、ネガティブかなどを判定すること
- エンティティ抽出:人名、地名、組織名などの固有情報を取り出すこと
例
商品レビューを分析して、肯定的な意見と否定的な意見を分類する、といった使い方です。
試験での見分け方
“文章を調べて中身を理解したい” なら Comprehend と整理すると混乱しにくいです。
Amazon Polly:テキストを音声にする
Amazon Polly は、テキストを自然な音声に変換するサービスです。
例
- ニュース記事の読み上げ
- 視覚支援のための音声案内
- 多言語の音声ガイダンス
試験での見分け方
文字 → 音声 が Polly です。逆方向の 音声 → 文字 は Transcribe です。
Amazon Rekognition:画像や動画を解析する
Amazon Rekognition は、画像や動画を解析するサービスです。物体やシーンの検出、ラベル付け、テキスト検出などを行えます。
例
- 画像の中に「車」「人」「犬」が写っているかを判定する
- 不適切コンテンツを検出する
- 動画を解析して対象を検出する
試験での見分け方
“画像・動画そのものを解析” するなら Rekognition です。
Amazon Textract:OCR+表やフォームの理解
Amazon Textract は、文書画像やPDFから文字を抽出するだけでなく、表やフォームの構造も扱えるサービスです。
単なるOCRより一歩進んでおり、「この値は請求書番号」「この欄は氏名」といった文書構造の把握に向いています。
例
- 請求書から請求先、金額、明細表を抽出する
- 申込書から氏名、住所、電話番号を取り出す
試験での見分け方
“スキャン文書から文字や表を取りたい” なら Textract です。画像解析全般の Rekognition とは用途が異なります。
Amazon Transcribe:音声をテキストにする
Amazon Transcribe は、音声を文字起こしするサービスです。録音ファイルでもストリーミング音声でも利用できます。
例
- 会議の議事録作成
- コールセンター音声の文字起こし
- 動画字幕の生成
試験での見分け方
音声 → 文字 が Transcribe。Polly とセットで逆方向の関係として覚えると強いです。
Amazon Translate:テキスト翻訳
Amazon Translate は、テキストを多言語に翻訳するサービスです。
例
- 商品説明の多言語化
- 海外向けサポート文書の翻訳
- グローバル対応アプリの翻訳機能
試験での見分け方
翻訳が必要なら Translate です。文字起こしは Transcribe、読み上げは Polly であり、役割が異なります。
よく混同される組み合わせ
Polly と Transcribe
- Polly:テキスト → 音声
- Transcribe:音声 → テキスト
Rekognition と Textract
- Rekognition:画像・動画を広く解析する
- Textract:文書から文字、表、フォームを抽出する
Kendra と Comprehend
- Kendra:検索が目的
- Comprehend:文章分析が目的
目的別AIサービス と SageMaker
- 目的別AIサービス:既製のAI機能を使う
- SageMaker:自分のデータでモデルを作る
試験直前用の最短整理
- 会話ボット → Amazon Lex
- AI検索 → Amazon Kendra
- 文章分析 → Amazon Comprehend
- 文字を音声化 → Amazon Polly
- 画像・動画解析 → Amazon Rekognition
- OCR・表・フォーム抽出 → Amazon Textract
- 音声の文字起こし → Amazon Transcribe
- 翻訳 → Amazon Translate
- MLモデル構築基盤 → Amazon SageMaker
- ノーコードで予測 → SageMaker Canvas
- 事前学習済みモデルやテンプレート → SageMaker JumpStart
- ML開発の統合環境 → SageMaker Studio
学習のコツ
Cloud Practitioner では、AI/ML サービスを細かく実装できることよりも、サービス名と役割を結びつけること が大切です。まずは「入力」と「出力」で覚えると整理しやすくなります。
- 入力が音声で出力が文字なら Transcribe
- 入力が文字で出力が音声なら Polly
- 入力が文書画像やPDFで、表やフォームも扱いたいなら Textract
- 入力が一般的な画像や動画で内容を見たいなら Rekognition
- 社内文書を検索したいなら Kendra
- 独自モデルを作りたいなら SageMaker
このレベルまで整理できると、Cloud Practitioner の AI/ML 問題ではかなり戦いやすくなります。
参考にしたAWS公式情報
- AWS Certified Cloud Practitioner(公式認定ページ)
https://aws.amazon.com/certification/certified-cloud-practitioner/ - AWS Certified Cloud Practitioner Exam Guide (CLF-C02)
https://docs.aws.amazon.com/pdfs/aws-certification/latest/cloud-practitioner-02/cloud-practitioner-02.pdf - Choosing an AWS machine learning service
https://docs.aws.amazon.com/decision-guides/latest/machine-learning-on-aws-how-to-choose/guide.html - Amazon SageMaker Canvas
https://docs.aws.amazon.com/sagemaker/latest/dg/canvas.html - SageMaker JumpStart
https://docs.aws.amazon.com/sagemaker/latest/dg/studio-jumpstart.html - Amazon SageMaker Studio
https://docs.aws.amazon.com/sagemaker/latest/dg/studio-updated.html - Amazon Lex
https://docs.aws.amazon.com/lex/latest/dg/what-is.html - Amazon Kendra
https://docs.aws.amazon.com/kendra/latest/dg/what-is-kendra.html - Amazon Comprehend
https://docs.aws.amazon.com/comprehend/latest/dg/what-is.html - Amazon Polly
https://docs.aws.amazon.com/polly/latest/dg/what-is.html - Amazon Rekognition
https://docs.aws.amazon.com/rekognition/latest/dg/what-is.html - Amazon Textract
https://docs.aws.amazon.com/textract/latest/dg/what-is.html - Amazon Transcribe
https://docs.aws.amazon.com/transcribe/latest/dg/what-is.html - Amazon Translate
https://docs.aws.amazon.com/translate/latest/dg/what-is.html
