MENU

【AWS Certified Cloud Practitioner】AWSのAI/MLサービスを初心者向けに整理|SageMaker・Lex・Kendra・Textractの違いが分かる

AWS Certified Cloud Practitioner対策:AWSのAI/MLサービスを初心者向けに整理|SageMaker・Lex・Kendra・Textractの違いが分かる

AWS Certified Cloud Practitioner(CLF-C02)では、AI/ML分野で「各サービスが何をするのか」を見分けられることが重要です。AWS公式の試験ガイドでも、Task Statement 3.7 として AWSのAI/MLサービスと、それぞれが実行するタスクを識別すること が挙げられています。

この記事では、初学者が混同しやすい AWS の AI/ML サービスを、役割・使いどころ・覚え方 の順で整理します。実装の細かい手順ではなく、試験で問われやすい「この要件ならどのサービスか」を判断できることを目標にします。

目次

まず押さえたい結論:AWSのAI/MLは大きく2系統ある

AWSのAI/MLサービスは、大きく次の2つに分けて考えると理解しやすくなります。

1. 目的別にすぐ使えるAIサービス

すでに用途がある程度決まっているAI機能を、APIやコンソールから利用するタイプです。たとえば、次のようなものがあります。

  • 音声を文字にする:Amazon Transcribe
  • 文字を音声にする:Amazon Polly
  • 画像や動画を解析する:Amazon Rekognition
  • 文書から文字や表を抽出する:Amazon Textract
  • 文章を分析する:Amazon Comprehend
  • 会話ボットを作る:Amazon Lex
  • 社内文書をAI検索する:Amazon Kendra
  • 文章を翻訳する:Amazon Translate

これらは特定の作業をすぐ実現したいときに向いています。自分で機械学習モデルをゼロから設計・学習させる前提ではありません。

2. 自分で機械学習モデルを作るための基盤

代表が Amazon SageMaker です。SageMaker は、データ準備、モデル構築、トレーニング、評価、デプロイまでを支援する機械学習プラットフォームです。

たとえば「自社の購買データから離脱しそうな顧客を予測したい」「自社データで独自の分類モデルを作りたい」といった場合は、目的別AIサービスよりも SageMaker の出番になりやすいです。

Cloud Practitionerでの見方:細かい実装よりも“用途の識別”が大事

この試験では、機械学習アルゴリズムの詳細実装やパラメータ調整を深く問うよりも、「どのサービスがどの仕事を担当するか」 を判別できることが重要です。

たとえば、次のように判断できる状態を目指します。

  • 会議音声を文字起こししたい → Amazon Transcribe
  • PDFの請求書から表やフォーム項目を抜き出したい → Amazon Textract
  • チャットボットを作りたい → Amazon Lex
  • 社内文書を自然文で検索したい → Amazon Kendra
  • 自社データで予測モデルを作りたい → Amazon SageMaker

Amazon SageMakerを初心者向けに整理

SageMaker は「機械学習をするための総合基盤」です。参考書では、SageMaker の中でも CanvasJumpStartStudio が並べて紹介されることがあります。ここは試験向けに役割を切り分けて覚えると混乱しません。

Amazon SageMaker Canvas

ノーコードで予測モデルを扱いやすい機能です。コードを書かずに、データを読み込んで予測やモデル構築を進められます。

たとえば、過去の顧客データを取り込み、「この顧客は解約しそうか」 を予測する、といった使い方ができます。機械学習の専門家ではない業務担当者が入りやすいのが特徴です。

イメージしやすい例

  • 売上データから在庫を予測したい
  • 顧客データから解約リスクを予測したい
  • 価格や需要を予測したい

Amazon SageMaker JumpStart

事前学習済みモデル、ソリューションテンプレート、サンプルノートブックを使って、すばやく始めるための機能です。

ゼロから全部作るのではなく、「まず動くものを早く用意したい」「既存モデルを出発点にしたい」ときに向いています。

イメージしやすい例

  • 画像分類のサンプルを土台に試してみる
  • 既存モデルを使って短時間でPoCを始める
  • サンプルノートブックを見ながら学習する

Amazon SageMaker Studio

機械学習開発のための統合開発環境(IDE)です。ノートブック、コードエディタ、各種ツールをまとめて扱えます。

Canvas が「ノーコード寄り」、JumpStart が「すぐ始めるための入口」だとすると、Studio は本格的に開発や実験を進める作業場という理解がしやすいです。

イメージしやすい例

  • ノートブックで特徴量を作る
  • モデルを学習・評価する
  • 実験結果を見ながら改善する

試験向けのSageMaker覚え方

  • Canvas:コードなしで予測・モデル作成
  • JumpStart:事前学習済みモデルやテンプレートで早く始める
  • Studio:本格的なML開発の作業場

AWSの主要AI関連サービスを一気に整理

サービス何をするサービスか初心者向けの一言
Amazon Lex会話型インターフェイスの構築チャットボット・音声ボット
Amazon KendraAI検索・情報検索社内文書を賢く探す
Amazon Comprehendテキスト分析文章の意味を分析する
Amazon Pollyテキストを音声に変換読み上げ
Amazon Rekognition画像・動画解析画像の中身を見る
Amazon Textract文書の文字・表・フォーム抽出OCR+帳票理解
Amazon Transcribe音声をテキストに変換文字起こし
Amazon Translateテキスト翻訳多言語化
Amazon SageMaker機械学習モデルの構築・学習・デプロイ自分でMLモデルを作る基盤

各サービスを例つきでやさしく解説

Amazon Lex:会話型AIを作る

Amazon Lex は、音声やテキストを使う会話型インターフェイスを作るサービスです。いわゆるチャットボットや音声ボットの構築に使います。

「配送状況を教えて」「予約を変更したい」といった質問に答えるサポートボットを作る場合に向いています。

試験での見分け方

“会話する仕組み” が必要なら Lex と考えると覚えやすいです。

Amazon Kendra:AI検索を行う

Amazon Kendra は、自然な言葉で社内文書やナレッジを検索するためのサービスです。従来のキーワード一致だけではなく、意味や文脈を踏まえて関連情報を見つけやすくします。

社内ポータルで「育休申請の手順は?」と入力すると、関連する規程や申請手順書を探しやすくする、といった用途です。

試験での見分け方

“検索” が主目的なら Kendra です。文章分析そのものが目的の Comprehend とは役割が違います。

Amazon Comprehend:文章を分析する

Amazon Comprehend は、文章から意味のある情報を抽出するテキスト分析サービスです。感情分析、キーフレーズ抽出、エンティティ抽出などを行えます。

用語のミニ定義

  • 感情分析:文章がポジティブか、ネガティブかなどを判定すること
  • エンティティ抽出:人名、地名、組織名などの固有情報を取り出すこと

商品レビューを分析して、肯定的な意見と否定的な意見を分類する、といった使い方です。

試験での見分け方

“文章を調べて中身を理解したい” なら Comprehend と整理すると混乱しにくいです。

Amazon Polly:テキストを音声にする

Amazon Polly は、テキストを自然な音声に変換するサービスです。

  • ニュース記事の読み上げ
  • 視覚支援のための音声案内
  • 多言語の音声ガイダンス

試験での見分け方

文字 → 音声 が Polly です。逆方向の 音声 → 文字 は Transcribe です。

Amazon Rekognition:画像や動画を解析する

Amazon Rekognition は、画像や動画を解析するサービスです。物体やシーンの検出、ラベル付け、テキスト検出などを行えます。

  • 画像の中に「車」「人」「犬」が写っているかを判定する
  • 不適切コンテンツを検出する
  • 動画を解析して対象を検出する

試験での見分け方

“画像・動画そのものを解析” するなら Rekognition です。

Amazon Textract:OCR+表やフォームの理解

Amazon Textract は、文書画像やPDFから文字を抽出するだけでなく、表やフォームの構造も扱えるサービスです。

単なるOCRより一歩進んでおり、「この値は請求書番号」「この欄は氏名」といった文書構造の把握に向いています。

  • 請求書から請求先、金額、明細表を抽出する
  • 申込書から氏名、住所、電話番号を取り出す

試験での見分け方

“スキャン文書から文字や表を取りたい” なら Textract です。画像解析全般の Rekognition とは用途が異なります。

Amazon Transcribe:音声をテキストにする

Amazon Transcribe は、音声を文字起こしするサービスです。録音ファイルでもストリーミング音声でも利用できます。

  • 会議の議事録作成
  • コールセンター音声の文字起こし
  • 動画字幕の生成

試験での見分け方

音声 → 文字 が Transcribe。Polly とセットで逆方向の関係として覚えると強いです。

Amazon Translate:テキスト翻訳

Amazon Translate は、テキストを多言語に翻訳するサービスです。

  • 商品説明の多言語化
  • 海外向けサポート文書の翻訳
  • グローバル対応アプリの翻訳機能

試験での見分け方

翻訳が必要なら Translate です。文字起こしは Transcribe、読み上げは Polly であり、役割が異なります。

よく混同される組み合わせ

Polly と Transcribe

  • Polly:テキスト → 音声
  • Transcribe:音声 → テキスト

Rekognition と Textract

  • Rekognition:画像・動画を広く解析する
  • Textract:文書から文字、表、フォームを抽出する

Kendra と Comprehend

  • Kendra:検索が目的
  • Comprehend:文章分析が目的

目的別AIサービス と SageMaker

  • 目的別AIサービス:既製のAI機能を使う
  • SageMaker:自分のデータでモデルを作る

試験直前用の最短整理

  • 会話ボット → Amazon Lex
  • AI検索 → Amazon Kendra
  • 文章分析 → Amazon Comprehend
  • 文字を音声化 → Amazon Polly
  • 画像・動画解析 → Amazon Rekognition
  • OCR・表・フォーム抽出 → Amazon Textract
  • 音声の文字起こし → Amazon Transcribe
  • 翻訳 → Amazon Translate
  • MLモデル構築基盤 → Amazon SageMaker
  • ノーコードで予測 → SageMaker Canvas
  • 事前学習済みモデルやテンプレート → SageMaker JumpStart
  • ML開発の統合環境 → SageMaker Studio

学習のコツ

Cloud Practitioner では、AI/ML サービスを細かく実装できることよりも、サービス名と役割を結びつけること が大切です。まずは「入力」と「出力」で覚えると整理しやすくなります。

  • 入力が音声で出力が文字なら Transcribe
  • 入力が文字で出力が音声なら Polly
  • 入力が文書画像やPDFで、表やフォームも扱いたいなら Textract
  • 入力が一般的な画像や動画で内容を見たいなら Rekognition
  • 社内文書を検索したいなら Kendra
  • 独自モデルを作りたいなら SageMaker

このレベルまで整理できると、Cloud Practitioner の AI/ML 問題ではかなり戦いやすくなります。

参考にしたAWS公式情報

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次