入力データがモデルに入力されると、モデルが適合するまでに、重みを調整します。これは相互検証プロセスの一部として行われます。教師あり学習は、受信トレイとは別のフォルダーにスパムを分類するなど、組織が実際に直面するさまざまな問題を、大規模に解決するのに役立ちます。これは、精度の高い機械学習モデルを構築するために使用できます。
特にAIガバナンスやリスク管理ソリューションの欠如など、AI導入の障壁について学びましょう。
IDCレポートを読む
教師あり学習では、トレーニング・セットを使用して、望ましい出力を得るためにモデルを教育します。このトレーニング・データ・セットには、入力と正しい出力が含まれており、これによってモデルは時間をかけて学習していきます。このアルゴリズムは、損失関数によって精度を測定し、誤差が最小限に抑えられるまで調整します。
教師あり学習は、データ・マイニングの際に、分類および回帰の2つのタイプの問題に分けられます。
教師あり機械学習プロセスでは、さまざまなアルゴリズムと計算手法が使用されています。ここでは、RやPythonなどのプログラムを使って計算が行われることが多い、最も一般的な学習方法について簡単に説明します。
教師なし機械学習と教師あり機械学習は、一緒に議論されることがよくあります。教師あり学習とは異なり、教師なし学習はラベルなしデータを使用します。そのデータから、クラスタリングや関連付けの問題を解決するためのパターンを発見します。この手法は、データ・セット内の共通の属性が不明な場合に特に有効です。一般的なクラスタリング・アルゴリズムには、階層的手法、k平均法、ガウス混合モデルがあります。
半教師あり学習は、与えられた入力データの一部にしかラベルが付けられていない場合に行われます。教師あり学習では、データを適切にラベル付けするためにドメインの専門知識に頼ることから時間とコストがかかるため、教師なし学習や半教師あり学習がより魅力的な選択肢となります。
これらのアプローチの違いを詳しく知りたい方は、「教師あり学習と教師なし学習の違いとは(Supervised vs. Unsupervised Learning: What's the Difference?)」をご覧ください。
教師あり学習モデルは、以下のような数多くのビジネス・アプリケーションの構築や進化に利用できます。
教師あり学習には、データによる深い洞察や自動化の向上など、ビジネス上のメリットをもたらしますが、持続可能な教師あり学習を構築するにはいくつかの課題があります。その課題のいくつかを以下に挙げます。