ホーム Topics 自然言語処理とは何か? NLP(自然言語処理)とは
IBMのNLPソリューションの詳細はこちら AI関連の最新情報の購読
人間の会話を処理し、そこから学習するロボットの顔

更新日:2024年6月6日
寄稿者:Jim Holdsworth

NLPとは

自然言語処理(NLP)は、コンピューター・サイエンスと 人工知能(AI)のサブフィールドで、機械学習を使用してコンピューターが人間の言語を理解してコミュニケーションできるようにします。

NLPは、計算言語学(人間の言語ルール・ベースのモデリング)、統計モデリング、機械学習(ML) 、ディープラーニングを組み合わせることで、コンピューターやデジタル・デバイスがテキストや音声を認識、理解、生成できるようにします。

NLP研究により、大規模言語モデル(LLM)のコミュニケーション・スキルから画像生成モデルの要求理解能力まで、生成AIが活躍する時代が到来しました。NLPはすでに多くの人々の日常生活の一部となっており、検索エンジンのコア要素となったり、音声コマンドによるカスタマー・サービス用のチャットボットのプロンプト生成、音声操作のGPSシステム、スマートフォンのデジタル・アシスタントなど、幅広く利用されています。

それだけではありません。NLPは、業務の効率化および自動化、従業員の生産性の向上、基幹業務ビジネスのプロセスの簡素化を助ける企業向けのソリューションでも、さらに多くの役割を果たすようになっています。

適切なAI基盤モデルの選択方法

このモデル選択フレームワークを使用して、パフォーマンス要件とコスト、リスク、導入ニーズのバランスをとりながら、最も適切なモデルを選択してください。

関連コンテンツ

AIガバナンスに関するホワイトペーパーに登録する

NLPのメリット

自然言語処理システムは迅速かつ効率的に動作します。NLPモデルが適切にトレーニングされた後は、管理タスクを引き受けることができるため、従業員はより生産的な作業に時間を費やすことができます。それによるメリットの一部をご紹介しましょう。

より迅速な洞察の発見組織は、複数のコンテンツにまたがり潜むパターン、傾向、関係性を見つけることができます。テキスト・データの取得により、より深い洞察と分析が可能になり、より情報に基づいた意思決定が可能になり、新しいビジネス・アイデアがひらめくようになるでしょう。

予算の大幅縮小:非構造化テキスト・データを大量に利用できるため、NLPを使用すると、情報の収集、処理、整理を自動化し、人為的作業を減らせます。

企業データへの素早いアクセス企業は、次の知識ベースを構築できます。AI 検索により組織情報に効率的にアクセスできるようになります。NLPは関連情報を迅速に返し、顧客サービスを向上させ、販売を成立させるのに役立ちます。

NLPの課題

人間も話し言葉で間違えを起こしやすいのと同様に、NLPモデルは完璧ではありませんし、おそらく完璧になることはないでしょう。リスクの例としては以下のようなものがあります。

偏りのあるトレーニング:どのAI機能にも言えることですが、トレーニングに使われるデータに偏りがあると、答えも偏ってしまいます。NLP機能の利用者が多種多様であればあるほど、行政サービス、医療、人事業務などにおけるリスクがより重大なものとなります。例えば、Webサイトからかき集めたトレーニング・データ・セットは偏りがある傾向があります。

誤解:プログラミングと同様、GIGO(ごみを入れたらゴミが出てくる)のリスクがあります。NLPソリューションは、音声入力がよくわからない方言、つぶやき、スラング、同音異義語、間違った文法、慣用句、断片、発音の誤り、短縮語が多すぎるなどの問題を含んで話された場合、または背景の騒音が大きすぎる場合に混乱する可能性があります。

新しい言葉:新しい言葉は常に生み出され、あるいは輸入されています。文法の慣習は進化することもあれば、意図的に破られることもあります。このような場合、NLPは最善の推測をすることも、確信が持てないと認めることもできますが、いずれにしても、こうしたことは複雑さを招きます。

話し方:人が話すとき、その話し方やボディランゲージにより、言葉だけとはまったく違う意味を与えることがあります。効果を得るために誇張したり、重要性や皮肉を込めて単語を強調したりすると、NLPでは混乱する可能性があり、意味分析がより困難になり、信頼性が低くなります。

人間の言語は、曖昧さが溢れています。その曖昧さが、テキストまたは音声データが意図する意味を正確に判別するソフトウェアの開発をさらに難しくしています。人間が言語を習得するには何年もかかる可能性があり、多くの人は学習をやめません。しかし、プログラマーは、自然言語駆動のアプリケーションに不規則性を認識して理解するように教えて、そのアプリケーションを正確で有用なものにする必要があります。

NLPの仕組み

NLPは、計算言語学と機械学習アルゴリズムおよびディープラーニング深層学習を組み合わせたものです。計算言語学は、データサイエンスを使用して言語と音声を分析する言語学の分野です。これには、構文分析と意味分析という2種類の主要分析が含まれます。構文分析では、単語の構文を解析し、事前にプログラムされた文法規則を適用することによって、単語、フレーズ、または文の意味を判断します。意味分析では、構文出力を使用して単語から意味を引き出し、文構造内でその意味を解釈します。

単語の解析では、次の2つのうちいずれかの解析が行われます。依存関係解析では、名詞と動詞の識別など、単語間の関係が調べられます。一方、構成要素解析では、文または単語の文字列の構文構造をルート化して順序付けして表現した解析ツリー(または構文ツリー)が構築されます。結果として得られる解析ツリーは、言語翻訳者と音声認識の機能の基盤となります。理想的には、この分析により、テキストまたは音声のいずれの出力でも、NLPモデルとユーザーの両方が理解できるようになることが期待されます。

特に、自己教師学習(SSL)は、最先端の人工知能(AI)モデルをトレーニングするために大量のラベル付きデータを必要とするNLPをサポートするのに役立ちます。このようなラベル付けされたデータセットには時間のかかる注釈(人間が手動でラベル付けするプロセス)が必要なため、十分なデータを収集することは非常に困難です。自己教師ありアプローチは、トレーニング・データに手動でラベルを付ける必要の一部またはすべてを置き換えるため、時間とコスト効率が向上します。

NLPには、次の3つのアプローチがあります。

ルール・ベースNLP:初期のNLPアプリケーションは単純なif-then Decision Treesで、あらかじめプログラムされたルールが必要でした。特定のプロンプトに応答してのみ回答を提供できます。この一例が、Moviefoneのオリジナル・バージョンです。ルールベースのNLPには機械学習やAI機能がないため、この機能は非常に制限されており、拡張性がありません。

統計的NLP:後に開発された統計NLPは、テキストと音声データの要素を自動的に抽出し、分類してラベル付けすることで、それらの要素の考えられる意味ごとに統計的な尤度を割り当てます。これは機械学習に依存しており、品詞タグ付けのような言語学の高度な分解を可能にします。

統計NLPでは、単語や文法規則などの言語要素をベクトル表現にマッピングする重要な手法が導入され、回帰モデルやマルコフ・モデルなどの数学的(統計的)手法を使用して言語をモデル化できるようになりました。これは、スペルチェッカーやT9テキスト送信(プッシュ電話でかつて使用されていた9つのアルファベット・キーを用いたテキスト送信)など、初期のNLP開発に影響を与えました。

ディープラーニングNLP:近年、ディープラーニング・モデルは、テキストと音声の両方で、膨大な量の未加工非構造化データを使用してさらに精度を高めるNLPの主流モードになりました。ディープラーニングは、統計的NLPのさらなる進化とみなすことができますが、ニューラル・ネットワーク・モデルを使用するという違いがあります。モデルには、次のように複数のサブカテゴリーがあります。

  • シーケンス・ツー・シーケンス(seq2seq)モデルリカレント・ニューラル・ネットワーク(RNN)に基づき、ある領域(ドイツ語など)のフレーズを別の領域(英語など)のフレーズに変換する機械翻訳に主に使用されています。

  • トランスフォーマー・モデル言語の トークン化(各トークン(単語またはサブワード)の位置)と自己注意(依存関係と関係性をキャプチャするもの)を使用して、異なる言語部分間の関係を計算します。トランスフォーマー・モデルは、大規模なテキスト・データベースで自己教師あり学習を使用して効率的にトレーニングできます。トランスフォーマー・モデルで注目すべき点は、Googleのトランスフォーマーからの双方向エンコーダー表現(BERT)で、これはGoogleの検索エンジンの動作の基礎となり、現在もそうあり続けています。

  • 自己回帰モデル:この 種のトランスフォーマー・モデルは、シーケンス内の次の単語を予測するように特別にトレーニングされており、テキスト生成能力の大きな進歩をもたらしています。自己回帰LLMの例としては、GPT、Llama、Claude、オープンソースのMistralなどがあります。

  • 基盤モデル:あらかじめ構築され、キュレートされた基盤モデルにより、NLPプロジェクトの成果物達成が迅速化され、その結果に対する信頼が高まっています。例えば、IBM Granite基盤モデルは、さまざまな業界で広く適用できます。実際、コンテンツ生成や洞察抽出などのNLPタスクをサポートしており、さらには、モデルを外部の知識ソースにリンクすることで応答の品質を向上させるフレームワークである、検索強化生成も促進しています。モデルは、テキスト内の重要な情報を識別して抽出するNamed Entity Recognitionも実行します。

これらのテクノロジーとその学習アプローチの違いについて詳しくは、「 AI vs. Machine Learning vs. Deep Learning vs. Neural Networks: What’s the Difference?(AI、機械学習、ディープラーニング、ニューラル・ネットワークの違い:何が違うのか)」をご覧ください。

NLPのタスク

複数のNLPタスクでは通常、コンピューターが取り込んだ人間のテキストと音声データを理解できる形で処理します。これらのタスクには、次のようなものがあります。


言語タスク

  • 共参照解析は、2つの単語が、同じエンティティーを指している場合にそれを特定するタスクです。よくある例は、特定の代名詞が指す人または物を判別すること(例:「she」が「Mary」を指すこと)ですが、テキスト中の比喩やイディオムの特定 (例:「bear」が動物ではなく、体が大きくて毛深い人のことを指すという事例)も含まれます。
  • Named Entity RecognitionNER)は、単語またはフレーズを有用なエンティティーとして特定します。NERは「ロンドン」を場所として、「マリア」を人名として識別します。

  • 品詞タグ付けは、文法タグ付けとも呼ばれ、単語やテキストがどの品詞であるかを、その使用法や文脈に基づいて判断するプロセスです。例えば、「Make」を取り上げて説明すると、「I can make a paper plane」では「Make」を「作る」を動詞として識別し、「What make of car do you own?」では、これを「メーカー」という名詞として識別します。

  • 語義の曖昧性解消とは、複数の意味の可能性がある単語に対して語義を選択することです。これは意味分析プロセスを使用して、文脈に照らした言葉の意味を調べます。例えば、語義の曖昧性解消は、動詞「make」は、「make the grade」では「達成する」という意味で、「make a bet」では「賭けをする」という意味であるというように意味を区別する助けとなります。「I will be merry when I marry Mary」という文から「メアリーと結婚したら幸せになれる」という意味だという結論を出すには、洗練されたNLPシステムが必要です。

 

ユーザー支援業務

  • 音声認識Speech to Textとも呼ばれます)は、音声データをテキスト・データに確実に変換するタスクです。音声認識は、音声による指示に従ったり、音声による質問に答えたりするあらゆるアプリケーションで必要とされます。音声認識を特に困難にしているのは、人々の話し方、つまり、異なる言葉を強調したり、イントネーションが異なるだけではなく、早口で前の言葉につながるように話すためです。

  • 自然言語生成(NLG)は、音声認識や音声テキスト変換の逆方向に作用するものと説明できます。つまり、NLGは、構造化された情報を人間の会話言語に変換するタスクです。NLG がなければ、コンピューターが人間の会話を模倣するチューリング・テストに合格する可能性はほぼゼロと言えるでしょう。AmazonのAlexaやAppleのSiriなどの対話エージェントはすでにこれをうまく実践しており、顧客をリアルタイムでサポートしています。

  • 自然言語理解(NLU) は、文章の意味を分析することに重点を置いたNLPのサブセットです。NLUにより、ソフトウェアは異なる文で類似した意味を見つけたり、異なる意味を持つ単語を処理したりできるようになります。

  • 感情分析は、テキストから主観的な性質(態度、感情、皮肉、混乱、疑惑)を抽出しようと試みます。これにより、その対応ができるシステムまたは担当者にお客様をつなぐためによく使用されています。

これらの概念がどのように関連するかについて詳しくは、ブログ記事「 NLP vs. NLU vs. NLG: the differences between three natural language processing concepts(NLP、NLU、NLGの違い:3種類の自然言語処理コンセプトにおける主な違い)」を参照してください。

新製品:IBM® watsonx.ai

従来の機械学習と、基盤モデルによる新しい生成AI機能を統合した、まったく新しいエンタープライズ・スタジオです。

ビジネス全体にわたるNLPのユースケース

組織はNLPを使用して、電子メール、SMS、音声、ビデオ、ニュースフィード、SNSなどの通信を処理できます。実際NLPは、多くの最新アプリケーションでAIを活用するための推進力となっています。以下にそうした例を一部ご紹介します。

  • カスタマー・サポート:企業はチャットボットバーチャル・アシスタントを導入して、カスタムの質問やリクエストに迅速に対応できます。質問がチャットボットやバーチャル・アシスタントでは対応しきれない場合にのみ、NLPシステムは人間のカスタマー・サービス担当者につなぐことができます。

    バーチャル・エージェントIBM watsonx Assistant、Apple社のSiri、Amazon社のAlexaなど)は、音声認識を使用して音声コマンドのパターンを認識し、自然言語生成によって適切なアクションや役立つコメントで応答します。チャットボットは、入力されたテキスト入力に応答します。これらの中で最も優れたものは、人間の要求に関するコンテキスト上の手掛かりを認識する方法も学習し、それらを使ってさらに適切な対応またはオプションを長期にわたって提供します。

    これらのアプリケーションで次に強化が必要なのは、アプリケーション自身の言葉で明瞭で有用な回答で質問に答えること(予期されたものであるかは別として、私たちの質問に対応する能力)です。これらの自動化により、人間のカスタマー・サービス担当者がよくある内容のお問い合わせに時間を費やす必要がなくなり、コストを削減できるだけではなく、顧客満足度も向上します。

    すべてのチャットボットがAIを搭載しているわけではありませんが、最新のチャットボットは、ユーザーの質問を理解し、それに対する応答を自動化するために、NLPなどの対話型AI技術をますます使用しています。

  • よくある質問:すべての人が答えを見つけるために文章を読みたいと思うわけではありません。幸いなことに、NLPを使用することで、ユーザーが質問をすると、利用可能な答えの中から最適なものを探し、ユーザーの画面に表示するため、「よくある質問」ページのユーザー・エクスペリエンスを強化することができます。顧客からの質問の多くは、「誰が」「何を」「いつ」「どこで」といったものであるため、この機能を使えば、カスタマー・サービス担当者は同じような定型的な質問に何度も同じ回答をする必要がなくなります。

  • 文法の修正:文法ルールは、NLP機能が誤った文法を発見し、修正された言い回しを提案するようにトレーニングされているワードプロセッシングやその他のプログラムに適用できます。

  • 機械翻訳:Google翻訳は、幅広く使用できる現在稼働中のNLPテクノロジーの一例です。本当に有用な機械翻訳は、ある言語で書かれた単語を別の言語の単語に置き換えるだけではありません。効果的な翻訳では、入力言語の意味と文調を正確に捉え、出力言語で書かれた、同じ意味と望ましい効果を持つテキストに翻訳する必要があります。機械翻訳ツールは年を追うごとに、ますます正確になってきています。機械翻訳ツールをテストする優れた方法は、テキストをある言語に翻訳してから、元の言語に戻すことです。よく紹介される古典的な例をここでも引用しましょう。「精神は意欲的だが、肉体は薄弱だ」という文を英語からロシア語に翻訳し、再度ロシア語に翻訳すると、「ウォッカはうまいが、肉は腐っている」という文に変換されていました。つい最近までは、「精神は欲するが、肉体は薄弱だ」という文にまで近づいていました。そして、現在Google翻訳では、「精神は意欲的だが、肉体は薄弱だ」という文を英語からロシア語に翻訳し、再度ロシア語に翻訳すると、再び、「精神は意欲的だが、肉体は薄弱だ」という文に戻るまで精度が高まっています。
  • 個人を特定できる情報(PII)の編集:NLPモデルをトレーニングして、文書内で個人を特定できる可能性のある個人情報 を素早く見つけられるようにすることができます。金融、医療、保険、法律事務所など、大量の機密情報を扱う業界では、PIIを削除したバージョンをすぐに作成することができます。

  • 感情分析:業界特有の言語やビジネス特有の言語でトレーニングされたNLPモデルは、入力されたテキストからキーワードやフレーズを素早くスキャンして、顧客の感情がポジティブであるか、ニュートラルであるか、ネガティブであるかをリアルタイムで判断できます。受信したコミュニケーションの雰囲気によって、そのコミュニケーションをどのように処理するかが決まります。また、受信するコミュニケーションはリアルタイムのものである必要はありません。NLPは、顧客からのフィードバックやコールセンターで録音された対話を分析するためにも使用できます。

    もう1つのオプションは、事後のテキスト分析を可能にするNLP APIです。NLPは、SNSへの投稿、反応、レビューから実用的なデータを引き出し、製品、プロモーション、イベントに対する態度や感情を特定できます。情報を取り扱う企業は感情分析を製品設計や広告キャンペーンなどに活用できます。

  • スパム検知: 多くの人はスパム検知をNLPソリューションと考えにくいかもしれませんが、最上位のスパム検知テクノロジーは、NLPのテキスト分類機能を使用してスパムまたはフィッシングであることを示唆する言語がないか、電子メールをスキャンします。これらの指標は、金融用語、誤用が特徴的な文法、脅し文句、不適切な強要、スペルの違う会社名などの濫用などです。

  • テキスト生成:NLPは生成AIに「生成」という言葉を入れるのに役立ちます。NLPは、人間のコミュニケーションと見間違うほど自然でリアルなテキストや音声をコンピューターが生成できるようにします。生成された言語は、ブログ、コンピューター・コード、手紙、メモ、ツイートなどの草案に使うこともできます。企業向けシステムであっても、生成される言語の品質は、オートコンプリート機能、チャットボット、バーチャル・アシスタントにリアルタイムで使用するのに十分かもしれない。

    NLPの進歩は、生成AIシステムの背後にある推論エンジンを強化するため、さらなるビジネス・チャンスをもたらします。Microsoft Copilotは、日常業務における従業員の生産性と創造性を高めるために設計されたAIアシスタントで、すでに日常的に使用されるツールで稼働しています。
  • テキストの要約:テキストの要約では、NLP技術を使用して、膨大な量のデジタル・テキストを消化し、索引、研究データベース、または全文を読む時間のない多忙な読者のために要約やあらすじを作成します。最上位のテキスト要約アプリケーションは、語義の推論と自然言語生成(NLG)を使用し、有用なコンテキストや結論を要約に追加します。



業界別のNLPのユースケース
  • 金融業界:金融取引では、データへのアクセス、取引や取引を行う際に、ナノ秒が成否を分ける可能性があります。NLPを使えば、財務諸表、年次報告書、規制報告書、ニュース・リリース、あるいはSNSからの情報のマイニングを高速化することができます。
  • 医療業界:医療における新たな洞察や発見は、多くの医療従事者が追いつけないほど早いペースで得られる可能性があります。NLPとAIベースのツールは、健康記録や医学研究論文の分析を迅速に行い、より多くの情報に基づいた医療上の意思決定を可能にし、病状の発見や予防にも役立っています。
  • 保険業界:NLPは保険金請求を分析して、問題のある領域を特定し、保険金請求処理における非効率性につながるパターンを見つけることができます。これにより、プロセスと従業員の業務をさらに最適化することができるでしょう。

  • 法律業界:ほとんどすべての訴訟では、山積みの書類、背景情報、判例を確認する必要があります。NLPは、法的証拠の発見の自動化、情報の整理、レビューの迅速化、関連するすべての詳細の収集・検討に役立ちます。
NLPを試す

PythonとNatural Language Toolkit(NLTK)

プログラミング言語「Python」は、特定のNLPタスクに取り組むための幅広いツールとライブラリーを提供しています。これらの多くは、NLPプログラムを構築するためのライブラリー、プログラム、教育リソースを集めたオープンソース・コレクションであるNatural Language Toolkit(NLTK)に搭載されています

NLTKには、文の解析単語の分割ステミングレンマ化(単語を語源までトリミングする方法)、トークン化(フレーズ、文、段落、文章をトークンに分割して、コンピューターがテキストをよりよく理解できるようにする方法)など、多くのNLPタスクとサブタスク用のライブラリーが含まれています。これには、テキストから抽出された事実に基づいて論理的な結論に達する機能である、語義の推論などの機能を導入するためのライブラリーも含まれています。NLTKを使用すると、組織は品詞タグ付けの結果を確認できます。単語のタグ付けは複雑ではないように思えるかもしれませんが、単語は使われる場所によって意味が異なるため、そのプロセスは複雑です。

生成AIプラットフォーム

組織は、IBMパートナーがより優れたAI機能を提供できるように設計されたコンテナ化されたライブラリーであるIBM Watson NLP Library for Embedなどのユーザー・フレンドリーな生成AIプラットフォームを活用することで、デジタル・ソリューションでNLPの機能を使えるようになります。開発者はこれにアクセスして任意の環境のアプリケーションに統合し、堅牢なAIモデル、広範な言語範囲、スケーラブルなコンテナ・オーケストレーションを備えたエンタープライズ対応ソリューションを開発できます。

また、質問への回答、コンテンツの生成と要約、テキストの分類と抽出など、さまざまなNLPタスクをサポートするモデル構成を作成するための複数のオプションを可能にするIBM ® watsonx.ai AI studioを連携して、より多くのNLP機能を有効にすることもできます。例えば、 watsonxとHugging Face AIを使用すると、開発者は事前トレーニング済みのモデルを使用して、さまざまなNLPタスクをサポートするようにできます。

関連ソリューション
Watson自然言語処理ソリューション

ライブラリー、サービス、アプリケーションの強力かつ柔軟なポートフォリオにより、人工知能のビジネス価値を促進します。

自然言語処理の詳細はこちら
Watson Natural Language Processing Library for Embed 

IBMパートナーの柔軟性を高めるように設計されたコンテナ化されたライブラリーを利用して、強力な自然言語AIを商用アプリケーションに浸透させます。

Watson Natural Language Processing Library for Embedの詳細はこちら
参考情報 IBMのGranite LLMの詳細はこちら

Graniteは、デコーダーのみのトランスフォーマー・アーキテクチャーに基づくIBMのLLM基盤モデルの主力シリーズです。Graniteの言語モデルは、インターネット、教育機関、各種規定、法律、金融にまたがり信頼性の高いエンタープライズ・データでトレーニングされています。

生成AI技術に関する無料のハンズオン学習

プロンプト・エンジニアリング、大規模な言語モデル、オープンソース・プロジェクトなど、AIと生成AIの基本概念を説明します。

Watsonによる自然言語処理

このNLPの解説書では、さまざまなNLPのユースケースについて説明します。

IBMの組み込み可能AIでアプリケーションを強化

IBM DeveloperのWebサイトにアクセスして、ブログ、記事、ニュースレターなどをご覧ください。IBMパートナーになって、IBM Watsonの組み込み可能なAIを貴社のソリューション・ポートフォリオに追加しましょう。IBM Watson NLP Library for Embedをソリューションにポートフォリオに加えてください。

Watsonは貴社のビジネスを理解します

IBM Data & AI GMのRob Thomasが、NLPの専門家やクライアントを迎え、NLPテクノロジーがさまざまな業界のビジネスをどのように最適化しているかを紹介します。

Natural Language Understandingを試す

サンプル・リクエストと追加リソースへのリンクを活用して、Natural Language Understanding APIについて学びます。

次のステップ

AI開発者向けの次世代エンタープライズ・スタジオであるIBM watsonx.aiを使用して、生成AI、基盤モデル、機械学習機能をトレーニング、検証、チューニング、デプロイしましょう。わずかなデータ、わずかな時間でAIアプリケーションを構築できます。

watsonx.aiの詳細はこちら デモの予約