Was ist die Verarbeitung natürlicher Sprache?

Was ist NLP?

Natural Language Processing (NLP) kombiniert Computerlinguistik – regelbasierte Modellierung der menschlichen Sprache – mit statistischen und maschinellen Lernmodellen, damit Computer und digitale Geräte Text und Sprache erkennen, verstehen und generieren können.

Als Teilbereich der künstlichen Intelligenz (KI) ist NLP das Herzstück von Anwendungen und Geräten, die

Text von einer Sprache in eine andere übersetzen
auf eingegebene oder gesprochene Befehle antworten
Benutzer anhand von Spracheingaben erkennen oder authentifizieren
große Textmengen zusammenfassen
Absichten oder Stimmungen von Text oder Sprache bewerten
Text, Grafiken oder andere Inhalte auf Anfrage generieren

oft in Echtzeit. Die meisten Menschen haben heute mit NLP in Form von sprachgesteuerten GPS-Systemen, digitalen Assistenten, Speech-to-Text-Diktationssoftware, Chatbots für Kundenservice und anderen Verbraucherkomfort interagiert. Aber auch in Unternehmenslösungen, die dabei helfen, Geschäftsabläufe zu rationalisieren und zu automatisieren, die Produktivität der Mitarbeiter zu steigern und unternehmenskritische Geschäftsprozesse zu vereinfachen, spielt NLP eine immer größere Rolle.

So wählen Sie das richtige Foundation Model für die KI

Nutzen Sie dieses Framework zur Modellauswahl, um das am besten geeignete Modell auszuwählen und dabei Ihre Leistungsanforderungen mit den Kosten, Risiken und Bereitstellungsanforderungen in Einklang zu bringen.

Ähnliche Inhalte

Registrieren Sie sich für das Whitepaper über KI-Governance

Beginnen Sie jetzt mit KI

Erfahren Sie, wie Sie KI skalieren

Erkunden Sie die KI Academy

NLP-Aufgaben

Die menschliche Sprache ist voller Mehrdeutigkeiten, die es unglaublich schwierig machen, Software zu schreiben, die die beabsichtigte Bedeutung von Text- oder Sprachdaten genau bestimmt. Homonyme, Homophone, Sarkasmus, Idiome, Metaphern, Ausnahmen in der Grammatik und im Sprachgebrauch, Variationen in der Satzstruktur – dies sind nur einige der Unregelmäßigkeiten der menschlichen Sprache, für die Menschen Jahre brauchen, um sie zu erlernen. Programmierer müssen Anwendungen für die natürliche Sprachverarbeitung beibringen, diese Unregelmäßigkeiten von Anfang an akkurat zu erkennen und zu interpretieren, wenn diese Anwendungen sinnvoll eingesetzt werden sollen.

Mehrere NLP-Aufgaben zerlegen menschliche Text- und Sprachdaten auf eine Weise, die dem Computer hilft, das zu verstehen, was er aufnimmt. Diese Aufgaben umfassen unter anderem:

Spracherkennung, auch „Speech to Text“ genannt, ist die Aufgabe, Sprachdaten zuverlässig in Textdaten umzuwandeln. Spracherkennung ist für jede Anwendung erforderlich, die Sprachbefehlen folgt oder gesprochene Fragen beantwortet. Was die Spracherkennung besonders schwierig macht, ist die Art und Weise, wie Menschen sprechen – schnell, undeutlich, mit unterschiedlicher Betonung und Intonation, in verschiedenen Akzenten und oft mit falscher Grammatik.
Wortart-Tagging, auch grammatikalisches Tagging genannt, ist der Prozess, bei dem die Wortart eines bestimmten Wortes oder Textstücks basierend auf seiner Verwendung und seinem Kontext bestimmt wird. Die Wortart identifiziert „make“ (machen) als Verb in „I can make a paper plane“ (Ich kann ein Papierflugzeug machen) und als Substantiv in „What make of car do you own?“ (Welche Automarke besitzen Sie?).
Wortsinndisambiguierung ist die Auswahl der Bedeutung eines Wortes mit mehreren Bedeutungen durch einen Prozess der semantischen Analyse, der das Wort bestimmt, das in einem bestimmten Kontext den meisten Sinn ergibt. Die Wortsinndisambiguierung hilft zum Beispiel dabei, die Bedeutung des Verbs „make“ in „make the grade“ (achieve) vs. „make a bet“ (place) zu unterscheiden.
Named Entity Recognition oder NEM identifiziert Wörter oder Phrasen als nützliche Entitäten. NEM identifiziert „Kentucky“ als Ort oder „Fred“ als den Namen eines Mannes.
Ko-Referenzauflösung ist die Aufgabe, zu ermitteln, ob und wann sich zwei Wörter auf dieselbe Entität beziehen. Das häufigste Beispiel ist die Bestimmung der Person oder des Objekts, auf das sich ein bestimmtes Pronomen bezieht (z. B. „sie“ = „Maria“), aber es kann auch darum gehen, eine Metapher oder eine Redewendung im Text zu identifizieren (z. B. ein Beispiel, in dem „Bär“ kein Tier, sondern eine große haarige Person ist).
Die Stimmungsanalyse versucht, subjektive Eigenschaften – Berechtigungen, Emotionen, Sarkasmus, Verwirrung, Verdacht – aus Texten zu extrahieren.
Die Erzeugung natürlicher Sprache wird manchmal als das Gegenteil von Spracherkennung oder Speech-to-Text beschrieben. Es ist die Aufgabe, strukturierte Informationen in menschliche Sprache zu übersetzen.

Im Blogbeitrag „NLP vs. NLU vs. NLG: die Unterschiede zwischen drei Konzepten der Verarbeitung natürlicher Sprache“ erfahren Sie mehr über den Zusammenhang zwischen diesen Konzepten.

Jetzt verfügbar: watsonx.ai

Das völlig neue Enterprise Studio verbindet traditionelles maschinelles Lernen mit neuen, auf Foundation Models basierenden generativen KI-Funktionen.

NLP-Tools und -Ansätze

Python und das Natural Language Toolkit (NLTK)

Die Programmiersprache Python bietet eine Vielzahl von Tools und Bibliotheken für den Angriff auf bestimmte NLP-Aufgaben. Viele davon befinden sich im Natural Language Toolkit (NLTK), einer Open-Source-Sammlung von Bibliotheken, Programmen und Bildungsressourcen zum Erstellen von NLP-Programmen.

Das NLTK enthält Bibliotheken für viele der oben genannten NLP-Aufgaben sowie Bibliotheken für Teilaufgaben wie Satzparsing, Wortsegmentierung, Stemming und Lemmatisierung (Methoden zum Trimmen von Wörtern auf ihre Wurzeln) und Tokenisierung (zum Zerlegen von Phrasen, Sätzen, Absätzen und Passagen in Token, die dem Computer helfen, den Text besser zu verstehen). Außerdem enthält es Bibliotheken für die Implementierung von Funktionen wie semantisches Schlussfolgern (Semantic Reasoning), d. h. die Fähigkeit, logische Schlussfolgerungen auf der Grundlage von aus dem Text extrahierten Fakten zu ziehen.

Statistisches NLP, maschinelles Lernen und Deep Learning

Die frühesten NLP-Anwendungen waren handcodierte, regelbasierte Systeme, die bestimmte NLP-Aufgaben ausführen konnten, sich aber nicht einfach skalieren ließen, um einen scheinbar endlosen Strom von Ausnahmen oder die zunehmenden Mengen an Text- und Sprachdaten zu bewältigen.

Hier kommt statistisches NLP ins Spiel, das Computeralgorithmen mit maschinellem Lernen und Deep-Learning-Modellen kombiniert, um Elemente von Text- und Sprachdaten automatisch zu extrahieren, zu klassifizieren und zu kennzeichnen und dann jeder möglichen Bedeutung dieser Elemente eine statistische Wahrscheinlichkeit zuzuordnen. Heutzutage ermöglichen Deep-Learning-Modelle und Lerntechniken, die auf Convolutional Neural Networks (CNNs) und rekurrenten Neuronalen Netzen (RNNs) basieren, NLP-Systeme, die bei der Arbeit „lernen“ und immer präzisere Bedeutungen aus riesigen Mengen an rohen, unstrukturierten und unbeschrifteten Text- und Sprachdatensätzen extrahieren.

Einen tieferen Einblick in die Nuancen zwischen diesen Technologien und ihren Lernansätzen finden Sie unter „KI vs. maschinelles Lernen vs. Deep Learning vs. neuronale Netze: Was ist der Unterschied?“

NLP-Anwendungsfälle

Die Verarbeitung natürlicher Sprache ist die treibende Kraft hinter der maschinellen Intelligenz in vielen modernen realen Anwendungen. Hier folgen einige Beispiele:

Spamerkennung: Sie denken bei Spamerkennung vielleicht nicht an eine NLP-Lösung, aber die besten Spamerkennungs-Technologien nutzen die Textklassifizierungsfähigkeiten von NLP, um E-Mails nach sprachlichen Merkmalen zu durchsuchen, die häufig auf Spam oder Phishing hinweisen. Zu diesen Indikatoren gehören die übermäßige Verwendung von Finanzbegriffen, charakteristische schlechte Grammatik, bedrohliche Sprache, unangemessene Dringlichkeit, falsch geschriebene Firmennamen und vieles mehr. Die Spamerkennung ist eines der wenigen NLP-Probleme, die von Experten als „weitgehend gelöst“ angesehen werden (auch wenn Sie vielleicht einwenden, dass dies nicht mit Ihrer E-Mail-Erfahrung übereinstimmt).
Maschinelle Übersetzung: Google Translate ist ein Beispiel für eine weit verbreitete NLP-Technologie. Eine wirklich nützliche maschinelle Übersetzung umfasst mehr als das Ersetzen von Wörtern in einer Sprache durch die Wörter einer anderen. Eine effektive Übersetzung muss die Bedeutung und den Ton der Eingabesprache genau erfassen und sie in Text mit derselben Bedeutung und der gewünschten Wirkung in der Ausgabesprache übersetzen. Maschinelle Übersetzungstools machen gute Fortschritte in Bezug auf Genauigkeit. Eine gute Möglichkeit, ein maschinelles Übersetzungstool zu testen, besteht darin, Text in eine Sprache und dann zurück in das Original zu übersetzen. Ein oft zitiertes klassisches Beispiel: Vor nicht allzu langer Zeit ergab die Übersetzung von „Der Geist willig, aber das Fleisch ist schwach“ vom Englischen ins Russische und zurück „Der Wodka ist gut, aber das Fleisch ist faul“. Heute lautet das Ergebnis „Der Geist will, aber das Fleisch ist schwach“, was zwar nicht perfekt ist, aber bei der Übersetzung vom Englischen ins Russische viel mehr Vertrauen erweckt.
Virtuelle Agenten und Chatbots: Virtuelle Agenten wie Siri von Apple und Alexa von Amazon verwenden Spracherkennung, um Muster in Sprachbefehlen zu erkennen und natürliche Sprache zu generieren, um mit entsprechenden Aktionen oder hilfreichen Kommentaren zu antworten. Chatbots vollbringen den gleichen Kraftakt als Antwort auf getippte Texteingaben. Die besten von ihnen lernen auch, kontextbezogene Hinweise auf menschliche Anfragen zu erkennen und nutzen diese, um mit der Zeit noch bessere Antworten oder Optionen anzubieten. Die nächste Verbesserung für diese Anwendungen ist die Beantwortung von Fragen, d. h. die Fähigkeit, auf unsere Fragen – ob erwartet oder nicht – mit relevanten und hilfreichen Antworten in eigenen Worten zu antworten.
Stimmungsanalyse in den sozialen Medien: NLP ist zu einem wichtigen Business-Tool geworden, um verborgene Erkenntnisse aus Social Media-Kanälen zu gewinnen. Mithilfe der Stimmungsanalyse lässt sich die in Social-Media-Posts, Antworten, Rezensionen usw. verwendete Sprache analysieren, um Einstellungen und Emotionen als Reaktion auf Produkte, Werbeaktionen und Ereignisse zu extrahieren – Informationen, die Unternehmen für Produktdesigns, Werbekampagnen usw. verwenden können.
Textzusammenfassung: Die Textzusammenfassung nutzt NLP-Techniken, um riesige Mengen digitaler Texte zu verarbeiten und Zusammenfassungen und Synopsen für Indizes, Forschungsdatenbanken oder vielbeschäftigte Leser zu erstellen, die keine Zeit haben, den gesamten Text zu lesen. Die besten Anwendungen zur Textzusammenfassung nutzen semantische Schlussfolgerungen und die Generierung natürlicher Sprache (NLG), um den Zusammenfassungen nützlichen Kontext und Schlussfolgerungen hinzuzufügen.

Weiterführende Lösungen

Watson-Lösungen zur Verarbeitung natürlicher Sprache

Steigern Sie den Geschäftswert der künstlichen Intelligenz mit einem leistungsstarken und flexiblen Portfolio aus Bibliotheken, Diensten und Anwendungen.

Erkunden Sie die Verarbeitung natürlicher Sprache

Watson Natural Language Processing Library for Embed

Nutzen Sie leistungsstarke KI für natürliche Sprache in kommerzielle Anwendungen mit einer Container-Bibliothek, die IBM Partner mit mehr Flexibilität unterstützt.

Entdecken Sie die Watson Natural Language Processing Library for Embed

Ressourcen

Kostenloses, praxisnahes Lernen für generative KI-Technologien

Lernen Sie die grundlegenden Konzepte für KI und generative KI kennen, einschließlich Prompt Engineering, große Sprachmodelle und die besten Open-Source-Projekte.

Verarbeitung natürlicher Sprache mit Watson

Erfahren Sie in diesem NLP-Erklärvideo mehr über verschiedene NLP-Anwendungsfälle.

Erweitern Sie Ihre Anwendungen mit der integrierbaren KI von IBM

Besuchen Sie die Website von IBM Developer, um Zugang zu Blogs, Artikeln, Newslettern und mehr zu erhalten. Werden Sie IBM Partner und integrieren Sie die integrierbare KI von IBM Watson noch heute in Ihre kommerziellen Lösungen. Integrieren Sie IBM Watson NLP Library for Embed in Ihre Lösungen.

Watson versteht die Sprache Ihres Unternehmens

Erleben Sie, wie Rob Thomas, GM von IBM Data & AI, NLP-Experten und Kunden einlädt, um zu zeigen, wie NLP-Technologien das Geschäft in verschiedenen Branchen optimieren.

KI-Ethik über Compliance hinaus fördern

Ethische Überlegungen zur KI waren noch nie so kritisch wie heute.

Mehr Wissen für Nicht-Englischsprachige verfügbar machen

IBM hat ein neues Open-Source-Toolkit namens PrimeQA auf den Markt gebracht, um den Fortschritt bei mehrsprachigen Frage-Antwort-Systemen voranzutreiben und es für jedermann einfacher zu machen, Informationen im Web schnell zu finden.

Machen Sie den nächsten Schritt

Trainieren, validieren, optimieren und implementieren Sie generative KI, Foundation Models und maschinelle Lernfunktionen mit IBM watsonx.ai, einem Studio der nächsten Generation für AI Builder in Unternehmen. Erstellen Sie KI-Anwendungen mit einem Bruchteil der Zeit und Daten.

watsonx.ai erkunden

Buchen Sie eine Live-Demo