自然语言处理 (NLP) 将计算语言学(基于规则的人类语言建模)与统计和机器学习模型相结合,使计算机和数字设备能够识别、理解和生成文本和语音。
NLP 是人工智能 (AI) 的一个分支,是应用程序和设备的核心,可以
通常都可以实时完成。如今,在日常生活中,大多数人都会通过多种形式与 NLP 互动,如语音操作的 GPS 系统、数字助理、语音转文本听写软件、客服聊天机器人以及其他为消费者提供便利的系统。此外,NLP 在企业解决方案中也发挥着越来越大的作用,可以帮助简化和自动化业务运营、提高员工生产力并简化任务关键型业务流程。
使用此模型选择框架选择最合适的模型,同时平衡性能要求与成本、风险和部署需求。
立即注册,获取 AI 治理白皮书
人类语言充满了歧义,因此,要编写能准确确定文本或语音数据预期含义的软件非常困难。同音异义词、同音异形词、讽刺、习语、隐喻、语法和用法例外、句子结构的变化 – 这些只是人类语言中不规则现象的少数例子,我们尚且需要花费数年才能掌握,如果想让自然语言驱动的应用程序发挥作用,程序员必须让这些应用程序从一开始就能准确地识别和理解人类语言。
一些 NLP 任务可以分解人类文本和语音数据,帮助计算机理解所采集的内容。其中包括:
请参阅博客文章NLP、NLU 与 NLG:三种自然语言处理概念之间的差异,以更深入地了解这些概念之间的关系。
全新的企业工作室,结合了传统机器学习与由基础模型提供支持的新生成式 AI 功能。
Python 编程语言提供了广泛的工具和库,用于完成特定的 NLP 任务。其中很多工具和库都包含在 Natural Language Toolkit (NLTK) 中,该工具包提供了一系列用于构建 NLP 程序的开放源代码库、程序和教育资源。
NLTK 包含用于完成以上许多自然语言处理 (NLP) 任务的库,以及用于完成一些子任务的库,这些子任务包括句法分析、分词、词干提取和词形还原(提取单词词根的方法)和分词(将短语、句子、段落和篇章分解为有助于计算机更好地理解文本的符号)。它还包括用于实现语义推理等功能(即根据从文本中提取的事实得出逻辑结论的能力)的库。
最早的 NLP 应用程序是手动编码、基于规则的系统,可以执行某些 NLP 任务,但无法轻松扩展以适应看似无穷无尽的异常流或不断增加的文本和语音数据量。
谈到统计 NLP,它是将计算机算法与机器学习和深度学习模型相结合,自动提取、分类和标记文本和语音数据的元素,然后为这些元素的每个可能含义分配一个统计似然值。如今,基于卷积神经网络 (CNN) 和循环神经网络 (RNN) 的深度学习模型和学习技术使 NLP 系统能够在工作时“学习”并从大量原始、非结构化和未标记的文本和语音数据集中提取更准确的含义。
要更深入地了解这些技术及其学习方法之间的细微差别,请参阅“AI vs. Machine Learning vs. Deep Learning vs. Neural Networks: What’s the Difference?”
在许多现代的实际应用程序中,自然语言处理是机器智能背后的驱动力量。以下是几个示例:
通过强大灵活的库、服务和应用组合,加速实现人工智能的商业价值。
利用旨在增强 IBM 合作伙伴灵活性的容器化库,将强大的自然语言 AI 融入商业应用程序。
了解 AI 和生成式 AI 的基本概念,包括提示工程、大型语言模型和最佳开源项目。
通过此 NLP 讲解工具了解不同的 NLP 用例。
访问 IBM 开发人员网站以获取博客、文章、时事通讯等。立即成为 IBM 合作伙伴,并将 IBM Watson 嵌入式 AI 融入您的商业解决方案中。将 IBM Watson NLP 库嵌入您的解决方案中。
观看 IBM 数据与 AI 总经理 Rob Thomas 与 NLP 专家和客户的会谈,展示 NLP 技术如何优化各行各业的业务。
考虑 AI 伦理问题空前重要。
IBM 推出了新的开源工具包 PrimeQA,旨在推动多语言问答系统的进步,让任何人都能更轻松地在网络上快速查找信息。