O processamento de linguagem natural, ou PLN, combina linguística computacional, modelagem baseada em regras da linguagem humana, com modelos estatísticos e de aprendizado de máquina para possibilitar que computadores e dispositivos digitais reconheçam, entendam e gerem texto e voz.
Ramo da inteligência artificial (IA), o PLN está no centro de aplicações e dispositivos capazes de
muitas vezes em tempo real. Atualmente, a maioria das pessoas interagiu com o PLN sob a forma de sistemas de GPS operados por voz, assistentes digitais, software de ditado de voz para texto, chatbot para atendimento ao cliente e outras praticidades de consumo. Mas o PLN também desempenha um papel cada vez maior nas soluções empresariais que ajudam a simplificar e automatizar as operações de negócios, aumentar a produtividade dos funcionários e simplificar processos de negócios importantes.
Use essa estrutura de seleção de modelo para escolher o modelo mais apropriado e equilibrar seus requisitos de desempenho com custos, riscos e necessidades de implantação.
Cadastre-se para receber o white paper sobre governança de IA
A linguagem humana está repleta de ambiguidades que tornam incrivelmente difícil escrever um software que determine com precisão o significado pretendido de dados de texto ou voz. Homônimos, homófonos, sarcasmo, expressões idiomáticas, metáforas, exceções gramaticais e de uso, variações na estrutura das frases, essas são apenas algumas das irregularidades da linguagem humana que levam anos para os humanos aprenderem, mas que os programadores devem ensinar os aplicativos baseados em linguagem natural a reconhecer e entender com precisão desde o início para esses aplicativos serem úteis.
Várias tarefas de PLN dividem dados de texto e voz humanos de maneiras que ajudam o computador a entender o que está ingerindo. Algumas dessas tarefas incluem o seguinte:
Veja a publicação do blog “PLN vs. NLU vs. NLG: as diferenças entre três conceitos de processamento de linguagem natural" para ter uma visão mais detalhada de como esses conceitos se relacionam.
O novo estúdio empresarial que combina aprendizado de máquina tradicional com novas IA generativas alimentadas por modelos de base.
A linguagem de programação Python disponibiliza uma ampla gama de ferramentas e bibliotecas para lidar com tarefas específicas de PLN. Muitas delas estão no no Natural Language Toolkit, ou NLTK, uma coleção de bibliotecas em código aberto, programas e recursos educacionais para a criação de programas de PLN.
O NLTK contém bibliotecas para muitas das tarefas de PLN listadas acima, além de bibliotecas para subtarefas, como análise de frases, segmentação de palavras, stemming e lematização (métodos para reduzir as palavras até suas raízes) e tokenização (para dividir frases, sentenças, parágrafos e passagens em tokens que ajudam o computador a entender melhor o texto). Contém também bibliotecas para implementar recursos como raciocínio semântico, a capacidade de chegar a conclusões lógicas com base em fatos extraídos do texto.
As primeiras aplicações de PLN eram sistemas programados manualmente e baseados em regras capazes de executar certas tarefas de PLN, mas que não podiam ser facilmente dimensionadas para acomodar um fluxo aparentemente interminável de exceções ou os volumes crescentes de dados de texto e voz.
Entre na PLN estatística, que combina algoritmos de computador com modelos de aprendizado automático e deep learning para extrair, classificar e rotular automaticamente elementos de dados de texto e voz e, em seguida, atribuir uma probabilidade estatística a cada significado possível desses elementos. Atualmente, os modelos de deep learning e as técnicas de aprendizado baseadas em redes neurais convolucionais (CNNs) e redes neurais recorrentes (RNNs) possibilitam que os sistemas de PLN "aprendam" enquanto trabalham e extraiam significados cada vez mais precisos de grandes volumes de conjuntos de dados de texto e voz brutos, não estruturados e não rotulados.
Para um mergulho mais profundo nas nuances entre essas tecnologias e suas abordagens de aprendizado, consulte “IA vs. Aprendizado de máquina vs. Deep Learning vs. Redes Neurais: qual é a diferença?”
O processamento de linguagem natural é a força motriz por trás da inteligência de máquina em muitas aplicações modernas do mundo real. Alguns exemplos:
Acelere o valor comercial da inteligência artificial com um portfólio poderoso e flexível de bibliotecas, serviços e aplicativos.
Integre IA de linguagem natural avançada às suas aplicações comerciais por meio de uma biblioteca conteinerizada, criada para dar mais flexibilidade aos parceiros da IBM.
Conheça os conceitos fundamentais de IA e IA generativa, incluindo engenharia de prompts, grandes modelos de linguagem e os melhores projetos em código aberto.
Saiba mais sobre diversos casos de uso de PLN nesta explicação de PLN.
Acesse o site do IBM Developer para acessar blogs, artigos, boletins informativos e outros. Seja parceiro IBM e integre a IA integrável do IBM Watson em suas soluções comerciais hoje mesmo. IBM Watson NLP Library para incorporar em suas soluções.
Assista ao IBM Data & AI GM com Rob Thomas, em que ele apresenta especialistas e clientes em PLN, mostrando como as tecnologias de PLN estão otimizando negócios de todos os setores.
As considerações éticas para a IA ficaram muito mais críticas hoje.
A IBM lançou um novo kit de ferramentas de código aberto, o PrimeQA, para estimular o progresso em sistemas de perguntas e respostas multilíngues para facilitar a localização rápida de informações na web.