Publicado em: 24 de junho de 2024
Colaboradores: Ivan Belcic, Cole Stryker
Um diagrama de relacionamento de entidade (diagrama ER ou ERD) é uma representação visual de como os itens em um banco de dados se relacionam entre si. Os ERDs são um tipo especializado de fluxograma que transmite os tipos de relacionamentos entre diferentes entidades dentro de um sistema. Eles usam um conjunto definido de símbolos, incluindo retângulos, ovais e losangos, e os vinculam a linhas de conexão.
Dentro do modelo relacional de projeto de banco de dados, os ERDs estabelecem como as entradas em um banco de dados são conectadas. Os ERDs são um modelo de dados conceitual de alto nível que prepara o terreno para projeto e análise de banco de dados mais avançados.
Além disso, a modelagem de relacionamento entre entidades pode ajudar a extrair narrativas e insights de uma coleção aparentemente díspar de pontos de dados.
Obtenha uma visão geral do mercado de soluções de segurança de banco de dados e big data, juntamente com os produtos de proteção de dados confidenciais certos para atender aos requisitos do cliente.
SRE Engenheiro de Confiabilidade de Sites Profissionais do IBM Cloud
Analistas de negócios e engenheiros de bancos de dados usam diagramas ER como ferramentas de modelagem de dados para avaliar o escopo dos bancos de dados de que suas organizações precisam e, em seguida, planejar como os dados serão armazenados.
Os ERDs informam a parte de engenharia de software de um projeto de banco de dados, definindo os requisitos para a arquitetura dos sistemas de informação e a estrutura do banco de dados. Na abordagem de três esquemas de engenharia de software para sistemas de gerenciamento de banco de dados (DBMS), o ERD é a camada conceitual.
A integração de dados é um processo complexo de engenharia de dados que consiste em muitas partes móveis. Um ERD pode ajudar engenheiros de dados a conceitualizar o sistema geral e reduzir o potencial de erros.
A comparação de bancos de dados existentes com um ERD pode revelar erros de projeto de bancos de dados que podem estar causando problemas. Bancos de dados complexos com inúmeras tabelas exigem amplo conhecimento de SQL para o processo de depuração. Um ERD resume o banco de dados para que os engenheiros possam identificar possíveis erros com rapidez.
Ao realizar projetos de reengenharia de processos de negócios, pode ser útil obter uma visão geral de todos os dados dentro dos sistemas de informação de uma organização. Os ERDs são usados para elaborar soluções de arquitetura de dados mais novas e eficientes, que facilitam as outras etapas do processo de BPR.
Diagramas de relacionamento de entidades, esquemas de bancos de dados e diagramas de fluxos de dados representam visualmente a maneira como os dados são organizados em um sistema.
Os diagramas de relacionamento de entidades ilustram as entidades dentro de um banco de dados e seus relacionamentos entre si. Os diagramas ER frequentemente representam esquemas de bancos de dados.
Os esquemas de banco de dados estabelecem como as entidades do mundo real serão modeladas em um banco de dados relacional. Eles contêm as regras e diretrizes que determinam a organização do banco de dados, como nomes de tabelas, campos e tipos de dados.
Os diagramas de fluxos de dados são um tipo de fluxograma que descreve o fluxo de dados através de um processo ou sistema. Eles mostram como os dados são movidos do processo para locais de armazenamento internos e externos.
Os diagramas de relacionamento de entidades incluem entidades, os atributos dessas entidades e os relacionamentos entre elas. Alguns ERDs também transmitem cardinalidade, que quantifica o relacionamento entre duas entidades.
Uma entidade ERD é algo definível, como uma pessoa, função, evento, conceito ou objeto, que pode ter informações sobre ela armazenadas em um banco de dados relacional. Muitos estilos de diagramas de relacionamentos de entidades descrevem as entidades como retângulos.
As entidades são semelhantes a substantivos em um sentido gramatical. Elas são itens essenciais no banco de dados, com atributos e relacionamentos que transmitem informações sobre essas entidades, assim como os adjetivos e verbos fornecem mais informações sobre os substantivos em uma frase.
Os tipos de entidades são uma categoria de entidades. Se as entidades forem semelhantes a substantivos, então os tipos de entidades serão categorias: alimentos, esportes e países. As entidades individuais dentro de um tipo de entidade são conhecidas como instâncias. Dentro do tipo de entidade, legumes podem ser as instâncias brócolis, cenouras e aspargos.
As entidades são classificadas como fortes ou fracas. As entidades fortes contêm informações de identificação suficientes em seus atributos para não precisarem de mais esclarecimentos. Enquanto isso, as entidades fracas existem apenas como resultado ou consequência de outra entidade. A entidade forte associada a uma determinada entidade fraca é conhecida como sua entidade principal ou proprietária.
Considere um banco de dados que modela os pedidos dos clientes em uma empresa de comércio eletrônico. Cada pedido é uma entidade forte porque pode ser definido como uma instância exclusiva com base no comprador, no horário e na data. No entanto, os itens de linha em cada pedido são entidades fracas. Eles só têm significado no contexto de seus respectivos pedidos. Essa dependência é conhecida como dependência de existência ou restrição de participação.
As entidades fortes são mostradas como retângulos sólidos, enquanto os ERDs representam entidades fracas como um retângulo duplo.
Uma entidade associativa vincula as instâncias entre dois conjuntos de entidades e tem seus próprios atributos que fornecem mais informações sobre essa relação. Em um ERD usado por uma universidade, a entidade define que os alunos e professores têm muitas conexões uns com os outros. A entidade associativa que faz a ponte entre os dois mostraria quais alunos estão fazendo cursos ministrados por quais professores.
Os bancos de dados relacionais utilizam entidades associativas para informar as tabelas de junção, que combinam campos de várias outras tabelas de bancos de dados. Nos diagramas ER, as entidades associativas são representadas como um losango dentro de um retângulo.
Atributos são qualidades, propriedades e características que definem uma entidade ou tipo de entidade. Em um design clássico de ERD, os atributos são mostrados como ovais e são exibidos ao lado da entidade correspondente em um ERD.
As chaves de entidades são os atributos que definem exclusivamente cada entidade em um conjunto de dados. Qualquer atributo pode ser designado como uma chave, desde que preencha essa função. Por exemplo, em um conjunto de entidades de pessoas, um atributo de chave apropriado pode ser um número de identificação nacional. Por outro lado, os sobrenomes não funcionariam como um atributo de chave nesse contexto, pois mais de uma pessoa pode compartilhar o mesmo sobrenome.
Relacionamentos são as linhas conectadas que ligam as entidades em um ERD. Eles indicam como as entidades dentro de um ERD estão associadas umas às outras. Se as entidades são substantivos e os atributos são adjetivos, então os relacionamentos são verbos.
Em um ERD tradicional, os relacionamentos são descritos como losangos. Relacionamentos fracos ligam uma entidade fraca a seu proprietário e são mostrados como losangos duplos.
A participação de entidades em um relacionamento pode ser total, caso em que a totalidade do conjunto de entidades está envolvido no relacionamento ou parcialmente. Na participação parcial, algumas ou todas as entidades do conjunto podem estar envolvidas no relacionamento em um momento específico.
Cardinalidade é a qualidade de um relacionamento que define o número de instâncias em uma entidade que se relacionam com as instâncias de outra.
Os ERDs representam a cardinalidade por meio de variações nas linhas de conexão entre as entidades. A forma como a cardinalidade é mostrada depende do estilo de ERD usado.
A maioria dos ERDs é elaborada em um dos três modelos de relacionamento de entidades: conceitual, lógico e físico. Todos os três representam entidades juntamente com seus atributos e relacionamentos, mas seus casos de uso e audiências pretendidas diferem. Os ERDs conceituais são os menos detalhados, enquanto os ERDs físicos oferecem as informações mais granulares.
Desde que o cientista da computação e teórico de bancos de dados Peter Chen introduziu os ERDs na década de 1970, vários tipos de diagramas surgiram para preencher uma gama cada vez maior de casos de uso.
Os ERDs de Chen se parecem com fluxogramas clássicos, com várias formas conectadas por linhas. A cardinalidade é mostrada com os caracteres 1, M e N ao longo das linhas de conexão. M e N representam “muitos” em um relacionamento de um para muitos ou de muitos para muitos; representar o último com a notação M:N ou N:M implica que o número de entidades no relacionamento não precisa ser igual em ambos os lados.
O estilo Chen retrata a participação total com uma única linha de conexão e parcial com uma linha de conexão dupla.
Batizada assim por sua linha de conexão bifurcada em três frentes mostrando muitas relações, a notação de pé de corvo substitui os símbolos de Chen por tabelas. Cada tabela representa uma entidade e contém todos os seus atributos. A notação de pé de corvo permite que os criadores de ERDs mostrem informações sobre a cardinalidade dos relacionamentos.
Os diagramas de estrutura de dados de Charles Bachman inspiraram diretamente Chen na criação do ERD. Bachman usou linhas com setas para indicar a cardinalidade nas relações.
A Força Aérea dos EUA introduziu sua linguagem Integration DEFinition for information modeling (IDEF1X) na década de 1980 para dar suporte ao desenvolvimento de modelos de dados semânticos. O trabalho de Chen deu um passo à frente ao exibir atributos em uma tabela compartilhada e introduzir mais opções de cardinalidade.
Criado por Richard Barker em 1981, o estilo Barker é o padrão para uso no Oracle. A notação de Barker compartilha o estilo de pé de corvo para conectar linhas enquanto também usa linhas pontilhadas para representar a participação parcial ou opcional.
O IBM OpenPages é uma solução de governança, risco e conformidade (GRC) altamente escalável e orientada por IA que é executada em qualquer nuvem com o IBM Cloud Pak for Data.
O IBM Db2 é o banco de dados nativo da nuvem criado para impulsionar transações de baixa latência, análise em tempo real e aplicações de inteligência artificial (IA) em escala.
Escale aplicações, análise de dados e IA generativa mais rapidamente com bancos de dados em toda a nuvem híbrida.
As empresas enfrentam obstáculos significativos durante a preparação de dados para as aplicações de IA. A existência de silos e duplicações de dados, juntamente com temores em relação à qualidade de dados, apresenta um ambiente multifacetado para as organizações gerenciarem.
Imagine um futuro em que a IA colabore sem dificuldades com as soluções existentes da cadeia de suprimentos, redefinindo como as organizações gerenciam seus ativos. Se você está usando a IA tradicional, análise de dados avançada e automação inteligente, já não está obtendo insights profundos sobre o desempenho dos ativos?