Usando metadados e ferramentas de gerenciamento de dados, os catálogos de dados organizam ativos de dados para que os usuários (como analistas de dados, cientistas de dados e administradores de dados) possam encontrar rapidamente os dados certos para seus casos de uso analíticos ou comerciais. Muitos catálogos de dados oferecem suporte à pesquisa em linguagem natural, possibilitando que os usuários descubram dados sem escrever código nem consultas SQL.
Os catálogos de dados normalmente contêm uma ampla gama de ativos de dados, incluindo:
Um catálogo de dados robusto também contém recursos de gerenciamento de metadados para coletar e selecionar os metadados de cada ativo de dados. Essas funcionalidades podem facilitar a identificação, a avaliação e o uso eficaz dos dados. O catálogo deve disponibilizar também ferramentas de governança de dados para ajudar a proteger a qualidade dos dados, a integridade dos dados e a segurança dos dados.
Boletim informativo do setor
Mantenha-se atualizado sobre as tendências mais importantes (e intrigantes) do setor em IA, automação, dados e muito mais com o boletim informativo Think. Consulte a Declaração de privacidade da IBM.
Sua assinatura será entregue em inglês. Você pode encontrar um link para cancelar a assinatura em todos os boletins informativos. Você pode gerenciar suas inscrições ou cancelar a inscrição aqui. Consulte nossa Declaração de privacidade da IBM para obter mais informações.
Metadados são "dados sobre dados". São informações sobre dados separadas do conteúdo dos dados em si, como autor, data de criação ou tamanho do arquivo. Os metadados facilitam a pesquisa, a organização e o uso de dados.
Um exemplo clássico de metadados é o catálogo em cartão ou o catálogo online de uma biblioteca. Nestes metadados, cada cartão ou listagem contém informações sobre um livro: título, autor, assunto, data de publicação, edição, localização na biblioteca ou sinopse.
Essas informações facilitam para os leitores encontrar e avaliar o livro: é atual ou desatualizado? Contém as informações que procuro? O autor é alguém em quem confio ou cujo trabalho aprecio? Da mesma forma, os metadados facilitam para os usuários de dados encontrarem e avaliarem os dados de sua organização.
Tipos de metadados diferentes desempenham funções diferentes. Os catálogos de dados normalmente lidam com várias classes de metadados, incluindo:
Metadados técnicos descrevem detalhes técnicos dos dados, como tipo de arquivo, informações de codificação, esquemas e local de armazenamento. Isso informa aos usuários como trabalhar com os dados. Por exemplo, se é necessário transformação para análise.
Os metadados operacionais descrevem as circunstâncias da criação e do uso do ativo de dados. Por exemplo, inclui informações sobre quando, como e por quem foi acessado, usado, atualizado ou alterado.
Os metadados administrativos definem as políticas de uso e retenção de dados. Esse tipo de metadados é utilizado na governança de dados e pode ajudar as organizações a cumprir políticas legais, regulatórias e internas.
Os metadados de negócios descrevem o contexto de negócios de um ativo de dados e sua relevância para a organização. Esses metadados são fáceis de entender tanto para os profissionais de dados quanto para os usuários de linha de negócios.
Normalmente, um catálogo de dados tem ferramentas de gerenciamento de metadados para selecionar e enriquecer metadados com tags, associações, classificações e anotações.
As organizações modernas abrigam ambientes de dados cada vez mais complexos. Os ativos podem ser originários de vários ambientes de nuvem e sistemas locais, bem como de equipes, regiões geográficas e plataformas isoladas. Um catálogo de dados facilita para qualquer usuário encontrar, avaliar e usar todos esses dados com pouco talento ou esforço técnico.
Considere esta analogia: os sistemas Digital poupam os leitores do tempo e do esforço de vagar por prateleiras em busca de um livro específico. Um catálogo de dados serve a um propósito semelhante, ajudando os usuários a encontrar rapidamente os dados de que precisam, em vez de fazê-los navegar por vastos conjuntos de dados desorganizados. Um melhor acesso a dados melhora consideravelmente a eficiência das iniciativas de geração de insights em toda a organização, assim como um digital library leva os leitores à primeira página mais rápido.
Os catálogos de dados também desempenham papel crucial na gestão de dados, na mitigação de riscos e na conformidade regulatória, principalmente para evitar violações. Os recursos nessa área vão desde a classificação automática de dados para dados confidenciais até notificações quando são detectadas anomalias.
Por meio de catálogos de dados, os profissionais de dados podem acessar dados de forma independente, sem depender de equipes de TI, engenheiros de dados ou arriscar questões de conformidade e governança. Esses fatores criam um ambiente de dados ágil e autossuficiente que traz benefício para a organização.
Os catálogos de dados e os dicionários de dados servem a diferentes propósitos, mas funcionam juntos para tornar os dados mais utilizáveis.
Um catálogo de dados oferece uma visão geral ampla de todos os ativos de dados dentro de uma organização. Apresenta contexto de negócios para ajudar os usuários a descobrir e avaliar conjuntos de dados.
Por outro lado, um dicionário de dados define a estrutura e o conteúdo de conjuntos de dados individuais. Contém detalhes como nomes de campos, tipos de dados, valores permitidos, intervalos e formatos. Também garante que os campos de dados sejam padronizados em diversos projetos, arquivos e programas de dados.
Os catálogos de dados oferecem uma variedade de benefícios que apoiam a descoberta de dados, a governança e o uso em uma organização, incluindo:
Os catálogos de dados possibilitam análises de dados de autoatendimento, facilitando para os analistas de dados encontrar, acessar, preparar e confiar nos dados, acelerando o processo geral de análise de dados.
Criando uma divisão ideal de trabalho entre usuários e TI, os catálogos de dados reduzem os gargalos. Os cidadãos de dados podem acessar e analisar dados de forma independente, permitindo que as equipes de TI se concentrem em tarefas estratégicas e de alta prioridade.
Com dados centralizados, contextuais e confiáveis ao seu alcance, os profissionais de dados podem responder mais rápido e tomar decisões mais bem embasadas, o que os ajuda a atender às métricas de Business Intelligence (BI) e Big Data.
Promovendo, simplificando e automatizando a governança, os catálogos de dados dão aos analistas a confiança de que estão trabalhando com os dados que estão autorizados a usar, em conformidade com as regulamentações do setor e de privacidade de dados.
Os catálogos de dados podem unificar grandes quantidades de dados isolados de todas as fontes de dados de uma organização (como data warehouse, data lake e data lakehouses). A eliminação desses silos promove uma maior acessibilidade aos dados e colaboração entre os stakeholders.
Os catálogos de dados modernos oferecem um amplo conjunto de ferramentas e recursos que ajudam os consumidores de dados a encontrar, entender e usar os dados corporativos de forma responsável. Os principais recursos são:
Um catálogo de dados de IA usa tecnologias avançadas, como automação, inteligência artificial e aprendizado de máquina para aprimorar e otimizar as funcionalidades tradicionais do catálogo de dados. As principais características de um catálogo de dados de IA podem ser:
Apoiados por inteligência de dados, os catálogos de dados impulsionados por IA podem automatizar o enriquecimento de metadados técnicos em tempo real em milhares de ativos de dados.
Utilizando a classificação avançada de dados, os catálogos de dados de IA podem identificar e marcar dados confidenciais e, em seguida, aplicar regras de privacidade de dados e segurança, como controles de acesso.
Com a pesquisa inteligente, os catálogos de dados de IA podem usar o processamento de linguagem natural para expandir e aprimorar as consultas dos usuários para obter resultados e insights mais relevantes.
Aproveite seus dados para IA e análise de dados com catalogação inteligente e gestão de políticas. O IBM Knowledge Catalog é uma solução de governança de dados que disponibiliza um catálogo para automatizar a descoberta, o controle de qualidade e a proteção de dados.
Transforme dados brutos em insights praticáveis com rapidez, unifique a governança, a qualidade, a linhagem e o compartilhamento de dados, e disponibilize informações confiáveis e contextualizadas aos consumidores de dados.
Libere o valor dos dados empresariais com a IBM® Consulting, construindo uma organização orientada por insights que proporciona vantagem comercial.