Si se tienen datos, también se tienen datos sobre los datos. Estos metadatos también deben recopilarse, estructurarse y almacenarse. Pero, ¿por qué? Cualquiera que maneje varias bases de datos o incluso varios sistemas de bases de datos sabe que es fácil perder la pista del significado real, el cálculo o el uso de la columna X en la tabla Y de la base de datos Z. Aquí es donde entra en juego un catálogo de datos: en él se pueden almacenar y documentar los metadatos, es decir, la información sobre el significado, el cálculo, la administración y los derechos de acceso, el origen (linaje de los datos), así como el estado de los datos. Al igual que en un catálogo real, los distintos atributos de los datos (análogos a los productos de un catálogo) pueden visualizarse y, en algunos casos, incluso puede realizarse una compra de datos para obtener los datos reales. Mostramos 10 catálogos de datos que pueden utilizarse en la empresa para recopilar, gestionar y redistribuir eficazmente estos metadatos como parte de una estrategia de datos.
Inhaltsverzeichnis
Centro de Gobernanza de Datos de Collibra
Collibra Data Catalog es uno de los mayores actores en el mercado de la gobernanza de datos y ofrece una plataforma para el linaje, la gobernanza y la privacidad de los datos. Con una amplia conectividad nativa, se pueden registrar diferentes fuentes de datos e integrar herramientas de terceros para la ciencia de datos, informes o BI. Además, la plataforma Collibra integra un mercado de datos para datos maestros a disposición de los usuarios. La gestión de reglas y políticas de Collibra permite establecer funciones y responsabilidades específicas de los usuarios, como la administración de datos, para garantizar metadatos completos y cualitativos.
Catálogo de datos empresariales de Informatica
Informatica Enterprise Information Catalog proporciona un motor de descubrimiento basado en aprendizaje automático para capturar activos de datos en toda la empresa y mejorar la comprensión de dichos activos mediante un catálogo de información empresarial basado en gráficos. Basado en el motor de servicios de metadatos de Informatica del mismo nombre, permite a los usuarios de negocio y a los expertos encontrar datos en toda la empresa e identificar las relaciones entre ellos. Además, los datos pueden enriquecerse con términos de glosarios empresariales y anotaciones crowdsourced para identificar su significado y cálculo. Además, las funciones de calidad y linaje de datos permiten a los usuarios comprender la procedencia, la calidad y el uso de sus datos. De forma inmediata, Informatica Enterprise Catalog se conecta a muchas aplicaciones populares de cloud, locales y de middleware para realizar análisis automatizados.
Catálogo de datos de Alation
Con el Catálogo de datos, Alation ofrece un catálogo de datos con una orientación algo diferente: Con un enfoque en las estadísticas de uso para promover la actividad y la actualidad del catálogo, los datos deben mantenerse actualizados. Además, Alation sigue un enfoque "best of breed", por lo que casi cualquier base de datos, servicio en la nube y aplicación analítica puede conectarse con innumerables conectores. Con un alto grado de personalización individual y una interfaz intuitiva, el catálogo también puede ser utilizado y adaptado fácilmente por los usuarios empresariales.
Catálogo de datos Azure
Con Azure Data Catalog, Microsoft ofrece un catálogo de metadatos para toda la empresa que hace que la búsqueda de activos de datos sea sencilla y directa. Se trata de un servicio gestionado que permite a usuarios como analistas, científicos de datos e ingenieros de datos registrar, mejorar, encontrar, comprender y buscar fuentes de información. Azure Data Catalog se integra con las herramientas existentes a través de API REST abiertas, por lo que es independiente de la tecnología. Arroja luz sobre los "datos oscuros" de la empresa para que se pueda dedicar menos tiempo a buscar datos y más a utilizarlos.
Gestión de metadatos empresariales de Oracle
La plataforma Oracle Enterprise Metadata Management (OEMM) responde a la creciente demanda de gestión de cambios en el ciclo de vida, normalización y conformidad de datos y requisitos de gobernanza de datos de diversas aplicaciones de comunicaciones, ciencias de la salud, sector público, comercio minorista, servicios públicos y servicios financieros. Permite la búsqueda interactiva y la exploración de metadatos. También ofrece la posibilidad de realizar análisis de procedencia, impacto, definición semántica y uso semántico de los datos para cada activo de metadatos del catálogo.
Catálogo de conocimientos de IBM Watson
IBM Watson Knowledge Catalog puede utilizarse para aprovechar los datos listos para el negocio en combinación con la catalogación inteligente y la gestión interactiva de políticas. Las organizaciones pueden crear una base común para un glosario de gobernanza empresarial y personalizar aún más el catálogo para satisfacer las necesidades individuales de una mejor comprensión de los metadatos. Además, el control de acceso basado en roles, las técnicas de supervisión de políticas activas y los protocolos de enmascaramiento de datos sensibles ayudan a los usuarios a proteger sus datos y promover las políticas de cumplimiento. Las recomendaciones inteligentes ofrecidas por IBM Watson facilitan el descubrimiento avanzado de activos críticos según sea necesario. Los insights de autoservicio también pueden utilizarse para crear cuadros de mando personalizados para el análisis de la calidad de los datos y el cumplimiento de las políticas.
Catálogo de datos Google Dataplex
Google Dataplex combina tanto la creación y centralización de una estructura de malla de datos como la recopilación y gestión de metadatos asociadas. Gracias a la inteligencia de datos integrada, los activos de datos pueden reconocerse e integrarse automáticamente en el catálogo en función de su origen. La calidad y el ciclo de vida de los datos pueden gestionarse fácilmente y los datos pueden dividirse, por ejemplo, en zonas lógicas específicas de un dominio. Con una función de búsqueda, los usuarios externos y empresariales también pueden encontrar rápidamente los datos solicitados y alcanzar así su objetivo con mayor rapidez.
Synabi D-Quantum
La tecnología D-Quantum de Synabi ofrece una plataforma abierta para catalogar datos y puede compararse con una navaja suiza. Para quienes estén familiarizados con Confluence y Wikipedia, el aspecto similar de la herramienta facilita los primeros pasos. Synabi también puede utilizarse para visualizar historiales de versiones de metadatos: Al comparar directamente las versiones, los cambios pueden resaltarse visualmente y son más fáciles de reconocer. Además, las funciones de linaje permiten mostrar el origen técnico y empresarial de los datos y visualizar información contextual adicional a lo largo del linaje, como el propietario de los datos.
Dataspot
Dataspot, como recién llegado, ha actualizado su producto y, además de los conocidos catálogo KPI, catálogo DQ y otros, ahora también ha integrado un Catálogo de Productos de Datos. Se puede acceder a la información de la herramienta a través de dataspot Anywhere, una API que permite el acceso en tiempo real a los metadatos. Un elemento clave de dataspot es el Business Lineage, que también puede utilizarse para visualizar otra información contextual. Los metadatos también pueden importarse y exportarse a otros formatos de datos (por ejemplo, Excel) para facilitar su mantenimiento.
Catálogo de datos Zeenea
Zeenea ayuda a las empresas a acelerar sus iniciativas de datos: La plataforma basada en la nube proporciona una base de datos fiable y comprensible con la máxima simplicidad y automatización. Con solo unos clics, la información y los metadatos se pueden encontrar, descubrir, gestionar y modificar dentro de la empresa. Zeenea diferencia entre usuarios de datos y administradores del catálogo con dos experiencias de usuario: Zeenea Studio, para los equipos de gestión de datos; Zeenea Explorer, para ofrecer a los usuarios del catálogo una experiencia de búsqueda y navegación simplificada.
0 comentarios