Todo sobre los datos. Fundamentos, formularios y el valor de los datos

de | 5 febrero 2019 | Conceptos básicos

Hoy en día, los datos desempeñan un papel crucial en todas partes y todos los días: en la vida cotidiana de cada individuo, en contextos sociales y societales, en empresas individuales y en la economía en su conjunto. Sin embargo, rara vez nos preguntamos qué son exactamente los datos y cuál es su valor. Por ello, este artículo plantea una pregunta sencilla: ¿Qué son los datos? Por sencilla que pueda parecer la pregunta a primera vista, las respuestas a la misma son diversas y de múltiples capas.

Lo que los datos significan personalmente para cada uno puede ilustrarse con un simple Experimento mental comprender. Imagine que juega a un juego en el que no se juega dinero, sino información personal. Si pierde, tiene que revelar los datos que ha utilizado. Historial del navegador, historiales de chat, datos bancarios o fotos privadas: ¿qué estaría realmente dispuesto a jugarse en un juego? ¿Qué valor tendría poder ganar en un juego para que mereciera la pena utilizar estos datos como apuesta?

Definición: ¿Qué son los datos?

Los datos son la información (digital) Representación de fenómenos reales. Antes de la era digital, siempre se hablaba de datos cuando se referían a información numérica o valores obtenidos mediante mediciones. En informática, los datos son información codificada. En digital Forma básica de Datos es un código binario, es decir, una colección más o menos extensa de los números 0 y 1. Dado que los datos están codificados, existen ciertos estándares según los cuales se descodifican. Tales estándares son, por ejemplo, formatos de archivo como JPEG o PDF.

Al igual que los elementos químicos pueden presentarse en tres estados de agregación, los datos pueden presentarse en tres estados de agregación. Manifestaciones están presentes. Mientras que los elementos pueden asumir diferentes estados según el grado de su densidad energética, los datos se dividen según el grado de su Estructura en:

  1. Estructurado Datos
  2. Semiestructurado Datos
  3. Sin estructurar Datos

Los datos se distinguen entre sí por su estructura

A continuación presentamos las distintas estructuras de los datos.

Datos estructurados

Datos estructurados son datos que existen en un formato predefinido y único. En un sistema relacional Base de datos tienen etiquetas claras, por lo que los datos estructurados pueden encontrarse y editarse muy fácil y rápidamente.

Los datos se estructuran, por ejemplo, en forma de tabla. Siempre que los datos se procesen automáticamente, los datos estructurados aportan grandes ventajas. Contenidos como los valores medidos se estructuran, por ejemplo, con información adicional en una tabla, fácil identificable y por lo tanto puede ser rápido Proceso. Los motores de búsqueda también aprovechan esta ventaja.

Datos semiestructurados

Datos semiestructurados son datos que llevan una estructura "oculta", por eso hablamos de estructura implícita, irregular o parcial. Si se combinan distintos objetos en un programa informático, se obtienen, por ejemplo, conjuntos de datos semiestructurados. Ocupan una posición intermedia entre los datos estructurados y los no estructurados, porque aunque tienen cierto grado de estructura, su contenido es en gran parte desconocido. Un ejemplo de datos semiestructurados es Datos XML.

Datos no estructurados

Datos no estructurados son datos que no tienen una estructura formal. Por tanto, no pueden almacenarse simplemente en una base de datos relacional -como una base de datos SQL- como los datos estructurados. Por eso, los datos no estructurados deben prepararse o estructurarse antes de poder analizarlos. El contenido exacto de los datos no estructurados no se conoce antes de analizarlos.

Los datos no estructurados constituyen una gran parte de todos los datos generados en las empresas. Ejemplos de datos no estructurados son Datos de textoque están disponibles en correos electrónicos, opiniones de clientes, mensajes en foros, etc., pero también Imagen- y Datos de vídeoque puedan surgir en el transcurso de la producción para garantizar la calidad de la misma.

El lago de datos y el almacén de datos

Estrechamente relacionado con el aspecto de Organización y los diferentes Formatos La cuestión de dónde se almacenan realmente los datos está relacionada con el almacenamiento de los mismos. Para ello existen diferentes conceptos y tecnologías. Los dos representantes más destacados son Almacén de datos y el Lago de datos. Ambos representan también enfoques muy diferentes del panorama de los datos. Las empresas que trabajan mucho con Análisis de datos debe esforzarse siempre por evitar los silos de datos. A Lago de datos puede ayudar a alcanzar este objetivo.

Almacén de datos frente a lago de datos
Comparación entre almacén de datos y lago de datos.

En comparación con un almacén de datos y las bases de datos relacionales, en las que los datos se preparan antes de almacenarlos, todos los datos que se acumulan en una empresa fluyen hacia un lago de datos en su totalidad. Forma bruta uno. En consecuencia, un lago de datos es una forma ideal de almacenamiento de datos no estructurados.

Un catálogo de datos crea orden

En una empresa y en las organizaciones, los datos se crean en una gran variedad de contextos y formatos. En el pasado, esto solía hacerse sin tener conciencia de qué Valor en ellos y cómo pueden seguir utilizándose en el futuro. Por tanto, es aún más importante aportar competencias en materia de datos a la propia empresa y desarrollar un enfoque sistemático de los datos (Gobernanza de datos). Un enfoque para una solución en este contexto es un Catálogo de datos. Los datos deben documentarse de manera uniforme y sistemática. Esto facilita su localización.

Catálogo de datosA veces también denominado diccionario de datos, se trata de un registro central de información para todo el espectro de datos. Este directorio reúne todos los Información sobre los datos existentes y fuentes de datos. En otras palabras, un catálogo de datos es una de las herramientas más importantes para gestionar, revisar y localizar datos para su posterior procesamiento. Un catálogo de datos garantiza que todo el personal conozca la existencia, la ubicación física, los derechos de acceso y el historial de utilización, así como Calidad los datos y Contenido de todos Fuentes de datos están informados.

Sugerencia de enlace: Asesoramos y apoyamos a las empresas y a sus empleados en la creación de un Catálogo de datos e impartir formación sobre su administración y uso.

¿Qué valor tienen los datos?

Una pregunta apasionante en este contexto es: ¿qué valor tienen los datos? Hasta ahora no existe una respuesta clara y universalmente válida a esta pregunta. Aunque siempre se habla de que los datos son el nuevo petróleo, todavía no existe un precio que se corresponda aproximadamente con el precio del crudo. Esto es problemático en un aspecto en particular: Datos son hoy un importante Activo de Empresa. Pero mientras los datos no tengan precio o no esté claro cuál es su valor real, es difícil medir cuánto esfuerzo financiero está justificado para asegurar, gestionar y evaluar los datos en una empresa.

Una pista para poner valor a los datos la proporcionan los precios que se pagan por ellos en la llamada "web oscura". En Investigación de Intel y McAfee Según esto, los datos bancarios en línea, por ejemplo, se negocian a una media de 190 dólares. El precio se calcula en función del saldo de la cuenta. Un conjunto de datos que desglosa el comportamiento de compra de los clientes puede conseguirse por bastante menos, entre 3 y 20 dólares. Estos sencillos ejemplos demuestran que la Valor de los datos se sitúa en estrecha relación con el beneficio esperado que puede generar su uso.

¿Cómo crear valor añadido a partir de los datos?

Por tanto, el esfuerzo necesario para recopilar, almacenar y analizar los datos debe estar justificado. Para que los datos sean valor añadido Componente de una empresa, hay que tener en cuenta varios aspectos:

  • En Disponibilidad de los datos debe estar garantizada
  • En Calidad de los datos debe ser buena (Calidad de los datos)
  • En Responsabilidades en la empresa deben regularse (Funciones de datos)
  • Los datos deben conforme a la ley be (DSGVO)
  • Conocimientos sobre datos Debe estar presente

Si se cumplen estas condiciones para Proyectos de ciencia de datos Según nuestra experiencia, es importante adquirir experiencia en los primeros casos de uso. Para que una empresa se convierta en Empresa basada en datos Sin embargo, para garantizar que los datos se utilizan de la forma adecuada, es importante no limitarse a llevar a cabo un caso de uso tras otro, sino integrarlos en una estrategia de datos global.

Autor:inside

Michaela Tiedemann

Michaela Tiedemann forma parte del equipo de Alexander Thamm GmbH desde sus inicios. Ha participado activamente en el proceso de transformación de una empresa emergente, espontánea y dinámica en una empresa de éxito. Con la fundación de su propia familia, comenzó para Michaela Tiedemann un capítulo completamente nuevo. Sin embargo, dejar su trabajo no era una opción para la nueva madre. En su lugar, desarrolló una estrategia para conciliar su trabajo como Directora de Marketing con su papel de madre.

0 comentarios

Enviar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *