Los proyectos en el campo de la ciencia de datos son cada vez más específicos, la cantidad de datos que hay que analizar aumenta y las herramientas o conjuntos de herramientas para el tratamiento y análisis de datos son cada vez más complejos. Visualización de datos más diversificada. El desarrollo tecnológico y las necesidades emergentes en los proyectos plantean un reto cada vez mayor en el tratamiento de datos para Científicos de datos Aplicabilidad de los métodos La aplicabilidad de los métodos, Algoritmos y herramientas requiere una ejecución rápida y eficaz de los pasos individuales para la exploración de datos. Un enfoque para ello es: Exploración Visual de Datos
Inhaltsverzeichnis
Características de la exploración visual de datos
El proceso de exploración de datos tiene como objetivo encontrar y analizar la información implícita y valiosa de los datos. En el proceso de exploración visual de datos percepción visual desempeña un papel destacado. Dado que la velocidad de percepción visual del ser humano es 10 veces superior a la de otros canales de percepción, lo convierte en un dotado y ágil receptor de información. El concepto de exploración visual de datos pretende, por tanto, integrar al ser humano en el proceso de exploración de datos y utilizar sus capacidades perceptivas en el análisis de grandes cantidades de datos.
La idea básica de la exploración visual de datos es presentar los datos de forma visual. De este modo se Científico de datos obtiene rápidamente información sobre los datos y puede extraer conclusiones muy rápidamente porque interactúa directamente con los datos. En este contexto, los límites entre Exploración Visual de Datos y Análisis visual. El proceso de análisis visual implica la interacción del usuario con los datos, las visualizaciones y los modelos para descubrir el conocimiento que esconden.
Exploración visual de datos
El enfoque clásico de la exploración visual de datos se basa en el conocido paradigma de tres etapas de Shneidermann:
- Visión general
- Zoom y filtro
- Detalles a la carta
Este esquema en tres partes también se conoce como "Mantra de la búsqueda de información" conocidos. El primer paso consiste en obtener una visión general de los datos. A continuación, el científico de datos se centra en las anomalías y los patrones interesantes de los datos, para finalmente poder analizar los patrones de los datos con más detalle.
Al mismo tiempo, el Científico de Datos tiene la Proceso de exploración visual de datos para combinar los métodos de análisis automatizados con las representaciones visuales interactivas. Por tanto, el Mantra de la búsqueda de información puede ampliarse o completarse como sigue:
"Analizar primero - mostrar lo importante - ampliar, filtrar y analizar más - detalles a la carta"..
Especialmente en el caso de grandes cantidades de datos -a menudo denominados en este caso Grandes datos - el problema se agrava. El reto de obtener una visión general de los datos que se van a visualizar sin perder nada interesante es cada vez mayor. Por lo tanto, es necesario definir la pregunta y analizar los datos en función de su valor de interés para mostrar los aspectos más importantes de los datos. Al mismo tiempo, el científico de datos debe estar capacitado para realizar otros análisis al poder acceder rápidamente a los datos adicionales que necesite.
El papel de las herramientas en el proceso de exploración visual de datos
Igual de importantes en el contexto de la exploración visual de datos son las Herramientas de visualización. Esto ayuda al científico de datos a colocar los datos en una representación adecuada para comprenderlos mejor. A través de las mencionadas funcionalidades del software, como a través de "Filtrado", "Zoom o "Perforar", los datos pueden analizarse más rápidamente.
Con la exploración visual de datos, usted se sumerge profundamente en los datos. Se pasa de una visión interesante a un examen más detallado o a la eliminación de datos irrelevantes. Filtras los datos para verlos desde distintas perspectivas y obtener nuevas perspectivas.
El estado de dominio experimentado en este proceso puede describirse como "Flujo analítico (flujo analítico). El término "flujo" fue acuñado por el psicólogo e investigador de la felicidad Mihaly Csikszentmihalyi y describe el estado de inmersión total y absorción completa en una actividad. Por tanto, lo ideal es que un software de análisis visual bien diseñado sea fácil de usar, no provoque fragmentación de la atención y no desaliente la inmersión total en los datos.
Retos de la exploración visual de datos
Dado que la experiencia del flujo analítico se basa principalmente en el software utilizado, el gran reto en la selección de herramientas es su Usabilidad. El uso de distintas herramientas de exploración que no son compatibles entre sí también puede ser un obstáculo en el proceso de exploración. La cantidad de datos también desempeña un papel importante en este caso.
Más grande Volumen de datos (Big Data) necesitan un tratamiento especial. Las dificultades ya surgen a la hora de navegar por los Big Data. Además, para la visualización de Big Data se necesitan técnicas de visualización debidamente adaptadas que permitan orientarse en los datos. Además, los Complejidad de los datos es todo un reto. Mientras los datos se empaquetan en la visualización, la complejidad puede llevar a confusión y distorsionar así la percepción visual.
Herramientas para la exploración visual de datos
En resumen, estos problemas se agregan hoy en día, especialmente como retos con Big Data. La exploración visual de datos es valiosa en este caso, ya que facilita enormemente la comprensión de los datos y la derivación de conocimientos.
Las herramientas son los habilitadores de los métodos descritos y a menudo permiten la exploración visual de los datos mediante software compatible. Inteligencia empresarial-Herramientas como Qlikview, Tableau u otros permiten el flujo analítico. Se caracterizan por una gran facilidad de uso, aunque presentan ciertos puntos débiles cuando se trata de big data.
En contraste con esto Herramientas de código abierto como Kibana o Datameer tratan muy bien la gran cantidad de datos. Sin embargo, estas herramientas no son muy fáciles de usar y no ofrecen un flujo analítico para el científico de datos.
Por el momento, no existe una solución estándar óptima. En otras palabras, se trata de un campo sumamente apasionante que permite albergar esperanzas de nuevos avances en el futuro.
0 comentarios