Hoy en día, los datos impregnan casi todos los procesos empresariales. En los últimos años, las empresas han probado cada vez más productos de datos en proyectos de ciencia de datos. Sin embargo, en muchos casos no es posible darles un uso productivo y, por tanto, rentable a largo plazo. ¿Cuál es exactamente la dificultad a la hora de generar valor añadido a partir de los datos?
Las razones son múltiples y en muchos casos no se trata sólo de a motivo de fracaso. Los problemas suelen empezar con los datos subyacentes, afectar a las competencias y conocimientos del personal y, por último, provocar dificultades tecnológicas. Hemos analizado detenidamente las 5 razones más comunes que conducen al fracaso en el contexto de Proyectos de ciencia de datos no consigue generar valor añadido a partir de Datos generar.
Inhaltsverzeichnis
1) Los datos en sí.
Cuando se trata de iniciar proyectos de datos en términos muy concretos, garantizar un alta Calidad de los datos una de las claves centrales del éxito de un proyecto. Una regla empírica entre los expertos en datos es que entre el 60 y el 80% del tiempo de un proyecto de ciencia de datos debe dedicarse a preparar los datos en bruto. Los datos de los sistemas de origen deben procesarse antes de que los posteriores Análisis de datos primero se limpian, se enriquecen y se preprocesan.
Mediante estos pasos de procesamiento manual, es posible, en el marco de un proyecto prototipo, identificar las Problemas de calidad de los datos suelen ocultar. En la explotación productiva, esto suele ir asociado a esfuerzos desproporcionadamente elevados. Incluso si se dispone de datos de alta calidad, puede haber dificultades con los derechos de acceso, los derechos de propiedad o la soberanía de los datos. No es infrecuente que esto implique procesos de aprobación largos y a veces muy formalizados. A veces esto sólo supone un retraso en el curso de los proyectos de ciencia de datos. En algunos casos, sin embargo, también puede llevar al fracaso de un proyecto.
Sugerencia de enlace: En nuestro artículo del blog sobre Calidad de los datosHemos recopilado las 5 medidas más importantes.
La falta de calidad de los datos suele indicar que en las empresas tradicionales ciencia de datos en el momento en que el Procesos de generación de datos La forma en que se diseñaron y configuraron no desempeñó ningún papel. A menudo, los datos se recopilaron originalmente con fines distintos a la creación de valor mediante el análisis de datos.
2) Falta de experiencia con productos y procesos basados en datos
La segunda razón que encontramos una y otra vez es la omnipresente incertidumbre sobre Protección de datos y Seguridad de los datosque ha surgido, entre otras cosas, pero no exclusivamente, a raíz del GDPR. La trampa de las nuevas normativas es que la mayoría de ellas pueden ignorarse al principio o pasarse por alto temporalmente hasta la prueba de concepto. Por ejemplo, las dificultades de acceso a los datos se sortean trabajando con deducciones de los sistemas de origen. Esta estrategia está perfectamente bien si existe un plan de acceso automatizado. Sin embargo, este planteamiento también puede acarrear graves problemas durante la puesta en marcha si no existe este plan.
3) El factor humano
Como en la mayoría de los demás ámbitos de la vida empresarial, los proyectos de ciencia de datos no consisten principalmente en Datos, Algoritmos o Tecnologíaspero sobre Personas. Hemos visto pruebas de concepto prometedoras que se han estancado solo porque no recibieron la atención y el apoyo necesarios por parte de los niveles directivos. Parte del problema es que muchas organizaciones no tienen una dirección estratégica clara para sus actividades de ciencia de datos (estrategia de datos).
Esto dificulta que los equipos de ciencia de datos alineen sus proyectos con la estrategia general de la empresa y sus principales impulsores de valor. Además, la comprensión de Temas de ciencia de datos todavía está en pañales en muchas empresas tradicionales. En este sentido, no es de extrañar que en medio del actual revuelo sobre inteligencia artificial y Aprendizaje automático a veces es difícil vigilar lo esencial.
Además de una Conocimientos básicos y un Agradecimiento Hoy en día, para la Ciencia de Datos se necesitan sobre todo expertos con competencias complementarias. Los equipos multidisciplinares son un requisito importante para llevar a cabo con éxito proyectos de ciencia de datos. Un papel especialmente importante para el desarrollo de productos de datos de éxito es el de los Ingeniero de datos. Hasta ahora se ha prestado muy poca atención a su combinación de datos y conocimientos de desarrollo de software.
4) Obstáculos organizativos
En transformación digital tiene profundas implicaciones para el funcionamiento actual de las organizaciones tradicionales. En particular, el papel de los departamentos de TI está cambiando radicalmente. Muchas empresas apenas están descubriendo lo que este proceso de transformación significa para sus Estructura organizativa, Procesos empresariales y el Cooperación medios. Impulsados por la narrativa popular sobre la necesidad de una "TI a dos velocidades", en los últimos cinco años hemos asistido a una proliferación de innovación y Laboratorios de ciencia de datos en todos los sectores. La idea subyacente era crear una infraestructura independiente para proyectos e innovaciones digitales rápidos y ágiles.
Sin embargo, muchas empresas descubrieron que esta estructura no propiciaba una separación entre "TI tradicional y Laboratorio de innovación causó enormes fricciones. Como resultado, en muchos casos el uso de la ciencia de datos no pudo anclarse con suficiente profundidad en los procesos empresariales debido a la brecha organizativa. Por lo tanto, las empresas deben tender puentes entre los departamentos empresariales, la ciencia de datos y las TI para poder crear valor añadido a partir de los datos a largo plazo.
5) Límites tecnológicos
En primer lugar, seamos claros: La tecnología en sí misma nunca es la causa de un problema. La rápida desarrollo tecnológico en torno a Grandes datos y el aprendizaje automático, sin embargo, pueden ser todo un reto. Con la plétora de herramientas disponibles -desde las destinadas a la infraestructura de datos hasta el software de aprendizaje automático de código abierto y las aplicaciones empresariales con fines específicos-, cualquier tarea relacionada con los datos puede resolverse.
Sin embargo, la velocidad de desarrollo plantea dos retos fundamentales. -
- Tradicionalmente, muchos departamentos de TI han trabajado con un conjunto probado de tecnologías estándar. Ahora que el ritmo de innovación en el sector del código abierto ha aumentado rápidamente, las TI tienen que adaptarse más rápido que nunca.
- También suele haber discrepancias en las tecnologías utilizadas entre la fase de desarrollo de un proyecto de ciencia de datos y la fase de puesta en marcha permanente. Los científicos de datos aprecian los lenguajes de scripting como Python o R. Pero cuando se trata de Velocidad, Rendimiento, grande Volumen de datos y Estabilidad Se prefieren lenguajes de programación compilados como C++ o Java. Aunque el panorama tecnológico ofrece naturalmente respuestas a este reto, aún deben establecerse procedimientos estándar para la transferencia técnica de prototipos de ciencia de datos a la explotación.
Crear valor añadido a partir de los datos
Estas son las 5 razones principales por las que resulta difícil generar valor añadido a partir de los datos en muchos proyectos de ciencia de datos. Sin embargo, esto también ofrece a las empresas y organizaciones 5 puntos de partida para crear las condiciones necesarias para el éxito de los proyectos de datos:
- Gobernanza de datosProcesos y responsabilidades para garantizar la calidad de los datos, la claridad sobre el acceso a los mismos y la seguridad jurídica sobre su uso, facilitando tanto el desarrollo de prototipos como su puesta en marcha.
- Conocimientos de datosLa combinación de un conocimiento fundamental de los datos en toda la organización y de equipos interdisciplinarios de expertos permite que la ciencia de los datos se integre profundamente en los procesos empresariales.
- Funciones de datosLos estrategas de datos y los gestores de productos de datos, además de los científicos de datos y los ingenieros, contribuyen decisivamente al éxito de los proyectos de ciencia de datos.
- Empresa basada en datosLa supresión de la separación organizativa y una estrategia de datos común facilitan la cooperación entre los departamentos especializados, los equipos de ciencia de datos y el departamento informático.
- Lago de datosUn punto central de acceso universal a los datos y una arquitectura informática moderna pueden marcar la diferencia entre una prueba de concepto prometedora y un producto de datos productivo.
A través de medidas específicas en estas 5 dimensiones, las empresas no sólo crean las bases para proyectos individuales de ciencia de datos. También se están preparando estructuralmente para el amanecer Edad de los datos y garantizar que tengan la capacidad de generar valor añadido a partir de los datos en el futuro.
¿Quiere saber más sobre la implantación con éxito de los Productos de Datos? Descargue nuestro libro blanco gratuito "7 mejores prácticas para desplegar sus productos de datos" hacia abajo.
0 comentarios