Se trata de datos demasiado grandes o complejos para ser almacenados o procesados con tecnologías convencionales. Suelen surgir de las tres V con las que se asocian los Big Data:
- VolumenLa cantidad de datos que se recogen, almacenan y procesan.
- Big Data = gran cantidad de datos.
- Velocidad (velocidad): La velocidad a la que deben recopilarse, almacenarse y procesarse los datos para un caso de uso concreto, a menudo en tiempo (casi) real.
- Big Data = los datos requieren un procesamiento rápido.
- DiversidadTipo y estructura de los datos.
- Big Data = datos en cualquier forma, incluidos los no estructurados (en el pasado, los datos eran casi exclusivamente estructurados).
Independientemente de cómo se definan en última instancia los Big Data, la explosión en la generación, almacenamiento y procesamiento de datos ha tenido profundas consecuencias en diversos ámbitos. Por un lado, la disponibilidad de tantos datos ha abierto posibilidades completamente nuevas para utilizarlos, por ejemplo con Métodos de aprendizaje automático a la creación de la IA. Así que ha permitido toda una nueva gama de casos de uso de datos. Por otro lado, también ha ejercido una gran presión sobre las tecnologías de almacenamiento y procesamiento de datos. Dado que las tecnologías tradicionales no han sido capaces de gestionar Big Data, la presión por innovar y mejorar ha dado lugar a toda una nueva gama de tecnologías.
Una definición alternativa de Big Data:
Casos de uso de almacenamiento y procesamiento de datos que requieren el uso de computación paralela en clusters de ordenadores para almacenar, procesar o analizar datos.
El trabajo con Grupos de ordenadores en lugar de servidores u ordenadores de un solo nodo suele hacer que el análisis y el procesamiento de los datos sean mucho más complejos.