Saltar la navegación

📊 Big Data

Introducción

📊 ¿Qué es el Big Data?

Big Data se refiere al conjunto de datos tan grande, rápido y variado que no puede ser gestionado de forma tradicional. No se trata solo de tener mucha información, sino de la velocidad con la que se genera, la variedad de formatos (texto, imágenes, vídeos, sensores…) y la complejidad de su análisis.

Usuaria de Redes Sociales
Imagen de Freepik. Usuaria de RRSS generado múltiples datos

📱 Ejemplo real: los datos que genera una red social

Piensa una red social como Instagram o TikTok. Cada día, millones de personas:

  • Publican fotos o vídeos.
  • Dan "likes" o comentan publicaciones.
  • Siguen a otras cuentas.
  • Reaccionan a historias.
  • Ven o dejan de ver cierto contenido.

Cada una de esas acciones genera datos. Y no solo eso: también se registran cosas como:

  • A qué hora entras a la app.
  • Cuánto tiempo pasas viendo un vídeo.
  • Desde qué dispositivo te conectas.
  • En qué parte del mundo estás.
  • Qué tipo de contenido te gusta más (aunque no lo digas directamente).

Todo esto se almacena, se cruza con otros datos y se analiza. ¿Para qué? Para personalizar tu experiencia, mejorar los sistemas de recomendación, detectar fraudes, o incluso prever tendencias globales.

Características

Generación de datos
Generada por Dall-e. Generación de datos

Tal y como hemos visto anteriormente, el término "Big Data" se refiere a conjuntos de datos tan grandes y complejos que requieren de técnicas y tecnologías especiales para su gestión y análisis. Estos datos pueden venir de redes sociales, dispositivos móviles, sensores, transacciones online, y muchísimas otras fuentes.

Las tres "V"

Las tres propiedades que aseguran el éxito del big data se identifican mediante las tres "V":

  1. Volumen: Se trata de una cantidad enorme de datos.
  2. Velocidad: La rapidez con la que se recogen y procesan los datos.
  3. Variedad: Los diferentes tipos de datos (textos, imágenes, sonidos, etc.).

Ejemplos

  1. Redes Sociales: Cada vez que alguien publica algo en redes sociales, se generan datos que pasan a formar parte del Big Data.
  2. Salud: Los registros médicos electrónicos de los pacientes son otro ejemplo.
  3. Comercio Electrónico: Piensa en la inmensa cantidad de datos que Amazon recoge sobre las compras y preferencias de los usuarios cada vez que realizan un pedido.

Volumen: La Primera y Principal "V" del Big Data

Océano de datos en Big Data
Generada con IA: Dall-e. Océano de datos en Big Data

El Volumen es, como su nombre indica, la cantidad masiva de datos que se generan cada segundo. En el mundo del Big Data, estamos hablando de una escala realmente enorme. Imagínate que cada clic en internet, cada publicación en redes sociales, cada compra online, y cada foto subida a la nube contribuyen a este inmenso mar de datos.

¿Por Qué es Importante el Volumen?

El Volumen es la "V" más importante porque la cantidad de datos que podemos recolectar y analizar impacta directamente en la calidad del conocimientos que podemos obtener de ellos. Por ejemplo, al analizar grandes volúmenes de datos de compras online, una empresa puede predecir tendencias de consumo y ajustar su inventario o estrategias de marketing.

Ejemplos de Volumen en Big Data

  1. Redes Sociales: Plataformas como Facebook, Instagram y Twitter generan terabytes de datos diariamente a través de publicaciones, likes y comentarios.
  2. Internet de las Cosas (IoT): Dispositivos como relojes inteligentes, termostatos y vehículos conectados están constantemente enviando y recibiendo datos.

Otras "V" del Big Data

Aunque el Volumen es una pieza central del Big Data, existen otras "V" que también son importantes:

  • Velocidad: La rapidez con la que se generan y procesan los datos.
  • Variedad: Los diferentes tipos de datos (texto, imagen, video, etc.).
  • Veracidad: La calidad y credibilidad de los datos.
  • Valor: La utilidad y el beneficio que se obtiene del análisis de los datos.

Creado con eXeLearning (Ventana nueva)