sábado, 9 de abril de 2016

Big Data

¿Que es el Big Data?

Probablemente sea la pregunta que muchos os hacéis, la respuesta, como el propio nombre indica, es el tratamiento de cantidades enormes de datos. No hace falta mas que pensar en el Internet que tenemos hoy en día. ¿cuantas paginas web hay? ¿cuantas más se crean cada día? Por no hablar de información en redes sociales, Wikis, repositorios...etc.

Para tratar tal cantidad de información nos encontramos con los siguientes problemas que las herramientas de Big Data tratan de solventar:
  • Volumen: Como ya hemos dicho la cantidad de datos a tratar es inmensa.
  • Velocidad: Hay que tratar los datos en un tiempo razonable, sino su estudio no seria rentable ya que la información que buscamos tardaría mucho en aparecer y podría no resultar útil cuando la encontráramos.
  • Variedad: Los datos pueden aparecer de muchas formas, mejor o peor estructurados, podemos encontrar una gran cantidad de datos que no son relevantes o poco relevantes.
  • Valor: Conocer el verdadero valor de la información para nuestro negocio.
  • Veracidad: Además hay que saber si los datos son verídicos o no.
A estos 5 elementos se los conoce como las 5 Vs del Big Data ( Big Data's 5 V's).



Además también se tiene en cuenta, aunque en muchos casos no aparezca mencionada la volatilidad de la información. 

Para tratar tal magnitud de datos hacen falta unas herramientas especializadas, ya que el propio volumen de los datos hace imposible tratarlas con las herramientas típicas de tratamiento de datos (bases de datos relacionales, por ejemplo). En esta página vamos a centrarnos en el estudio de las bases de datos que mas se utilizan en Big Data: Bases de Datos NoSQL.