Diario Vasco
img
Fecha: noviembre 24, 2015
¿Qué es el big data?
Jon Mikel Zabala 24-11-2015 | 7:00 | 0

@jonmizabala

Es posible que tod@s l@s lector@s hayan oído alguna vez hablar del big data. El big data es a menudo caracterizado por cinco V: volumen, variedad, velocidad, veracidad y valor. Algunas personas añaden otras dos V: variabilidad y visualización. Solo en el año 2014, la humanidad generó un volumen de datos (medido en exabytes – para más información pincha aquí) superior al de la humanidad desde sus comienzos. Los pronósticos indican que esta tendencia va a seguir en aumento, de forma que cada año duplicaremos el volumen de información del año anterior.

El concepto de variedad refleja los diversos tipos de datos que están hoy disponibles. Hace unas décadas, los datos que se empleaban estaban profundamente estructurados, bien en forma de tablas o de bases de datos relacionales, siendo en la mayor parte de los casos proporcionados por las oficinas de estadística. Sin embargo, en la actualidad más del 80% de los datos que se generan están en forma desestructurada, por ejemplo, en imágenes, video, voz, mensajes en redes sociales, etc. El big data simplemente es capaz de capturar esta información desestructurada para poder obtener conclusiones que aporten valor.

El concepto de velocidad caracteriza una de los principales determinantes de la sociedad actual, a saber, la celeridad no sólo con la que se genera información, sino también a la que ésta es transmitida. A modo de ejemplo, podríamos citar cientos de fenómenos que en pocos segundos se convierten en virales, o la velocidad a la que llegan noticias que se acaban de producir. El big data permite analizar la información que se está generando en tiempo real (sin necesidad de emplear bases de datos) para poder así obtener conclusiones que nos permitan tomar decisiones antes de que sea demasiado tarde.

Así, por ejemplo el big data se emplea a la hora de predecir accidentes en función de la situación de las carreteras o para poder predecir cuando los aerogeneradores pueden tener una rotura en función de la velocidad de giro o de las condiciones climatológicas, utilizando para ello millones de datos a priori desestructurados y provenientes de fuentes diversas. Para ello se emplea por un lado la información proporcionada por millones de sensores ubicados en nuestras carreteras, la información que comparten los usuarios a través de aplicaciones de gestión del tráfico, las imágenes de los radares, etc.

Es aquí donde he de introducir el concepto de valor (añadido). Debido a la velocidad a la que se producen los fenómenos sociales, las empresas necesitan tomar decisiones en tiempo real. La generación de valor no tiene que provenir necesariamente de tener que vender más, sino que a menudo el big data se emplea para predecir ciertos comportamientos (humanos o automáticos) y poder así vaticinar cuando se va a producir un determinado error, con el consiguiente ahorro económico y mejora en la eficiencia. Por tanto, a modo de resumen podemos decir que el big data nos permite recoger información desestructurada, pero que puede resultar pertinente para nuestra organización, para poder tomar decisiones más efectivas en tiempo real. En muchos casos el big data se traduce en la generación de sistemas de información avanzados y predictivos que ofrecen información estructurada y sintetizada (p.e. qué tipo de fallo se va a producir en el aerogenerador 157) para que se tomen decisiones con alta eficacia.

Sin embargo, el big data no es un fenómeno reciente, sino que lleva ocurriendo desde hace ya muchos años. ¿Te han preguntado alguna vez cuál es el código postal de tu lugar de residencia al hacer alguna compra? Puede que pienses que esa empresa no sabe nada de ti, pero ese dato que acabas de ceder de manera totalmente voluntaria, forma parte de un dato más que dicha empresa ha recogido sobre ti, para conocer tus hábitos de consumo, tus preferencias, tu tipo de amistades, caracterizarte como consumidor en función de tu nivel de renta (existe una fuerte correlación entre el lugar de residencia y el nivel de renta) y así poder realizar una publicidad personalizada, que genera valor para dicha empresa.

El big data va a tener unas implicaciones enormes en poco tiempo a todos los niveles. Una de las primeras implicaciones que se está observando ya es la variación en los perfiles más demandados en la actualidad, los “data scientists” (científicos de datos) y los salarios que se está pagando por ellos. Un data scientist no es un ingeniero informático, ni un estadístico, ni un matemático, ni un economista ni tecnólogo, sino que es todo ello a la vez. Si atendemos a los datos ofrecidos por Frank Lo, el salario de un data scientist oscila en un rango de entre $70000-165000, lo que indica claramente el valor que dichos perfiles aportan a sus respectivas organizaciones. Estos perfiles no se enseñan en las facultades de las universidades, sino que se aprenden de forma autodidacta (en la mayoría de los casos), a través de la práctica, lo que hace que estos perfiles sean aún mucho más demandados, debido a su escasez.

La mayor parte de las empresas, universidades y administraciones públicas ya están empleando el big data. ¿Por qué? Si una organización (sea cual sea) no analiza en tiempo real lo que está pasando en su entorno, el resto de competidores sí que lo estarán haciendo, por lo que sus decisiones llegarán mucho más tarde que las de sus competidores, con las consiguientes consecuencias en términos de diversificación o desarrollo de nuevo producto en el caso de las empresas. Lo mismo ocurre en el caso de las universidades. La información que ofrece el big data está cambiando de forma significativa la manera en la que muchas universidades están ofreciendo su docencia, para que ésta se adapte mejor a los requerimientos sociales y empresariales del momento. Así, a través del uso de plataformas digitales, es posible monitorizar en tiempo real el desarrollo de cada alumno, observando la cantidad de ejercicios que realizan, el tiempo medio invertido, las soluciones a las que han llegado y los medios/materiales empleados para llegar a las mismas, etc.

Puede que lo contado en este post suene a ciencia ficción, pero debería resultarnos mucho muy familiar, ya que forma parte no del futuro sino del presente inmediato. Ello me lleva a pensar de que la crisis europea no es sólo una crisis económica y financiara sino también una crisis digital, de lo que hablaré en otro día.

Moraleja: no sólo importa el tamaño (de los datos), sino también la forma en la que (éstos) se utilizan.

Puedes seguirme en Twitter: @jonmizabala

Ver Post >

Etiquetas

No hay tags a mostrar

Otros Blogs de Autor