{"id":454,"date":"2015-11-24T07:00:17","date_gmt":"2015-11-24T06:00:17","guid":{"rendered":"http:\/\/blogs.diariovasco.com\/ekonomiaren-plaza\/?p=454"},"modified":"2015-11-24T07:00:17","modified_gmt":"2015-11-24T06:00:17","slug":"bigdata","status":"publish","type":"post","link":"https:\/\/blogs.diariovasco.com\/ekonomiaren-plaza\/2015\/11\/24\/bigdata\/","title":{"rendered":"\u00bfQu\u00e9 es el big data?"},"content":{"rendered":"<p><a href=\"https:\/\/twitter.com\/jonmizabala\" rel=\"external nofollow\">@jonmizabala<\/a><\/p>\n<p>Es posible que tod@s l@s lector@s hayan o\u00eddo alguna vez hablar del big data. El big data es a menudo caracterizado por cinco V: volumen, variedad, velocidad, veracidad y valor. Algunas personas a\u00f1aden otras dos V: variabilidad y visualizaci\u00f3n. Solo en el a\u00f1o 2014, la humanidad gener\u00f3 un volumen de datos (medido en exabytes \u2013 para m\u00e1s informaci\u00f3n pincha <a href=\"https:\/\/documania20.wordpress.com\/2013\/09\/16\/cuanta-informacion-se-genera-y-almacena-en-el-mundo\/\" rel=\"external nofollow\">aqu\u00ed<\/a>) superior al de la humanidad desde sus comienzos. Los pron\u00f3sticos indican que esta tendencia va a seguir en aumento, de forma que cada a\u00f1o duplicaremos el volumen de informaci\u00f3n del a\u00f1o anterior.<\/p>\n<p>El concepto de variedad refleja los diversos tipos de datos que est\u00e1n hoy disponibles. Hace unas d\u00e9cadas, los datos que se empleaban estaban profundamente estructurados, bien en forma de tablas o de bases de datos relacionales, siendo en la mayor parte de los casos proporcionados por las oficinas de estad\u00edstica. Sin embargo, en la actualidad m\u00e1s del 80% de los datos que se generan est\u00e1n en forma desestructurada, por ejemplo, en im\u00e1genes, video, voz, mensajes en redes sociales, etc. El big data simplemente es capaz de capturar esta informaci\u00f3n desestructurada para poder obtener conclusiones que aporten valor.<\/p>\n<p>El concepto de velocidad caracteriza una de los principales determinantes de la sociedad actual, a saber, la celeridad no s\u00f3lo con la que se genera informaci\u00f3n, sino tambi\u00e9n a la que \u00e9sta es transmitida. A modo de ejemplo, podr\u00edamos citar cientos de fen\u00f3menos que en pocos segundos se convierten en virales, o la velocidad a la que llegan noticias que se acaban de producir. El big data permite analizar la informaci\u00f3n que se est\u00e1 generando en tiempo real (sin necesidad de emplear bases de datos) para poder as\u00ed obtener conclusiones que nos permitan tomar decisiones antes de que sea demasiado tarde.<\/p>\n<p>As\u00ed, por ejemplo el big data se emplea a la hora de predecir accidentes en funci\u00f3n de la situaci\u00f3n de las carreteras o para poder predecir cuando los aerogeneradores pueden tener una rotura en funci\u00f3n de la velocidad de giro o de las condiciones climatol\u00f3gicas, utilizando para ello millones de datos a priori desestructurados y provenientes de fuentes diversas. Para ello se emplea por un lado la informaci\u00f3n proporcionada por millones de sensores ubicados en nuestras carreteras, la informaci\u00f3n que comparten los usuarios a trav\u00e9s de aplicaciones de gesti\u00f3n del tr\u00e1fico, las im\u00e1genes de los radares, etc.<\/p>\n<p>Es aqu\u00ed donde he de introducir el concepto de valor (a\u00f1adido). Debido a la velocidad a la que se producen los fen\u00f3menos sociales, las empresas necesitan tomar decisiones en tiempo real. La generaci\u00f3n de valor no tiene que provenir necesariamente de tener que vender m\u00e1s, sino que a menudo el big data se emplea para predecir ciertos comportamientos (humanos o autom\u00e1ticos) y poder as\u00ed vaticinar cuando se va a producir un determinado error, con el consiguiente ahorro econ\u00f3mico y mejora en la eficiencia. Por tanto, a modo de resumen podemos decir que el big data nos permite recoger informaci\u00f3n desestructurada, pero que puede resultar pertinente para nuestra organizaci\u00f3n, para poder tomar decisiones m\u00e1s efectivas en tiempo real. En muchos casos el big data se traduce en la generaci\u00f3n de sistemas de informaci\u00f3n avanzados y predictivos que ofrecen informaci\u00f3n estructurada y sintetizada (p.e. qu\u00e9 tipo de fallo se va a producir en el aerogenerador 157) para que se tomen decisiones con alta eficacia.<\/p>\n<p>Sin embargo, el big data no es un fen\u00f3meno reciente, sino que lleva ocurriendo desde hace ya muchos a\u00f1os. \u00bfTe han preguntado alguna vez cu\u00e1l es el c\u00f3digo postal de tu lugar de residencia al hacer alguna compra? Puede que pienses que esa empresa no sabe nada de ti, pero ese dato que acabas de ceder de manera totalmente voluntaria, forma parte de un dato m\u00e1s que dicha empresa ha recogido sobre ti, para conocer tus h\u00e1bitos de consumo, tus preferencias, tu tipo de amistades, caracterizarte como consumidor en funci\u00f3n de tu nivel de renta (existe una fuerte correlaci\u00f3n entre el lugar de residencia y el nivel de renta) y as\u00ed poder realizar una publicidad personalizada, que genera valor para dicha empresa.<\/p>\n<p>El big data va a tener unas implicaciones enormes en poco tiempo a todos los niveles. Una de las primeras implicaciones que se est\u00e1 observando ya es la variaci\u00f3n en los perfiles m\u00e1s demandados en la actualidad, los \u201cdata scientists\u201d (cient\u00edficos de datos) y los salarios que se est\u00e1 pagando por ellos. Un data scientist no es un ingeniero inform\u00e1tico, ni un estad\u00edstico, ni un matem\u00e1tico, ni un economista ni tecn\u00f3logo, sino que es todo ello a la vez. Si atendemos a los datos ofrecidos por <a href=\"https:\/\/datajobs.com\/big-data-salary\" rel=\"external nofollow\">Frank Lo<\/a>, el salario de un data scientist oscila en un rango de entre $70000-165000, lo que indica claramente el valor que dichos perfiles aportan a sus respectivas organizaciones. Estos perfiles no se ense\u00f1an en las facultades de las universidades, sino que se aprenden de forma autodidacta (en la mayor\u00eda de los casos), a trav\u00e9s de la pr\u00e1ctica, lo que hace que estos perfiles sean a\u00fan mucho m\u00e1s demandados, debido a su escasez.<\/p>\n<p>La mayor parte de las empresas, universidades y administraciones p\u00fablicas ya est\u00e1n empleando el big data. \u00bfPor qu\u00e9? Si una organizaci\u00f3n (sea cual sea) no analiza en tiempo real lo que est\u00e1 pasando en su entorno, el resto de competidores s\u00ed que lo estar\u00e1n haciendo, por lo que sus decisiones llegar\u00e1n mucho m\u00e1s tarde que las de sus competidores, con las consiguientes consecuencias en t\u00e9rminos de diversificaci\u00f3n o desarrollo de nuevo producto en el caso de las empresas. Lo mismo ocurre en el caso de las universidades. La informaci\u00f3n que ofrece el big data est\u00e1 cambiando de forma significativa la manera en la que muchas universidades est\u00e1n ofreciendo su docencia, para que \u00e9sta se adapte mejor a los requerimientos sociales y empresariales del momento. As\u00ed, a trav\u00e9s del uso de plataformas digitales, es posible monitorizar en tiempo real el desarrollo de cada alumno, observando la cantidad de ejercicios que realizan, el tiempo medio invertido, las soluciones a las que han llegado y los medios\/materiales empleados para llegar a las mismas, etc.<\/p>\n<p>Puede que lo contado en este post suene a ciencia ficci\u00f3n, pero deber\u00eda resultarnos mucho muy familiar, ya que forma parte no del futuro sino del presente inmediato. Ello me lleva a pensar de que la crisis europea no es s\u00f3lo una crisis econ\u00f3mica y financiara sino tambi\u00e9n una crisis digital, de lo que hablar\u00e9 en otro d\u00eda.<\/p>\n<p>Moraleja: no s\u00f3lo importa el tama\u00f1o (de los datos), sino tambi\u00e9n la forma en la que (\u00e9stos) se utilizan.<\/p>\n<p>Puedes seguirme en Twitter: <a href=\"https:\/\/twitter.com\/jonmizabala\" rel=\"external nofollow\">@jonmizabala<\/a><\/p>\n<!-- AddThis Advanced Settings generic via filter on the_content --><!-- AddThis Share Buttons generic via filter on the_content -->","protected":false},"excerpt":{"rendered":"<p>@jonmizabala Es posible que tod@s l@s lector@s hayan o\u00eddo alguna vez hablar del big data. El big data es a menudo caracterizado por cinco V: volumen, variedad, velocidad, veracidad y valor. Algunas personas a\u00f1aden otras dos V: variabilidad y visualizaci\u00f3n. Solo en el a\u00f1o 2014, la humanidad gener\u00f3 un volumen de datos (medido en exabytes [&hellip;]<!-- AddThis Advanced Settings generic via filter on get_the_excerpt --><!-- AddThis Share Buttons generic via filter on get_the_excerpt --><\/p>\n","protected":false},"author":70,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":[],"categories":[2],"tags":[],"_links":{"self":[{"href":"https:\/\/blogs.diariovasco.com\/ekonomiaren-plaza\/wp-json\/wp\/v2\/posts\/454"}],"collection":[{"href":"https:\/\/blogs.diariovasco.com\/ekonomiaren-plaza\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blogs.diariovasco.com\/ekonomiaren-plaza\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blogs.diariovasco.com\/ekonomiaren-plaza\/wp-json\/wp\/v2\/users\/70"}],"replies":[{"embeddable":true,"href":"https:\/\/blogs.diariovasco.com\/ekonomiaren-plaza\/wp-json\/wp\/v2\/comments?post=454"}],"version-history":[{"count":0,"href":"https:\/\/blogs.diariovasco.com\/ekonomiaren-plaza\/wp-json\/wp\/v2\/posts\/454\/revisions"}],"wp:attachment":[{"href":"https:\/\/blogs.diariovasco.com\/ekonomiaren-plaza\/wp-json\/wp\/v2\/media?parent=454"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blogs.diariovasco.com\/ekonomiaren-plaza\/wp-json\/wp\/v2\/categories?post=454"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blogs.diariovasco.com\/ekonomiaren-plaza\/wp-json\/wp\/v2\/tags?post=454"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}