Cuando oímos hablar de transformación digital, uno de los conceptos que aparece asociado es “Big Data”. En general, Big Data se entiende como una nueva tecnología que permite analizar grandes cantidades de datos, aunque es uno de los procesos de aceleración de la tecnología que más incógnitas crea. Así, algunas veces se ha podido leer en distintas redes sociales eso de …“Big Data is like teenage sex: everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it…”. Una de las preguntas que surge habitualmente es: ¿hacia dónde nos dirige el uso de grandes volúmenes de datos?
Actualmente, están surgiendo startups que ven en los datos y en la interpretación de los mismos una oportunidad para mejorar procesos y ofrecer soluciones. Es el caso de Kineo Mobility Analytics, con la que Ferrovial y Cintra están desarrollando un proyecto de modelado de la demanda en autopistas en el que se están analizando grandes volúmenes de datos geolocalizados para tener conocimiento de las necesidades de los usuarios. Hablamos con Ricardo Herranz, cofundador de Kineo, para que nos explique mejor en qué consiste Kineo y sus proyectos.
Entrevista a Ricardo Herranz, cofundador de Kineo
- Ricardo, ¿qué significa para ti el Big Data?
El término Big Data está desde hace algún tiempo en boca de todo el mundo. Mi sensación es que no existe un consenso claro sobre su significado. De manera general, podríamos definir Big Data como la gestión y análisis de grandes cantidades de datos que no es posible tratar con herramientas y metodologías convencionales, pero el abuso del término ha llevado a que a menudo se utilice como sinónimo de términos más tradicionales, como Business Intelligence o Data Analytics, o del más reciente (y seguramente algo más pretencioso) Data Science.
Todos estos conceptos están relacionados con transformar los datos en información útil para la toma de decisiones de una empresa. La diferencia más obvia entre el Big Data y la analítica tradicional es el volumen de datos que se maneja. La cantidad de datos que generamos aumenta día a día, pero también las capacidades de almacenamiento y computación. Es común encontrar en los artículos sobre el tema datos del estilo “el no sé cuántos por ciento de los datos que existen en el mundo se han generado durante el último año”. Otra característica, quizá más relevante, es que el Big Data procede a menudo de fuentes distribuidas y muy heterogéneas, son datos poco estructurados, y con frecuencia se utilizan para un propósito distinto de aquel para el que fueron generados y registrados originalmente. Es el caso, por ejemplo, de los datos procedentes de redes sociales de Internet: son datos con un enorme potencial para estudiar el comportamiento humano, pero también con mucho ruido y con importantes sesgos. Esta característica hace que sea necesario desarrollar metodologías de análisis y modelos matemáticos que permitan filtrar, corregir y fusionar datos procedentes de distintas fuentes para extraer información útil y fiable.
- En tu vida profesional — llevas más de 15 años investigando y en proyectos de consultoría de análisis de datos — ¿crees que con la introducción de las nuevas tecnologías ha cambiado mucho el acceso e interpretación de la información?
Que las nuevas tecnologías han cambiado radicalmente el acceso a la información, y seguramente nuestra forma de digerirla e interpretarla, parece evidente. La web 2.0 nos ha convertido en productores de información, además de consumidores. Pero esta información, como decía antes, no está exenta de ruido y de sesgos. No todos tenemos el mismo nivel acceso a los datos. Y, desde luego, ni los datos ni los algoritmos son “neutrales”, empezando por la decisión misma de qué datos se recogen. Si los datos no van acompañados de un entendimiento de sus limitaciones y los algoritmos de una interpretación crítica de sus resultados, pueden crear una falsa ilusión de objetividad y de democratización de la información. Esto daría para muchas discusiones interesantes sobre los límites (difusos, a veces) entre el uso de los datos como instrumentos de empoderamiento y como instrumentos de poder, pero seguramente este es un debate para otro blog.
En el plano científico, la disponibilidad de cantidades masivas de datos y la aparición de herramientas capaces de gestionar esos datos abren nuevas oportunidades para abordar cuestiones que estaban lejos del alcance del análisis cuantitativo tradicional, en particular en el ámbito de las ciencias sociales. Pero creo que aún no hemos desarrollado un marco conceptual capaz de extraer el máximo valor de esta miríada de datos. De la misma manera que los modelos matemáticos tienen escasa utilidad si no se dispone de datos fiables para calibrarlos y validarlos, los datos, sin modelos que les den sentido, no son más que números. Y tan importante como la capacidad de formular un problema en términos matemáticos es la capacidad de interpretar los resultados de los modelos desarrollados en términos del problema original. Creo que los que nos apoyamos en el Big Data para hacer investigación y consultoría debemos hacerlo desde el rigor y la responsabilidad, reconociendo la necesidad de una perspectiva interdisciplinar y multidisciplinar. Eso es lo que, modestamente, intentamos hacer desde Kineo.
- ¿Qué tipo de soluciones aporta Kineo Mobility Analytics? Es decir, ¿qué tipo de tecnología utiliza para conseguir la información y cómo la interpreta?
Kineo analiza datos geolocalizados y anonimizados de dispositivos móviles para proporcionar a las empresas privadas y a las instituciones públicas información útil sobre la actividad y la movilidad de la población. Lo que hacemos es recoger y analizar registros de telefonía móvil y otros datos geolocalizados procedentes de distintas fuentes (tarjetas inteligentes, GPS, redes sociales en Internet, etc.) y fusionarlos con datos más convencionales (por ejemplo, datos censales) para responder preguntas como, por ejemplo, cuántas personas se concentran en un determinado lugar en distintos momentos del día, qué tipo de actividad están realizando, cuánto dura esa actividad, cuál es el perfil socioeconómico de esas personas, en qué modo de transporte se desplazan, etc.
La posibilidad de caracterizar la actividad y la movilidad de las personas, de manera dinámica y a un coste sensiblemente inferior al de los métodos tradicionales, abre la puerta a infinidad de aplicaciones en campos como la planificación urbana, el transporte, el turismo, el medioambiente o las políticas de salud pública, entre otros ejemplos. En el caso de Kineo, la entrega de esta información se complementa con capacidades en modelado y simulación, lo que permite ofrecer servicios de valor añadido (por ejemplo, proyecciones de tráfico e ingresos en una autopista de peaje, como en el caso de nuestra colaboración con Ferrovial y Cintra), ayudando al cliente final a extraer el máximo valor de los datos.
- ¿Por qué la geolocalización es una fuente de información valiosa?
Es una obviedad, pero todo ocurre en algún sitio. Conceptos como los de distancia o interacción espacial están en el origen de la organización del territorio, y estas estructuras espaciales determinan a su vez los procesos que tienen lugar sobre ellas. La planificación y evaluación de políticas públicas, el dimensionamiento de las infraestructuras y la gestión de una gran variedad de servicios requieren disponer de datos, modelos y herramientas que permitan entender y predecir los patrones espaciales de comportamiento de la población.
Las fuentes de datos tradicionales, fundamentalmente encuestas, proporcionan información valiosa, pero tienen importantes inconvenientes. Las encuestas son caras y lentas de realizar, lo que limita el tamaño de las muestras que se recogen y la frecuencia de actualización de la información, a lo que hay que añadir otras limitaciones intrínsecas, como las respuestas incorrectas e imprecisas, o la dependencia de la disposición a responder de los entrevistados. Con la penetración masiva de las tecnologías de la información y las comunicaciones, prácticamente todas nuestras actividades diarias dejan una huella digital geolocalizada, generando una cantidad ingente de datos con una resolución espacial y temporal sin precedentes, que pueden ayudarnos a abordar una gran variedad de problemas económicos y sociales.
- ¿Cuántos y qué datos podemos extraer de un simple viaje en coche? ¿Por qué supone una información de gran valor para vuestros clientes?
Un viaje en coche genera distintos tipos de datos geolocalizados: la secuencia de celdas de la red de telefonía móvil en las que nos encontramos cada vez que nuestro teléfono se conecta a la red permite reconstruir nuestra trayectoria; los patrones de uso del teléfono nos proporcionan información sobre el propósito de ese viaje; la trayectoria del viaje puede obtenerse también, de manera mucho más precisa, si a través de alguna aplicación recuperamos la posición GPS del teléfono móvil, o a partir de la trayectoria GPS registrada por el navegador del coche; el análisis de los datos registrados por otros sensores del teléfono móvil, como los acelerómetros, permite identificar el modo de transporte utilizado para el viaje, en este caso el coche, diferenciándolo de otros modos, como el tren; y el paso del vehículo por distintos puntos de control quedará registrado mediante sistemas de aforos de vehículos como espiras o cámaras, o por los sistemas de cobro electrónico de peajes. Fusionando y analizando estos datos podemos caracterizar el comportamiento de la demanda de transporte, información que resulta esencial para planificar las infraestructuras, el sistema de transporte público de una ciudad, o la estrategia tarifaria de una autopista de peaje, por citar algunas aplicaciones.
Las aplicaciones en el ámbito del transporte y la movilidad son quizá las más evidentes, pero no es el único sector donde esta información resulta útil: cómo se mueven los turistas y qué zonas visitan, cuánta gente y con qué perfil sociodemográfico está expuesta a la contaminación del aire o a determinados niveles de ruido, de dónde vienen los clientes de un comercio y qué itinerarios siguen… Son muchos los sectores en los que la información geolocalizada permite tomar mejores decisiones y dar un mejor servicio a los usuarios finales.
- ¿Qué os aporta trabajar de la mano de una empresa como Ferrovial? ¿Qué experiencia habéis obtenido de este proyecto?
Por un lado, colaborar con Ferrovial y con Cintra nos está permitiendo contrastar la utilidad de nuestras soluciones en un entorno real y refinar nuestra oferta de productos y servicios para el mercado de las autopistas de peaje. El proyecto tiene un importante componente experimental y de aprendizaje para ambas partes: a nosotros nos está ayudando a entender mejor las necesidades de un cliente como Cintra, y creemos que al equipo de Innovación de Ferrovial-Cintra le está sirviendo para entender el valor de la información que Kineo puede proporcionar y adquirir un conocimiento muy valioso sobre cómo sacar el máximo partido de esa información. Tanto la comunicación y el intercambio de conocimiento con el equipo de Ferrovial-Cintra, como los resultados del proyecto, están siendo muy satisfactorios, y confiamos en que sea la primera de muchas experiencias exitosas de colaboración.
Por otro lado, trabajar con una empresa líder en la gestión de infraestructuras a nivel mundial tiene también un retorno en forma de prestigio y credibilidad. En un mercado incipiente, en el que todavía resulta fundamental construir confianza, proyectos como el que estamos realizando con Ferrovial-Cintra nos permiten validar nuestra propuesta de valor y rebajar las barreras para la adopción de nuestras soluciones por parte de otros clientes más conservadores o con menos capacidad de innovación.
- Y aunque es un tópico, no podemos dejarte ir sin preguntarte: como emprendedor, ¿qué consejo le darías a otras personas que están pensando en crear sus propias startups?
Pues no me siento muy cómodo dando consejos, pero bueno, allá vamos. Aunque también sea un tópico, mi primer consejo sería rodearse de gente buena y con la que te sientas a gusto, lo que requiere dedicar tiempo (a veces, mucho tiempo) a encontrar los mejores socios, empleados y colaboradores posibles. El segundo consejo sería poner especial cuidado en forjar y transmitir una cultura organizacional fuerte, que favorezca el trabajo en equipo, el compromiso con la empresa y con el cliente, y el desarrollo personal. El tercero sería aprovechar las oportunidades de colaborar y generar valor compartido con todos los agentes de la cadena de valor. Y el último consejo, ya que hablamos de Big Data, sería filtrar adecuadamente el ruido y los sesgos de los muchos consejos que vas a recibir de gente tan poco autorizada para dar consejos como yo.
Todavía no hay comentarios