Big Data en el automóvil

Hace tiempo que los vehículos se han convertido en potentes ordenadores sobre ruedas, en los que cada vez más unidades de control permiten llevar a cabo un mayor número de funciones. Esto se traduce en ingentes volúmenes de datos a procesar. El bus CAN estándar utilizado en la actualidad, con una velocidad máxima de datos de un megabit por segundo (Mbps), hace ya tiempo que se plantea insuficiente. Pero incluso Flexray, con 10 Mbps, está llegando a su límite. Por este motivo, Ethernet empieza a abrirse camino en los vehículos, proporcionando 100 o 1.000 Mbps según la variante. Un vehículo moderno de última generación con una dotación amplia de equipamiento, envía internamente alrededor de 20 gigabits de datos por segundo, lo cual sería impensable hasta hace unos años.

Con la creación de nuevos flujos de datos todos los días, y con la Industria 4.0 y el «internet de las cosas», cobra cada vez más importancia la idea de adoptar un enfoque estratégico para el llamado Big Data. Convertir números e información en conocimientos prácticos es un factor clave. De hecho, las empresas pueden obtener una ventaja competitiva al tener acceso instantáneo a sus datos y al analizarlos, comprenderlos y administrarlos en tiempo real. Tanto los Macrodatos (Big Data) como la tecnología de transmisión de los mismos, juegan un papel fundamental en la consecución de estos objetivos.

Ahora la información se procesa en decenas de unidades de control. Pero antes no era así: los primeros vehículos en incorporar sistemas inteligentes tenían solo dos unidades de control, la del motor y la de los frenos, que estaban conectadas en red a través del bus CAN”. En el futuro, las funciones de conducción altamente automatizadas requerirán un aumento de la velocidad de transmisión de datos debido al empleo de numerosas cámaras, radares y sensores lidar. Un vehículo de pruebas genera hasta 44 terabytes de datos al día durante la conducción automatizada. Los datos se guardan en discos duros rápidos en los maleteros de los coches”. Desde allí, la información se envía a la nube, donde se acumula todo lo relativo a las pruebas de conducción y las simulaciones durante el desarrollo del vehículo.

En este momento, ya nos encontramos en el rango de los petabytes. Para hacerse a la idea, un petabyte corresponde a unos mil discos duros de un ordenador moderno”, calcula Daniel Schumacher, que trabaja como especialista en Arquitectura de Datos en la Nube en Porsche Engineering. “Pronto nos moveremos en el ámbito de los exabytes”. Afortunadamente, los fabricantes de discos duros se superan y ofrecen regularmente dispositivos más capaces, por lo que es poco probable que los desarrolladores de vehículos superen los límites en un futuro previsible. Una vez llegan a la nube, los datos están disponibles para su análisis, en algunos casos en tiempo real. Se pueden utilizar, por ejemplo, para entrenar redes neuronales aplicables a funciones de circulación altamente automatizada, así como analizar mensajes de error de las unidades de control.

Los algoritmos, cada vez más, sirven de apoyo a los ingenieros de aplicaciones, que pueden encontrar mejores soluciones y de una forma más ágil a través del desarrollo basado en datos. Esto irá en aumento en los próximos años. Los volúmenes crecientes de datos y los ordenadores cuánticos abrirán nuevas posibilidades para los ingenieros, que se traducirán en nuevas experiencias de conducción que hoy en día son apenas imaginables para los clientes.

Los dispositivos, sensores y sistemas interconectados generan continuamente enormes cantidades de datos. Al utilizar la tecnología de transmisión de datos, es posible recopilarlos aunque provengan de diversas fuentes e integrarlos en una sola plataforma.

Para comprender el funcionamiento, es importante entender la diferencia entre el procesamiento por lotes y el procesamiento de transmisión de datos. El procesamiento por lotes es una forma eficiente de manejar grandes volúmenes de datos, pero no es adecuado para manejar datos mientras aún se están generando. La transmisión de datos, por el contrario, permite procesar y analizar los números y la información en tiempo real y obtener resultados inmediatos.

El reciente aumento de la transmisión de datos ha abierto nuevas posibilidades para el análisis en tiempo real. En Porsche, las tecnologías de transmisión de datos se utilizan cada vez más en diferentes áreas, entre otras, fabricación, ventas, garantía, cadena de suministro, vehículos conectados y estaciones de carga. Si tomamos como ejemplo el Porsche Taycan, sus numerosos sensores escanean continuamente el entorno del vehículo. Gracias a la tecnología de transmisión de datos, este automóvil conectado es capaz de procesar la información proporcionada por los sensores y ayudar al conductor en tiempo real.

Los datos recopilados a bordo en un automóvil moderno se pueden clasificar como datos de comportamiento o de diagnóstico:

* Los datos de comportamiento son generados como respuesta al uso del vehículo por parte del conductor. Por ejemplo, la información relativa a la velocidad, la dirección, la frenada o la eficiencia de conducción se transmiten a un sistema central seguro y protegido. Del resultado de analizar todo esto, los algoritmos de aprendizaje automático pueden determinar si el conductor tiene fatiga y emitir una alerta de aviso

* Los datos de diagnóstico son el resultado de la capacidad de acceder a la información de un vehículo; esto podría, por ejemplo, permitir a los fabricantes evaluar el estado de un coche y notificar al usuario cuando se requiere un servicio de mantenimiento.


Por poner un ejemplo, en el caso de Porsche, están desarrollando una solución de transmisión de datos llamada Streamzilla, el cual aspira a ser un elemento central para cubrir todas las necesidades de transmisión de datos dentro de Porsche. Es un servicio administrado internamente, que permite a diferentes equipos de ingeniería de producto crear y ejecutar aplicaciones que aprovechan las capacidades de baja latencia, alto rendimiento y tolerancia del sistema Apache Kafka. También se utiliza Apache NiFi para automatizar y administrar el flujo de datos entre sistemas. Ambas son plataformas de código abierto altamente escalables, que permiten canalizaciones y aplicaciones de transmisión de datos en tiempo real.

Con Streamzilla, los equipos de Porsche pueden utilizar las interfaces de programación de aplicaciones (API) nativas, Apache Kafka y Apache NiFi, para crear lagos de datos, transmitir cambios hacia y desde bases de datos y potenciar el aprendizaje automático y las aplicaciones de análisis.

Apache Kafka y Apache NiFi son difíciles de configurar, escalar y administrar en producción. Cuando los equipos individuales ejecutan estos complejos sistemas por su cuenta, necesitan hacer uso de servidores, configurar manualmente una tecnología de código abierto, reemplazar los servidores cuando fallan, gestionar las actualizaciones, garantizar que el almacenamiento de datos sea seguro y duradero, configurar la monitorización y las alarmas y planificar cuidadosamente posibles cambios en la escala de datos soportados.

Streamzilla hace que sea fácil para los equipos de ingeniería ejecutar aplicaciones de producción sin necesidad de contar con experiencia en administración de infraestructura de código abierto. Esto significa que pueden dedicar más tiempo a afinar los automóviles, con mejoras en la navegación a tiempo real, la eficiencia de conducción, el mantenimiento predictivo, la conectividad o los sistemas de asistencia. Y lo más importante, significa que en la marca pueden dedicarse a alcanzar el más importante de todos los objetivos: poner una sonrisa en los rostros de sus clientes cuando conducen un Porsche.

Big Data and the automotive industry
Managing data in automotive
Exposing Tesla’s Insane Data Mining Operation

Espero que haya sido de su interés, hasta el próximo artículo.