Le Datalab RATP Smart Systems, la data au service de votre quotidien

Ville intelligente, transport intelligent, véhicules intelligents

Rédigé par Tatiana | 5 sept. 2023 14:52:37

On vous propose aujourd’hui de découvrir le résumé de la thèse « Machine Learning pour la gestion distribuée et dynamique d’une flotte de taxis et navettes autonomes », réalisée par Tatiana BABICHEVA en collaboration avec l’Institut VEDECOM et l’Université Paris-Saclay. Spécialiste en recherche opérationnel chez RATP Smart Systems, Tatiana évoque dans son article à la fois les résultats de la recherche scientifique pour les grands réseaux de taxis autonomes et les tendances modernes développées chez RATP Smart Systems.

Smart Cities et Smart Transport

Un transport défaillant peut transformer une ville agréable à vivre en un véritable cauchemar. Les citoyens ne pourront pas bénéficier de soins médicaux rapides, les pompiers ne pourront pas intervenir à temps en cas d'incendie, et les services publics ne pourront pas faire face aux urgences. L'effondrement du système de transport paralysera l'économie de la ville, affectant en premier lieu les flottes de transports en commun, de transport de marchandises et de services de livraison. La ville sera alors étouffée par les embouteillages et la pollution, devenant ainsi invivable.

L’une des principales tâches des autorités de la ville est l’introduction de solutions technologiques pour créer une capacité de réserve des infrastructures de transport, en tenant compte de la charge croissante. Cependant, il est important non seulement de moderniser et de construire de nouveaux éléments de l’écosystème des transports, mais aussi d’utiliser efficacement ceux existants.

Le transport évolue en fonction des exigences de l’époque et de la tendance à la numérisation universelle. Avec le développement de l’Internet of Things (IoT) et l’avènement des villes intelligentes, les véhicules utiliseront de plus en plus une connexion Internet. La connexion d’un véhicule intelligent au réseau peut être bénéfique pour les autorités municipales. S’ils collectent et utilisent correctement les données accumulées, ils ouvriront de nouvelles opportunités de fonctionnement et d’amélioration de la situation des transports dans la ville. De tels changements dans les transports sont appelés «Mobilité Intelligente» (Smart Mobility).

Le transport intelligent et respectueux de l’environnement, en particulier les véhicules électriques, joue un rôle essentiel dans la Mobilité Intelligente. À l'origine, le covoiturage était un moyen pour plusieurs compagnons de partager les frais d'utilisation d'une voiture privée. Avec l'avènement des technologies mobiles, cette pratique est devenue de plus en plus populaire. Grâce aux applications en ligne, les voyageurs peuvent trouver facilement des compagnons de route, que ce soit pour travailler en chemin ou partager une même vision du voyage. Ainsi, les voyageurs arrivent à destination avec un grand confort tout en contribuant à désengorger les routes et les transports en commun.

Avec le développement rapide des véhicules autonomes, l'organisation du covoiturage sera encore simplifiée. Pour mettre en place cette voiture du futur, il est essentiel d'avoir un bon logiciel, une vision industrielle solide, des capteurs automobiles et d'autres systèmes avancés. Afin de garantir la popularité d'un tel service auprès des clients, il est crucial qu'il soit plus confortable, plus rapide et plus économique que les moyens de transport traditionnels. De plus, en intégrant des pilotes automatiques, on espère réduire les accidents mortels et améliorer la sécurité des déplacements.

Problème de taxi autonome intelligent

Dans cet article, nous abordons la gestion d'un parc de véhicules autonomes au sein de la ville. Nous envisageons une ville avec des stations de transport en commun telles que la RATP et la SNCF. La ville propose un service de taxis ou de navettes autonomes qui circulent sur un réseau routier partagé avec d'autres types de véhicules, tels que les transports en commun et les véhicules conduits par des humains. Ce système permet aux clients de réserver un véhicule autonome à l'avance ou à la dernière minute pour un trajet immédiat. Le trajet proposé peut être partagé avec d'autres clients ou nécessiter que le client fasse une certaine distance à pied. L'objectif principal d'un opérateur de transport qui propose un service de taxi autonome est d'utiliser efficacement les véhicules disponibles. L'opérateur cherche à maximiser la qualité du service tout en minimisant les coûts opérationnels, y compris la consommation d'énergie, l'entretien des véhicules et autres dépenses.

L'objectif global de nos travaux est axé sur le développement de taxis autonomes électriques. Plus précisément, notre objectif est de concevoir des stratégies de réservation de véhicules autonomes (taxis, navettes) permettant le partage dynamique de ces véhicules entre plusieurs clients. L'idée fondamentale de ces stratégies est d'identifier les clients dont les demandes peuvent être regroupées et attribuées au même véhicule tout en garantissant un certain niveau de qualité de service.

Dans ce contexte en ligne, les demandes des clients se produisent de manière continue et les véhicules disponibles pour le co-voiturage nécessitent une gestion de la recharge électrique. L'objectif principal de ce système est de satisfaire les clients qui ont besoin d'un service de taxi.

En ce qui concerne les préférences des passagers, nous pouvons envisager deux approches différentes. La première est une approche classique où le passager est considéré comme satisfait s'il est pris en charge dans les limites de temps générales et s'il bénéficie d'un trajet approprié. Il est considéré comme insatisfait si l'une de ses contraintes de voyage n'est pas respectée. La deuxième approche est stochastique, avec des fonctions de préférence non linéaires et une randomisation dans le cadre des contraintes d'utilité. Dans ce cas, le système de taxi ne connaît pas les préférences de la fonction utilitaire, mais il reçoit des réponses des passagers sur l'acceptation du voyage et leur satisfaction après celui-ci. La nature non linéaire et stochastique des fonctions de préférence permet de mieux modéliser le comportement humain.

La demande des clients peut considérablement varier d'un jour à l'autre et d'une semaine à l'autre, tandis que la migration pendulaire peut suivre une direction très précise à des heures spécifiques. Ces éléments entraînent un déséquilibre entre l'offre et la demande de véhicules aux points de départ et d'arrivée. Afin de garantir un service efficace, il est nécessaire de redistribuer les véhicules vides pour répondre à la demande des passagers. L'analyse des données de déplacement permet d'améliorer la prévision statistique des futures demandes de déplacement. À cette fin, nous avons développé un ensemble d'outils de pré-calcul qui étudient les méthodes permettant d'obtenir la structure exacte du réseau à partir des données GPS des mouvements des véhicules combinées aux données OSM. Les résultats sont présentés sous la forme d'un graphique routier pondéré, où les routes de la ville sont représentées par des arcs et les intersections ou les stations de transport en commun par des sommets. Ce graphique, construit à partir des données de OSM et de GPS, permet d'obtenir des modèles de vitesse pour les arcs, qui sont des composants essentiels à la gestion des taxis autonomes. Nous proposons des méthodes de partitionnement du graphique de la ville et fournissons un module de recouvrement de graphique basé sur ce partitionnement.

*Le partitionnement est l’opération qui consiste à diviser ce support en partitions dans lesquelles le système d’exploitation peut gérer les informations de manière séparée, généralement en y créant un système de fichiers, une manière d’organiser l’espace disponible.

Les stratégies de réservation de véhicules autonomes s'appuient sur des techniques de regroupement et d'apprentissage automatique, en utilisant des agents distribués tels que des véhicules autonomes capables d'échanger des informations, ainsi qu'un système centralisé doté d'une connaissance de l'environnement. En fonction des besoins en termes de qualité de service et de la situation des véhicules, le système proposera de traiter les demandes des clients en fonction de son utilité propre. Les stratégies de tous les acteurs impliqués peuvent être améliorées grâce à l'utilisation de méthodes d'apprentissage et de prédiction automatiques.

Le système de taxis autonomes rencontre deux problèmes majeurs : l'attribution des véhicules aux passagers et la redistribution des véhicules vides. Ces problèmes sont considérés comme NP-difficiles, c'est-à-dire qu'ils sont insolubles même en utilisant tous les ordinateurs du monde. Par conséquent, les méthodes d'optimisation classiques se limitent à des solutions heuristiques ou "gloutonnes", surtout pour les réseaux de grande taille et de structure complexe. Bien que ces heuristiques ne donnent pas nécessairement des résultats optimaux, elles sont suffisamment performantes pour répondre aux exigences d'un tel système. Nous proposons des heuristiques basées sur la décomposition de ce problème, qui incluent la répartition du réseau routier et la mise en évidence de sous-problèmes tels que la gestion de la charge, la redistribution des véhicules vides et le partage de trajet dynamique.

Les solutions aux sous-problèmes : Empty Vehicle Redistribution

Un aspect essentiel de tout système de gestion de taxi est la manière dont les véhicules sont attribués aux passagers et redistribués dans le réseau afin d'offrir un service optimal. Dans le cas des taxis autonomes et des PRT, le service répond à la demande immédiate de la plupart des passagers, avec seulement quelques trajets réservés à l'avance. Bien que des informations parfaites sur les demandes futures ne soient pas disponibles, il est possible de prédire les tendances grâce aux données historiques. De plus, la demande des passagers peut varier de manière asymétrique dans le temps et sur le réseau, ce qui entraîne des déséquilibres entre l'offre de véhicules et la demande. Il est donc nécessaire de redistribuer les véhicules vides en fonction de l'offre et de la demande afin de rééquilibrer le système. Pour proposer des stratégies de relocalisation des véhicules vides et offrir un meilleur service, il est important d'étudier les techniques actuellement utilisées et de développer des stratégies basées sur des méthodes heuristiques classiques ainsi que sur l'apprentissage par renforcement.

Une question cruciale dans la gestion du système de taxi est de minimiser le temps d'attente des clients et, par conséquent, de maximiser leur satisfaction. Un des problèmes associés à cette question est la redistribution des véhicules vides (Empty Vehicle Redistribution, EVR). Nous proposons un ensemble de nouvelles méthodes de redistribution des véhicules vides, certaines étant proactives et prenant en compte à la fois la demande actuelle et la demande future anticipée, tandis que d'autres sont réactives et se concentrent uniquement sur la demande actuelle.

Les méthodes de redistribution des véhicules vides décrites dans la littérature et dans nos travaux peuvent être regroupées dans les catégories suivantes.

Algorithmes réactifs

· Basic allocation (BA):Si des clients attendent à une station et qu'il y a des véhicules vides disponibles, ces véhicules seront attribués aux clients qui ont le plus long temps d'attente. Cette approche de base est utilisée pour évaluer les différentes méthodes de redistribution des véhicules.

· Simple Nearest Neighbours (SNN):La réaffectation des véhicules vides les plus proches pour servir les clients avec le temps d'attente le plus long est une pratique courante utilisée par des chercheurs renommés tels qu'Andréasson, Fatnassi, Fagnant, Kockelman et Lees-Miller.

· Heuristic Nearest Neighbours (HNN): La réaffectation des véhicules vides les plus proches pour servir les clients ayant le temps d'attente le plus long est une méthode qui vise à améliorer le SNN en prenant en compte le temps nécessaire aux véhicules pour atteindre les clients. La différence entre les méthodes SNN et HNN peut être significative. Prenons l'exemple d'un réseau sous la forme d'une longue route avec un véhicule vide à une extrémité et deux clients en attente, un à chaque extrémité de la route. Si nous appliquons l'algorithme SNN, le véhicule se déplacera vers le client en attente depuis le plus longtemps, peu importe le temps nécessaire pour atteindre ce client. En revanche, si nous utilisons le HNN, le véhicule se déplacera vers l'autre extrémité de la route car le temps d'attente du client le plus éloigné sera le plus important au moment de l'arrivée du véhicule. Cette méthode est mentionnée par Kek et al, ainsi que par Bell et Wong.

· Send The Nearest (STN):La réaffectation des véhicules vides les plus proches se fait en se basant sur les paires les plus proches entre les véhicules disponibles et les passagers en attente. Les gares avec des passagers en attente sont classées en fonction de l'intervalle de temps entre le véhicule disponible le plus proche et la gare. Cette méthode est décrite par Babicheva et al. dans leur étude sur les algorithmes proactifs.

Algorithmes proactifs

· Surplus/Deficit vehicle Redistribution (SDR): La réaffectation des véhicules vides de la station avec le plus grand surplus de véhicules à la station présentant le plus grand déficit de véhicules est une méthode utilisée par Andréasson. Le surplus/déficit de véhicules est défini pour chaque station en soustrayant le nombre de véhicules disponibles (actuellement ou dans un horizon temporel défini) au nombre de clients en attente (actuellement ou dans l'horizon temporel défini).

· Index Based Redistribution (IBR):La redistribution des véhicules vides repose sur le concept de l'indice maximal des stations. Alors que l'indice virtuel de la station, tel que décrit par Kek et al., se concentre sur le nombre de véhicules sans prendre en compte les temps d'attente des passagers, notre méthode novatrice utilise une approche différente pour calculer cet indice. Cette approche, développée par Babicheva et al., tient compte à la fois du nombre de véhicules et des temps d'attente des passagers.

· Zone index-based EVR est une modification basée sur un zonage de la méthode IBR. Dans ce cas, la redistribution des véhicules vides est réalisée sur la base de l’indice de zone, qui peut prendre en compte d’éventuelles arrivées futures. Pour chaque zone, l’indice est calculé comme une mesure de la file d’attente prévue au moment de l’arrivée du véhicule le plus proche, y compris le temps nécessaire pour que le véhicule arrive à la gare. Le calcul de l’indice de zone est basé sur les clients déjà arrivés et sur les clients « virtuels » qui arriveront à certaines périodes.

Des méthodes novatrices basées sur des heuristiques ont été étudiées pour la redistribution des véhicules vides dans le domaine des services de taxi, tant au niveau des véhicules qu'au niveau des zones. Grâce à différentes études de cas, nous démontrons que tous les algorithmes ne se valent pas et que les approches gourmandes ne donnent souvent que des résultats sous-optimaux. C'est pourquoi nous préconisons l'utilisation de méthodes mixtes de redistribution, combinant des approches réactives et proactives. Ces méthodes peuvent être appliquées non seulement aux taxis autonomes, mais aussi aux PRT, aux services de taxi traditionnels et aux bus de remplacement. Cette approche est décrite en détail dans l'article intitulé "Integrating Demand Responsive Services Into Public Transport Disruption Management" de Matej Cebecauer, Wilco Burghout, Erik Jenelius, Tatiana Babicheva et David Leffler.

Les solutions aux sous-problèmes : Ride-Sharing

Les méthodes courantes de covoiturage reposent sur des techniques de mise en correspondance. On peut mettre en évidence un brevet sur le covoiturage qui vise à trouver les passagers avec les origines et/ou les destinations les plus proches. Les mathématiques et l'informatique de ce problème sont complexes et riches. Il existe des méthodes telles que la méthode de génération de colonnes lagrangiennes qui permettent de calculer de manière optimale la façon d'assigner les navetteurs aux voitures tout en minimisant les participants non assignés, et la généralisation avec des préférences individuelles telles que l'âge, le sexe, la préférence pour fumer ou les restrictions sur les animaux.

Des scientifiques du monde entier ont également étudié la dynamique quotidienne et les caractéristiques du problème de mise en correspondance des passagers dans le système de covoiturage intelligent. Ils ont développé des heuristiques d'insertion pour résoudre le problème des tournées de véhicules avec des contraintes complexes, ainsi qu'un problème de routage d'inventaire. Ils ont également exploré des approches d'optimisation combinatoire pour modéliser à la fois le covoiturage dynamique et le partage de taxi, dans le but de maximiser le nombre de demandes satisfaites et de minimiser le coût total payé par les passagers. Une méthode de mise en correspondance gourmande a également été développée.

Les méthodes de sélection des passagers à ajouter au voyage partagé peuvent adopter différentes approches. Par exemple, on peut privilégier les voyageurs qui attendent depuis le plus longtemps, ou utiliser des méthodes d'apprentissage automatique avec regroupement des utilisateurs du réseau pour optimiser le choix. Parmi les différentes possibilités de flexibilité pour atteindre le niveau requis de voyages partagés, on peut mentionner la flexibilité de l'heure de départ, la flexibilité de la correspondance, la flexibilité des détours et la flexibilité de la planification.

Les méthodes populaires de covoiturage pour un seul véhicule peuvent être divisées en deux familles principales, décrites ci-dessous. Nous proposons également une nouvelle méthode, le covoiturage basé sur la zone.

· Searching on the way : Cette stratégie consiste à trouver un client supplémentaire sur la trajectoire actuelle du véhicule ou à proximité de celle-ci.

· Searching in the area of the origin and/or destination : Cette catégorie de méthodes a pour objectif de trouver des clients supplémentaires dont l'origine et/ou la destination se trouvent dans la zone actuelle d'origine et/ou de destination.

· Zone-based ride-sharing method : Nous avons développé une méthode novatrice qui vise à accélérer le covoiturage en utilisant le clustering du réseau routier. Notre approche consiste à rechercher, pour chaque véhicule, un groupe de clients potentiels pour le covoiturage, en prenant en compte les principales lignes (zones de dépassement) du trajet du véhicule. En utilisant ces données, nous utilisons ensuite un algorithme d'indexation pour prédire tout retard potentiel pour les clients. Pour le partage, le système sélectionne de manière gourmande les clients ayant les indices de retard minimaux.

L'intérêt de cette nouvelle méthode est évident à partir de l'exemple suivant : Supposons qu'il y ait un passager prêt à se rendre à la station 4 aux stations 1, 2 et 3. Et à la station 4, il y a deux passagers qui veulent se rendre à la station 2. En servant les passagers des stations 1, 2 et 3, non seulement nous pouvons satisfaire davantage de passagers, mais cela aiderait également à créer un itinéraire de covoiturage partagé.

Les solutions aux sous-problèmes : Conclusion

Dans le cadre de notre étude, nous avons développé une architecture fonctionnelle pour gérer un système de taxis autonomes électriques. Afin d'alimenter nos méthodes d'optimisation avec des heuristiques pertinentes, nous avons étudié un ensemble de techniques pour résoudre différents sous-problèmes qui surviennent lors de l'optimisation de ce système de taxis autonomes et partagés. Nous avons analysé les bornes de recharge et de stationnement pour prédire la disponibilité de places pour les taxis autonomes. Nous avons également proposé des stratégies de recharge des véhicules basées sur l'état du système.

Pour la partition en zones du réseau urbain, nous avons proposé des méthodes basées sur l'évolution différentielle. Nous avons défini le problème de manière à ce que les solutions obtenues puissent être appliquées à l'optimisation du système de taxis, en veillant à ce que les zones soient connectées et aient une taille raisonnable.

Nous avons étudié de nouvelles méthodes heuristiques d'algorithme de redistribution des véhicules vides à deux niveaux : au niveau des véhicules et au niveau des zones. Les méthodes de redistribution des véhicules vides par zone ont été étudiées afin de fournir des preuves plus claires de la fluidité de la circulation pendant les heures de pointe. Ces méthodes de redistribution par zone sont indispensables pour gérer un trafic aussi dense, notamment lors de l'utilisation du covoiturage.

La solution globale : l’apprentissage par renforcement

La principale contribution de notre approche est l'apprentissage par renforcement (RL). Dans ce cadre, des agents interagissent avec leur environnement et apprennent de leurs actions. Si une action est bénéfique, par exemple si elle satisfait un client ou facilite le partage de trajet, l'agent est récompensé et a plus de chances de répéter des actions similaires. À l'inverse, la probabilité d'effectuer une action similaire diminue si elle est jugée inefficace. Cette logique est également utilisée par les chauffeurs de taxi expérimentés, qui peuvent refuser un trajet de nuit vers une zone à risque ou un court trajet qui passe par un énorme embouteillage.

Nous proposons un apprentissage par renforcement à différents niveaux, en fonction de la granularité souhaitée du système. Nos solutions sont conçues pour être utilisées dans différents réseaux de transport. Par exemple, pour les petits réseaux, nous proposons un modèle RL basé sur les stations, tandis que pour les grands réseaux, nous proposons un modèle RL basé sur les zones, où chaque zone est obtenue par partitionnement de la ville. Les modèles centralisés peuvent offrir de meilleures performances en termes de temps d'exécution et de stabilité. Nous proposons également une optimisation basée sur des informations complètes pour analyser a posteriori les performances du système en dehors de l'optimisation en ligne.

Nous avons mis au point des méthodes d'apprentissage par renforcement à différents niveaux de décision : le microlevel (niveau micro), le mesolevel (niveau intermédiaire) et le macrolevel (niveau macro).

Le microlevel se concentre sur la granularité la plus fine, où les décisions principales sont prises par les véhicules eux-mêmes. Dans ce niveau d'apprentissage micro, les véhicules jouent un rôle clé dans l'apprentissage par renforcement. Les demandes passent par le système central et sont envoyées aux véhicules d'une certaine région d'origine. Les véhicules acceptent ou refusent ces demandes en fonction de leur disponibilité.

Le mesolevel constitue une avancée vers une granularité plus importante et l'échelle du problème est obtenue grâce à la partition de la ville en zones. Les demandes arrivent au système central, qui les envoie aux zones pouvant les satisfaire. Les zones prennent alors la décision. Après que toutes les zones ont pris leur décision, le système central prend sa décision et la zone concernée passe une commande pour le véhicule choisi. Les zones se superposent, ce qui signifie qu'un taxi peut appartenir à plusieurs zones, par exemple, s'il se trouve entre elles. Les zones prennent des décisions de manière similaire au niveau micro, mais elles tiennent également compte du nombre de véhicules disponibles dans la zone, qui peuvent proposer un trajet normal ou partagé. Pour cela, la zone examine tous les véhicules qui lui sont attribués.

Le niveau macro, quant à lui, englobe la centralisation complète du système et a pour objectif de fournir une solution optimale à chaque pas de temps. Il est subdivisé en différents niveaux de mise à l'échelle afin de tenir compte de la complexité du système. Toutefois, le partage de toutes les informations entre les véhicules d'un système centralisé peut entraîner une malédiction de la dimensionnalité. C'est pourquoi, dans le cas d'un système centralisé, nous utilisons une adaptation de l'apprentissage par renforcement au niveau micro ou méso, en fonction de la taille du système. La différence réside dans la possibilité de partager les paramètres. Comme dans toutes les méthodes d'apprentissage par renforcement, la redistribution, le covoiturage et la recharge des véhicules sont basés sur les méthodes heuristiques décrites précédemment. Cependant, le processus de prise de décision au niveau du système central diffère légèrement. Une fois qu'un ensemble de véhicules disponibles a été obtenu, le système central résout un sous-problème d'optimisation local, minimisant les trajets à vide en fonction des stratégies de correspondance et donnant la priorité aux trajets partagés si le client accepte le covoiturage. La centralisation du système permet également d'améliorer la planification des trajets en réaffectant les trajets programmés lorsque les véhicules sont vides. Si cette réaffectation permet de réduire les kilomètres parcourus à vide, le système propose de tels ajustements. Bien sûr, cela est possible uniquement dans la mesure où le niveau de batterie actuel et les fenêtres de temps acceptées par les clients le permettent.

Afin de traiter la structure complexe du système de taxis autonomes électriques, nous proposons des méthodes combinées aux trois niveaux de décision. Ces méthodes combinées reposent sur l'apprentissage par renforcement, qui gère les demandes des clients et attribue les véhicules correspondants. L'apprentissage par renforcement utilise également des techniques supplémentaires pour la gestion de la recharge électrique, le covoiturage et la redistribution des véhicules vides.

La figure résume les dépendances entre les différentes méthodes d'apprentissage automatique développées et les solutions algorithmiques évoquées précédemment.

La solution globale : évaluation sur un vaste réseau

Pour évaluer les performances des méthodes proposées, nous avons pris en compte différents réseaux routiers de natures et de tailles variées. Les méthodes d'apprentissage par renforcement basées sur les véhicules et les stations, ainsi que des solutions heuristiques et exactes, ont été comparées sur des réseaux artificiels présentant des structures en anneau et en grille. Les méthodes de redistribution des véhicules vides ont été évaluées à travers des cas d'essai à Saclay en France et à Stockholm en Suède. Nous avons ensuite évalué les performances de l'apprentissage par renforcement par zone sur un cas d'essai dans la ville de Porto, au Portugal. Les résultats obtenus démontrent que les méthodes proposées offrent une meilleure évolutivité et un fonctionnement immédiat pour les systèmes de taxis autonomes électriques. Sur l'ensemble des cas d'essai, les méthodes proposées ont fourni des résultats prometteurs, surpassant les autres méthodes testées ainsi que les données réelles en termes de performances du système de taxi, notamment en ce qui concerne le nombre de passagers satisfaits, avec une flotte de taxis fixe.

Examinons maintenant l'évaluation du réseau de Porto. Pour évaluer les méthodes d'apprentissage, nous avons utilisé les données de demandes sur une période de 364 jours, et l'ensemble d'évaluation sélectionné correspond aux données de demandes d'une journée, un lundi en l'occurrence, avec un total de 3725 voyages effectués par 442 véhicules.

Cependant, les résultats démontrent qu'au lieu d'utiliser une flotte de 442 véhicules, il nous suffit d'avoir seulement 60 véhicules pour servir pratiquement tous les besoins. La figure illustre les résultats de l'évaluation de la taille de la flotte pour différents niveaux d'apprentissage. Dans cette étude, nous avons opté pour des méthodes d'apprentissage par renforcement par zone, d'apprentissage par renforcement centralisé par zone et l'heuristique "regarder avec 2 pas en avant" sous information complète.

Dans chaque simulation, les véhicules sont initialement répartis uniformément dans les différentes zones du réseau. Par conséquent, le nombre de clients servis dans le cadre de l'apprentissage par renforcement basé sur la zone ne présente pas un comportement strictement monotone, en particulier avec un faible nombre de véhicules. Cependant, la centralisation permet d'obtenir un comportement quasi monotone. L'heuristique du problème hors ligne présente une dépendance monotone. La figure montre que l'optimisation hors ligne surpasse les autres méthodes pour un nombre de véhicules compris entre 5 et 57. Ensuite, toutes les trois méthodes sont capables de satisfaire presque tous les clients.

Un des résultats obtenus a permis d'explorer la relation entre le nombre de zones dans le système, le nombre de clients servis et le temps d'exécution du processeur.

Les résultats présentés démontrent l'efficacité de la méthode d'apprentissage par renforcement basée sur les zones, notamment lorsqu'elle est combinée à des méthodes supplémentaires pour l'EVR et le covoiturage. L'application des algorithmes proposés en utilisant des données réelles montre que ces méthodes offrent les meilleurs résultats en termes de nombre de clients satisfaits dans leurs contraintes respectives. De plus, une décomposition zonale bien adaptée permet d'obtenir un équilibre optimal entre le temps d'exécution et le nombre de demandes satisfaites.

Conclusion des recherches théoriques

Dans notre étude, nous avons approfondi la gestion du système de taxis autonomes. Ce système de taxis vise à offrir une qualité de service optimale, mesurée en termes de satisfaction des demandes des clients. Une demande est considérée comme satisfaite lorsque les principaux critères tels que les temps d'attente des passagers, la distance de marche et les préférences de covoiturage sont comblés. Notre objectif principal est de concevoir des stratégies de réservation qui permettent une utilisation dynamique et partagée de la flotte de véhicules par les clients.

Ce problème d'optimisation met en lumière plusieurs objectifs. Le premier est de maximiser le nombre de clients satisfaits avec une flotte de taxis fixe. Le deuxième est d'optimiser la consommation d'énergie en minimisant les trajets à vide. Enfin, le troisième objectif est de réduire la taille de la flotte tout en servant un pourcentage spécifique de clients dans le système.

Nous sommes convaincus que ces résultats ouvrent de nouvelles perspectives de recherche scientifique et pratique.

Le premier aspect à prendre en compte est l'équilibre entre les optimisations réactives et proactives. L'optimisation réactive vise à répondre au maximum de demandes actuelles et à utiliser efficacement l'ensemble de la flotte de véhicules. En revanche, l'optimisation proactive consiste à réserver une partie des véhicules pour répondre à la demande future, qui peut être plus prometteuse (par exemple, en transportant plus de clients dans un seul véhicule ou en effectuant des trajets plus longs et plus coûteux). Trouver cet équilibre nécessite de combiner les meilleures stratégies réactives avec celles qui permettent de réaffecter les véhicules vides ultérieurement.

Le deuxième aspect consiste à fournir une analyse des stratégies de gestion des taxis du point de vue économique. Une perspective économique implique de prendre en compte à la fois les avantages pour les clients et pour le système dans son ensemble. Une piste de recherche intéressante pourrait être l'introduction de tarifs et d'avantages dynamiques pour les trajets, afin d'optimiser à la fois la satisfaction des clients et la rentabilité du système.

Les véhicules intelligents dans la vie réelle

Malheureusement, la situation actuelle des lois ne permet pas une analyse économique des grands systèmes de véhicules autonomes. Toutefois, il est important de souligner que la phase d'expérimentation est en constante évolution.

La mobilité autonome, loin d'être une promesse relevant de la pure science-fiction, est aujourd'hui une réalité bien établie. Pour le Groupe RATP, c'est un enjeu de développement majeur. En tant que quatrième opérateur mondial de transports publics, le Groupe RATP aspire à devenir le partenaire privilégié des villes intelligentes, humaines et durables, ouvertes aux transformations et aux nouvelles idées, attentives aux évolutions nécessaires de leur modèle urbain.

Comment se déroulent ces expérimentations ? Dans la plupart des cas, il s'agit de navettes autonomes qui suivent un itinéraire précis. Un projet intéressant est celui de la Ville de Paris, de la Ville de Vincennes et du groupe RATP. En novembre 2017, l'expérimentation de la navette autonome de Vincennes a débuté entre la station Château de Vincennes (ligne 1) et le Parc Floral (Paris 12ème). À l'heure actuelle, cette navette parcourt 6 km et compte 8 arrêts.

Ces expérimentations se poursuivent même en pleine crise sanitaire actuelle, en prenant toutes les précautions nécessaires. Les voyageurs bénéficient de ce service de mobilité collectif innovant et écologique tous les week-ends, de 14h à 17h30 (pendant le couvre-feu), grâce à trois navettes : deux navettes EZ10 du fournisseur de technologie autonome EasyMile et une navette Autonom® Shuttle du constructeur Navya. Ces navettes françaises, 100% électriques et autonomes, peuvent accueillir jusqu'à 4 voyageurs, en respectant les mesures sanitaires liées à la Covid-19. Dans un contexte normalisé, les navettes pourront transporter jusqu'à 11 voyageurs.

La troisième phase de ce projet comprend également l'expérimentation sur des routes ouvertes, dans un environnement urbain dense, sur le cours Marigny et le cours des Maréchaux à Vincennes.

Depuis son lancement, l'expérimentation des navettes autonomes au bois de Vincennes rencontre un véritable succès avec plus de 40 000 passagers transportés, 11 000 km parcourus à une vitesse moyenne de 13 km/h et aucun incident de sécurité signalé.

De plus, cette expérimentation a permis de mieux définir le rôle crucial des "safety drivers" ou opérateurs de sécurité. Le groupe RATP a formé une vingtaine de ces professionnels lors de l'expérimentation au bois de Vincennes, leur offrant ainsi une expertise approfondie dans le domaine des véhicules autonomes.

Pourquoi ces safety drivers sont-ils indispensables ? Ces agents de la RATP sont responsables de reprendre manuellement le contrôle du véhicule en cas de problème. Ils restent vigilants, prêts à intervenir à tout moment, avec une console de pilotage imposante en bandoulière.

Quels sont les autres projets déjà en cours ou planifiés à court terme ?

Le 2 février 2021, le groupe RATP, Arval France et la Mairie de Rueil-Malmaison ont inauguré le service de navette autonome sur route ouverte reliant la gare de Rueil-Malmaison au siège d'Arval France. La navette autonome EVAA (EZ10 Gen 3) avait été dévoilée en janvier 2020. Les collaborateurs d'Arval ont ainsi eu l'occasion de découvrir cette navette lors d'un parcours test. Par la suite, le groupe RATP a effectué une expérimentation à blanc pendant plusieurs mois. Aujourd'hui, deux navettes circulent sur route ouverte du lundi au vendredi, de 8h à 20h (de 7h à 18h pendant le couvre-feu). Exploitées par la RATP, elles assurent la liaison entre la gare de Rueil-Malmaison et le siège d'Arval, exclusivement réservée aux collaborateurs de cette entreprise. Dans le contexte actuel de pandémie, la capacité d'accueil de ces navettes est limitée à 4 personnes au lieu des 11 initialement prévues.

Depuis septembre 2020, RATP Dev, une filiale du groupe RATP, mène une expérience passionnante en collaboration avec ArchParc, un parc d'activités régional situé au cœur de la Haute-Savoie dans le "genevois français". Cette expérimentation vise à tester un service de navette autonome à la demande. Opérée par Alpbus, une filiale de RATP Dev, en partenariat avec la société suisse Bestmile, cette initiative fait partie du projet echosmile financé par l'Union Européenne et piloté par ArchParc. Couvrant 7 arrêts dans l'enceinte du technopôle, tels que Vivacy, Meggitt, ABC, Esplanade, Botanic, Communauté de Commune et Athéna, ce projet de pointe dans le domaine de la mobilité autonome utilise la dernière génération de navette, le EZ10 Gen 3, développé par la société toulousaine EasyMile. La première phase de l'expérimentation, qui s'est déroulée de septembre à décembre 2020, a été un véritable succès : les navettes ont parcouru 1000 km sans aucun incident de sécurité routière, consommant seulement une demi-batterie par jour.

L'été dernier, le groupe RATP a également lancé une première phase d'expérimentation d'un service de mobilité terrestre en partenariat avec le projet SAM soutenu par l'ADEME. Ce service a pour objectif de relier les gares de Gare de Lyon, Gare d'Austerlitz et Gare de Bercy par des véhicules autonomes afin de tester la desserte fine des quartiers. À terme, deux navettes OLLI du constructeur LocalMotors circuleront entre la Gare d'Austerlitz et la Gare de Lyon, en passant par le Ministère de l'Économie et des Finances, la Gare de Bercy, le Quai de la Gare et la Cité de la Mode. Cette expérimentation permet au groupe RATP de se concentrer sur les enjeux de connectivité en ville et entre les gares.

L'été 2021 a également marqué le début de la troisième expérience sélectionnée par l'ADEME (Agence De l'Environnement et de la Maîtrise de l'Énergie) : la navette autonome de Saint-Rémy-Lès-Chevreuse. Cette expérience vise à étudier la mise en service de navettes autonomes et l'offre de services du dernier kilomètre en zone péri-urbaine et rurale. Quatre itinéraires seront progressivement testés, partant de la gare de Saint-Rémy-Lès-Chevreuse et se dirigeant vers les quartiers avoisinants. Dans un premier temps, le Groupe Milla, un acteur français expérimenté dans le domaine de la mobilité, mettra à disposition du Groupe RATP deux navettes Milla Pods, pouvant accueillir 6 personnes, afin de relier un parking du quartier Beauplan à la gare de Saint-Rémy-lès-Chevreuse, soit un parcours de 2 km.

En réalité, le seul reproche que l'on pourrait formuler à l'égard de ces navettes concerne leur vitesse, qui est plutôt lente : entre 13 et 18 km/h. Cela est fait dans un souci de sécurité renforcée pour les personnes participant à ces expérimentations. Néanmoins, les vitesses augmentent au fur et à mesure des expérimentations, sans ajouter de nouveaux risques pour les usagers et leur entourage.

Science-fiction devient une réalité

Les véhicules autonomes offrent une contribution précieuse en complétant les options de transport déjà existantes, en apaisant les centres-villes, en réduisant l'impact des gaz à effet de serre, en réallouant les espaces de stationnement et en diminuant la pollution sonore.

Les chercheurs, les praticiens et les politiciens du monde entier sont captivés par cette nouvelle réalité. Pour rendre cette réalité encore plus tangible, il est indispensable de redoubler d'efforts de tous les côtés.

Les enjeux sont considérables. Il est primordial de comprendre comment ces nouveaux véhicules s'intégreront dans le code de la route. Comment faire de ce nouveau mode de transport une solution rentable, utile, sûre et indispensable ? Mais surtout, en quoi ce nouveau moyen de transport va-t-il transformer la vie de notre génération et des générations à venir ?

En tant que théoriciens et praticiens de la mobilité intelligente, nous vous promettons de faire tout notre possible pour relever ces défis.

 ;)

© Tatiana BABICHEVA