Recherche de sillons de dernière minute (STDCM)
OSRD permet d’ajouter un nouveau train dans une grille horaire déjà établie,
sans générer aucun conflit avec les autres trains. L’application directe de cette fonctionnalité
est appelée la recherche de sillon de dernière minute.
L’acronyme STDCM (Short Term Digital Capacity Management) est utilisé
pour parler du concept en général.
1 - Contexte métier
Quelques définitions :
La capacité
La capacité, dans ce contexte, correspond à la possibilité de
réserver des éléments d’infrastructure pour permettre le passage
d’un train.
La capacité s’exprime en fonction de l’espace et du temps :
la réservation d’un élément peut bloquer une zone précise
qui devient inaccessible aux autres trains, et cette réservation
se fait sur un intervalle de temps.
On peut la représenter
sur un graphique, avec le temps en abscisse et la distance parcourue
sur un chemin en ordonnée.
Exemple d’un graphique espace-temps montrant le passage d’un train.
Les couleurs représentent ici les aspects des signaux, mais
montrent également une consommation de la capacité :
quand ces blocs se superposent pour deux trains, ils sont en conflit.
Deux trains d’une grille horaire sont en conflit
quand ils réservent en même temps un même objet, dans des
configurations incompatibles.
Exemple d’un graphique espace-temps avec conflit : le second train
est plus rapide que le premier, ils sont en conflit sur la fin du trajet,
quand les rectangles se superposent.
En essayant de simuler cette grille horaire, le second train serait
ralentis par des signaux indiquant de ralentir, provoqués par la
présence du premier train.
La consommation de capacité est souvent représentée sous la forme de
rectangles car, dans les systèmes de signalisation les plus simples,
il s’agit de réservations d’une zone fixe dans l’espace pendant un intervalle de temps donné.
Les sillons horaires
Un sillon correspond à une réservation de capacité pour le
passage d’un train. Il est fixé dans l’espace et dans le temps :
le temps de départ et le chemin emprunté sont connus.
Sur les graphiques espace-temps de cette page, un sillon correspond
à l’ensemble des blocs pour un train.
Dans un fonctionnement habituel, le gestionnaire d’infrastructure
(ex : SNCF Réseau) propose des sillons à la vente pour les entreprises
ferroviaires (ex : SNCF Voyageurs).
À une date donnée avant le jour de
circulation prévu, tous les sillons sont attribués. Mais il peut rester
assez de capacité pour faire rouler plus de trains. Il est
possible de placer des trains entre les sillons déjà établis,
quand ces derniers sont suffisamment espacés ou n’ont pas
trouvé d’acheteurs.
La capacité restante après l’attribution des sillons est appelée
la capacité résiduelle. Le problème traité ici est la recherche
de sillons dans celle-ci.
2 - Module de recherche de sillons
Ce module gère la recherche de solution.
Les entrées et sorties sont fortement simplifiées et abstraites
pour simplifier le problème au maximum et permettre des tests efficaces.
Pour décrire son fonctionnement en quelques phrases :
l’espace de solutions est représenté sous forme d’un graphe qui encode le temps,
la position et la vitesse. Une recherche de chemin est ensuite effectuée
dans ce graphe pour trouver une solution. Le graphe est calculé
au fil de son exploration.
Ce graphe peut d’une certaine manière être vu comme une forme
d’arbre de décision, si différents chemins peuvent mener au même noeud.
2.1 - Parcours de l'infrastructure
La première chose à définir est comment un train se déplace sur l’infrastructure,
sans prendre en compte les conflits pour l’instant.
On a besoin d’une manière de définir et d’énumérer les différents chemins
possibles et de parcourir l’infrastructure, avec plusieurs contraintes :
- Le chemin doit être compatible avec le matériel roulant donné
(électrification, gabarit, systèmes de signalisation)
- À n’importe quel point, on doit être en mesure d’accéder aux propriétés
du chemin depuis le point de départ jusqu’au point considéré.
Cela inclus les routes et les cantons.
- Dans certains cas, on doit savoir où le train ira après
le point actuellement évalué (pour une détection de conflits correcte).
Pour répondre à ce besoin, une classe InfraExplorer
a été implémentée.
Elle utilise les cantons (section de signal en signal) comme subdivision
principale.
Elle est composée de 3 sections : le canton courant, les prédécesseurs,
et les cantons suivants.
Dans cet exemple, les flèches vertes sont les cantons précédents.
Ce qui se produit dessus est considéré comme immuable.
La flèche rouge est le canton actuellement exploré.
C’est à cet endroit que les simulations du train et de la
signalisation sont effectuées, et que les conflits
sont évités.
Les flèches bleues sont les cantons suivants. Cette section
n’est pas encore simulée, elle existe seulement pour savoir
où le train ira ensuite. Dans cet exemple, elle indique
que le signal en bas à droite peut être ignoré, seul
le chemin du haut sera utilisé.
Le chemin du bas sera évalué dans une autre instance de
InfraExplorer
.
Plus de détails sur la classe et son interface sont
présents sur la version anglaise de la page.
2.2 - Détection de conflits
Maintenant qu’on sait quels chemins peuvent être utilisés,
on doit déterminer à quel moment ces chemins sont libres.
La documentation (en anglais seulement)
de la détection de conflits explique comment elle est réalisée
en interne. Pour résumer, un train est en conflit avec un autre
quand il observe un signal lui indiquant de ralentir.
Dans notre cas, une solution où cette situation se produit
est considérée comme invalide, le train doit arriver
au signal donné plus tard (ou plus tôt) quand le signal
n’est plus contraignant.
Cependant, la détection de conflit doit être réalisée de
manière incrémentale, ce qui veut dire que :
- Quand une simulation est effectuée jusqu’à t=x, tous les conflits
qui arrivent avant t=x doivent être connus, même s’ils sont
indirectement provoqués par un signal vu à t > x plus loin sur le chemin.
- Les conflits et utilisations de ressources doivent être identifiés
dès qu’ils se produisent, même si le temps de fin d’utilisation n’est
pas encore défini.
Pour que ce soit possible, on doit être en mesure de savoir où
le train ira après la section actuellement simulée (cf
exploration de l’infrastructure
)
Pour gérer ce cas, le module de détection de conflit
peut renvoyer une erreur quand il est nécessaire d’avoir
plus d’information sur la suite du chemin. Quand ce cas
se produit, les objets InfraExplorer
sont clonés
pour étendre les chemins.
2.3 - Représentation de l'espace de solutions
Principe général
Le problème reste une recherche de graphe. En représentant
l’espace de solution sous forme de graphe, il est possible de réutiliser
nos outils déjà existants de recherche de chemin.
Le graphe produit de la position, du temps, et de la vitesse est utilisé.
Autrement dit, chaque élément du graphe contient (entre autres) ces
3 variables.
Chaque arête du graphe est calculée avec un
calcul de marche
pour connaître l’évolution de la vitesse et de la position dans le temps.
Représentation visuelle
Le graphe de départ représente l’infrastructure physique
Il est ensuite “dupliqué” à des temps différents
Puis des nœuds sont reliés de manière à refléter le temps de parcours
Précisions
- Le graphe est construit au fil de l’exploration.
- Une discrétisation est faite au niveau du temps, uniquement pour
évaluer ce qui a déjà été visité. Si le même emplacement est visité une
seconde fois, il faut une certaine différence de temps pour estimer
qu’il n’est pas déjà visité.
- Toutes les arêtes sont réalisées avec des calculs de marche
- La vitesse n’est pas discrétisée ni utilisée pour estimer quel
emplacement est déjà visité, mais elle fait partie des calculs.
- Par défaut, tous les calculs sont faits en allant à la vitesse maximale.
Les ralentissements sont ajoutés seulement quand ils sont nécessaires.
Exemple
Par exemple, avec l’infrastructure suivante en se basant sur
le graphe des voies :
Explorer le graphe des sillons possibles peut donner ce
type de résultat :
2.4 - Discontinuités et retours en arrière
Le problème des discontinuités
Au moment d’explorer une arête du graphe, on effectue un calcul de
marche pour connaître l’évolution de la vitesse.
Mais il n’est pas possible de voir plus loin que l’arête en question,
ce qui est gênant pour calculer les courbes de freinages qui peuvent
nécessiter de commencer à freiner plusieurs kilomètres avant l’arrivée.
Cet exemple illustre le problème : par défaut
la première arête est explorée en allant à la vitesse maximale.
C’est seulement en explorant la seconde arête que la destination devient visible,
sans que la distance restante soit suffisante pour s’arrêter.
La solution : revenir en arrière
Pour régler ce problème, lorsqu’une arête est générée avec une discontinuité
dans les courbes de vitesse, l’algorithme revient sur les arêtes précédentes
pour en créer des nouvelles qui incluent les décélérations.
Pour donner un exemple simplifié, sur un chemin de 4 routes
où le train peut accélérer ou décélérer de 10km/h par route :
Pour que le train s’arrête à la fin de la route 4, il doit être au plus à 10km/h
à la fin de la route 3. Une nouvelle arête est alors créée sur la route
3 qui finit à 10km/h. Une décélération est ensuite calculée à rebours de la fin de la route
vers le début, jusqu’à retrouver la courbe d’origine (ou le début
de l’arrête).
Dans cet exemple, la discontinuité a seulement été déplacée vers la
transition entre les routes 2 et 3. Le procédé est ensuite réitéré
sur la route 2, ce qui donne le résultat suivant :
Les anciennes arêtes sont toujours présentes dans le graphe, elles
peuvent mener à d’autres solutions.
2.5 - Contourner les conflits
En explorant le graphe, il arrive souvent de tomber sur des situations
qui mèneraient à des conflits. Il faut être en mesure de rajouter du délai
pour les éviter.
Décalage du temps de départ
Dans les paramètres de l’algorithme, le temps de départ est donné
sous la forme d’une fenêtre : un temps de départ au plus tôt et au plus tard.
Tant que c’est possible, il est toujours préférable de décaler le temps
de départ pour éviter les conflits.
Par exemple : un train doit partir entre 10:00 et 11:00. En partant
à 10:00, cela provoque un conflit, le train doit entrer en gare
d’arrivée 15 minutes plus tard. Il suffit de faire partir le train à
10:15 pour régler le problème.
Dans OSRD, cette fonctionnalité est gérée en gardant une trace,
à chaque arête, du décalage maximal du temps de départ qui pourra
être ajouté sur la suite du parcours. Tant que cette valeur est suffisante,
tous les conflits sont évités par ce moyen.
Le décalage du temps de départ est une valeur stockée sur chaque arête
et additionnée à la fin de la recherche de chemin.
Par exemple :
- un train doit partir entre 10:00 et 11:00. La recherche
commence avec un délai maximal de 1:00.
- Après quelques arêtes, une non-disponibilité est constatée
20 minutes après notre passage. La valeur passe donc à
20 minutes pour la suite du parcours.
- Le temps de départ est ensuite décalé de 5 minutes pour contourner
un conflit, modifiant le décalage maximal à 15 minutes.
- Ce procédé continue jusqu’à arriver à la fin du trajet, ou
jusqu’au point où il faut ajouter plus de délai.
Marges de construction
Quand la valeur de décalage maximal du temps de départ tombe à 0,
il faut rajouter du délai entre deux points du parcours du train.
Le principe est le même que pour régler les discontinuités de vitesse :
le graphe est parcouru en arrière pour créer de nouvelles arêtes.
La marge de construction
est une fonctionnalité du calcul de marche
permettant d’ajouter un délai donné entre deux points du parcours.
Post-processing
Les marges de constructions étaient calculées pendant
l’exploration du graph, mais ce procédé était trop
couteux en temps de calcul. On effectuait des dichotomies
sur des simulations qui pouvaient s’étendre sur des
portions importantes du chemin.
On a seulement besoin de savoir si la marge de construction
peut être réalisée sans provoquer de conflit.
Des heuristiques peuvent être utilisées ici tant qu’on est
plus restrictif que permissif : une marge impossible
doit être identifiée comme telle, mais manquer une solution
avec une marge extrêmement serrée n’est pas une mauvaise chose.
Mais avec ce changement, une fois qu’une solution est trouvée,
il ne suffit plus de concaténer les résultats de simulation
pour obtenir la simulation finale. On doit réaliser une
simulation complète avec les vraies marges de construction
qui évitent tout conflit. Cette étape se rejoint avec celle
décrite pour les
marges de régularité,
qui est maintenant réalisée même sans marge de régularité
spécifiée.
2.6 - Marge de régularité
Une des fonctionnalités qui doit être supportée par STDCM est la
marge de régularité.
L’utilisateur doit pouvoir indiquer une valeur
de marge, exprimée en fonction de la distance ou du temps de parcours,
et cette marge doit être ajoutée au trajet.
Par exemple : l’utilisateur peut indiquer une marge de 5 minutes au
100km. Sur un trajet de 42km, un trajet de 10 minutes au plus rapide
doit maintenant durer 12 minutes et 6 secondes.
Le problème se situe au niveau de la détection de conflits.
En effet, ralentir le train décale l’ensemble du sillon dans le temps
et augmente la capacité consommée.
La marge doit donc être prise en compte pendant l’exploration
pour détecter correctement les conflits.
Pour plus de difficulté, la marge doit suivre le modèle
MARECO.
La marge n’est pas répartie uniformément sur le trajet, mais selon
un calcul qui nécessite de connaître l’ensemble du trajet.
Pendant l’exploration
La principale implication de la marge de régularité est pendant
l’exploration du graphe, quand on identifie les conflits.
Les temps et les vitesses doivent être baissés linéairement
pour prendre en compte les conflits au bon moment.
La simulation au plus rapide doit tout de même être calculée
car elle peut définir le temp supplémentaire.
Ce procédé n’est pas exact car il ignore la manière dont
la marge est appliquée (en particulier pour MARECO).
Mais à cette étape les temps exacts ne sont pas nécessaires,
il est seulement nécessaire de savoir si une solution existe
à ce temps approximatif.
Ce procédé inexact peut sembler être un problème, mais en
pratique (pour la SNCF) les marges de régularités ont en
fait une tolérance entre deux points arbitraires
du chemin. Par exemple pour une marge indiquée à 5 minutes
par 100km, une solution avec la marge entre 3 et 7 minutes
entre deux PR serait acceptable. Cette tolérance ne sera
pas encodée explicitement, mais elle
permet de faire des approximations de quelques
secondes pendant la recherche.
Post-processing
Une fois que le chemin est trouvé, il est nécessaire
de faire une simulation finale pour appliquer correctement
les marges. Le procédé est le suivant :
- Pour certains points du chemin, le temps est fixé.
C’est un paramètre d’entrée de la simulation qui appelle
le module de marge. À l’initialisation, le temps est fixé
à chaque point d’arrêt.
- Une simulation est réalisée. En cas de conflit, on
s’intéresse au premier
- Un point est fixé à la position de ce conflit.
Le temps de référence est celui considéré pendant l’exploration.
- Ce procédé est répété itérativement jusqu’à une absence de conflit
2.7 - Détails d'implémentation
Cette page précise certains détails d’implémentation.
Sa lecture n’est pas nécessaire pour comprendre les principes
généraux, mais peut aider avant de se plonger dans le code.
STDCMEdgeBuilder
Cette classe est utilisée pour simplifier la création d’instances de STDCMEdge
,
les arêtes du graphe. Celles-ci contiennent de nombreux attributs,
la plupart pouvant être déterminés en fonction du contexte (comme
le nœud précédent). La classe STDCMEdgeBuilder
permet de rendre
certains attributs optionnels et en calcule d’autres.
Une fois instancié et paramétré, un EdgeBuilder
a deux méthodes :
Collection<STDCMEdge> makeAllEdges()
permet de créer toutes
les arêtes possibles dans le contexte donné pour une route donnée.
S’il y a plusieurs “ouvertures” entre des blocks d’occupation,
une arête est créée par ouverture. Tous les conflits, leurs
évitements et les attributs associés sont déterminés ici.
STDCMEdge findEdgeSameNextOccupancy(double timeNextOccupancy)
:
Cette méthode permet d’obtenir l’arête passant par une certaine
“ouverture” (quand elle existe), identifiée ici par le temps
de la prochaine occupation sur la route. Elle est utilisée à chaque
fois qu’une arête doit être re-créée dans un contexte différent,
comme pour appliquer une marge ou corriger une discontinuité.
Elle appelle la méthode précédente.
Recherche de chemin
Evaluation des distances
La fonction utilisée pour déterminer la distance (au sens
de la recherche de chemin) détermine quel chemin sera privilégié.
Le chemin obtenu sera toujours le plus court en fonction du critère
donné.
Ici, deux paramètres sont utilisés : le temps de parcours total
et l’heure de départ. Le second a un poids très faible par rapport
au premier, pour sélectionner en priorité le chemin le plus rapide.
Les détails du calcul sont indiqués dans les commentaires des
méthodes concernées.
Heuristiques
L’algorithme de recherche de chemin dans le graphe est un A*,
avec une heuristique basée sur les coordonnées géographiques.
Cependant, la géométrie des infrastructures générées sont arbitraires,
elle ne correspond pas aux distances indiquées sur les voies.
Il est donc possible que, sur ces infrastructures, les chemins
obtenus ne soient pas les plus courts.
Il est en théorie possible d’utiliser cette heuristique pour
déterminer si le chemin en cours d’exploration pourra mener à une
solution dont le temps de parcours ne dépasse pas le maximum.
Mais pour la même raison, ajouter ce critère rend STDCM
inutilisable sur les infrastructures générées.
Plus de détails dans
cette issue.