Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD AND DEVICE FOR CONTROLLING THE CHANGE IN OPERATING SYSTEM IN SERVICE NODES OF A HIGH-PERFORMANCE COMPUTER
Document Type and Number:
WIPO Patent Application WO/2015/145035
Kind Code:
A1
Abstract:
A method controls the change in operating system in selected service nodes (NH-NNM(N)) of a high-performance computer (CHP). Said method includes: - a step (i) of defining, for the selected service nodes, a reduced version of a new operating system to be installed, a boot kernel, a so-called "reference" tree node software image suitable for the new operating system and comprising a definition of an instantiation to be established in the service nodes, and an activation module (ML) capable of locally installing the reference image in each service node; - a step (ii) wherein the defined reference image, boot kernel, activation module, and reduced operating system version are transferred into the service nodes; and - a step (iii) wherein the transferred activation module (ML) is used in each service node in order to locally install the transferred reference image.

Inventors:
GEORGES JULIEN (FR)
ICETA THIERRY (FR)
FLACARD EMMANUEL (FR)
Application Number:
PCT/FR2015/050691
Publication Date:
October 01, 2015
Filing Date:
March 20, 2015
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
BULL SAS (FR)
International Classes:
G06F9/445
Other References:
CRISTIAN MAGHERUSAN-STANCIU ET AL: "Grid Site Installation, Management and Monitoring Application", PARALLEL AND DISTRIBUTED COMPUTING (ISPDC), 2011 10TH INTERNATIONAL SYMPOSIUM ON, IEEE, 6 July 2011 (2011-07-06), pages 25 - 32, XP032079122, ISBN: 978-1-4577-1536-5, DOI: 10.1109/ISPDC.2011.14
Attorney, Agent or Firm:
CAMUS, Olivier et al. (FR)
Download PDF:
Claims:
REVENDICATIONS

1 . Procédé de contrôle du changement de système d'exploitation dans des nœuds de service (Ny) comportant chacun au moins un disque de stockage (DS) et une mémoire volatile (MV) et faisant partie d'un calculateur haute performance (CHP), caractérisé en ce qu'il comprend une étape (i) dans laquelle on définit pour des nœuds de service (Ny) choisis une version réduite (VR) d'un nouveau système d'exploitation à installer, un noyau d'amorçage (NA), une image logicielle de nœud de type arbre (IR), dite de référence, adaptée audit nouveau système d'exploitation et comportant une définition d'une instanciation à instaurer dans lesdits nœuds de service (Ny) choisis, et un module de lancement (ML) propre à installer ladite image de référence localement dans chaque nœud de service (Ny) choisi, une étape (ii) dans laquelle on transfère dans lesdits nœuds de service (Ny) choisis ladite image de référence (IR), ledit noyau d'amorçage (NA), ledit module de lancement (ML) et ladite version réduite (VR) définis, et une étape (iii) dans laquelle ledit noyau d'amorçage (NA) transféré dans chaque nœud de service (Ny) choisi lance ledit module de lancement (ML) transféré dans ce dernier (Ny) pour installer localement ladite image de référence (IR) transférée en utilisant ladite version réduite (VR) transférée.

2. Procédé selon la revendication 1 , caractérisé en ce que dans ladite étape (ii) on transfère ensemble dans lesdits nœuds de service (Ny) choisis ladite image de référence (IR), ledit noyau d'amorçage (NA), ledit module de lancement (ML) et ladite version réduite (VR) définis, et dans ladite étape (iii) ledit noyau d'amorçage (NA) transféré dans chacun desdits nœuds de service (Ny) choisis lance ledit module de lancement (ML) transféré avec lui.

3. Procédé selon la revendication 1 , caractérisé en ce que dans ladite étape (ii) on commence par transférer dans lesdits nœuds de service (Ny) choisis ladite image de référence (I R), puis on transmet à chacun desdits nœuds de service (Ny) choisis un message de déclenchement lui ordonnant de télécharger d'un nœud de gestion (NG) dudit calculateur haute performance (CHP) lesdits noyau d'amorçage (NA), version réduite (VR) et module de lancement (ML) définis de sorte que ce dernier (ML) réalise localement automatiquement ladite installation locale après avoir été lancé par ledit noyau d'amorçage (NA).

4. Procédé selon l'une des revendications 2 et 3, caractérisé en ce que dans ladite étape (iii) chaque module de lancement (ML) réserve dans ladite mémoire volatile (MV) de son nœud de service (Ny) choisi une zone de stockage propre à stocker ladite image de référence (IR), puis charge ladite image de référence transférée dans cette zone de stockage, puis déclenche une suite de commandes propre à instancier son nœud de service conformément à la définition d'instanciation contenue dans l'image de référence transférée, puis déclenche un réamorçage de son nœud de service (Ny).

5. Procédé selon la revendication 4, caractérisé en ce que dans ladite étape (iii), avant de déclencher ledit réamorçage, chaque module de lancement (ML) contrôle le stockage de ladite image de référence (IR) dans ledit disque de stockage (DS) de son nœud de service (Ny).

6. Produit programme d'ordinateur comprenant un jeu d'instructions qui, lorsqu'il est exécuté par des moyens de traitement, est propre à mettre en œuvre le procédé selon l'une des revendications précédentes pour contrôler un changement de système d'exploitation dans des nœuds de service (Ny) comportant chacun au moins un disque de stockage (DS) et une mémoire volatile (MV) et faisant partie d'un calculateur haute performance (CHP).

7. Dispositif (D) de contrôle du changement d'un système d'exploitation dans des nœuds de service (Ny) comportant chacun au moins un disque de stockage (DS) et une mémoire volatile (MV) et faisant partie d'un calculateur haute performance (CHP), caractérisé en ce qu'il comprend des moyens de contrôle (MC) agencés pour contrôler le transfert dans des nœuds de service (Ny) choisis d'une version réduite (VR) d'un nouveau système d'exploitation à installer, d'un noyau d'amorçage (NA), d'une image logicielle de nœud de type arbre (IR), dite de référence, adaptée audit nouveau système d'exploitation et comportant une définition d'une instanciation à instaurer dans lesdits nœuds de service (Ny) choisis, et d'un module de lancement (ML) propre, après avoir été lancé par ledit noyau d'amorçage (NA) transféré, à installer localement ladite image de référence (IR) en utilisant ladite version réduite (VR) transférée.

8. Calculateur haute performance (CHP) comprenant des nœuds de service (Nij) comportant chacun au moins un disque de stockage (DS) et une mémoire volatile (MV), caractérisé en ce qu'il comprend en outre un dispositif de contrôle (D) selon la revendication 7.

Description:
PROCÉDÉ ET DISPOSITIF DE CONTRÔLE DU CHANGEMENT DE SYSTÈME D'EXPLOITATION DANS DES NŒUDS DE SERVICE D'UN CALCULATEUR HAUTE PERFORMANCE

L'invention concerne les calculateurs de type dit « haute performance » (ou supercalculateurs), et plus précisément le contrôle du changement de système d'exploitation dans des nœuds de service que comprennent de tels calculateurs haute performance.

Comme le sait l'homme de l'art, les nœuds de service des calculateurs haute performance sont instanciés de manière à fonctionner conformément à une image logicielle de nœud de type arbre adaptée à un système d'exploitation (ou « operating System »).

On entend ici par « instanciation » un agencement logiciel (ou « software ») permettant à un nœud de service de recevoir et d'utiliser un système d'exploitation. Une telle instanciation est définie par une suite de commandes d'instanciation destinée à préparer un nœud, et notamment à provoquer un partitionnement suivi d'un formatage dans un disque de stockage d'un nœud de service.

Par ailleurs, on entend ici par « image logicielle de nœud de type arbre » (ou image arbre basée référence) une photographie de l'agencement logiciel d'un nœud de référence en présence d'un système d'exploitation. Par exemple, dans le cas d'un système d'exploitation de type linux le contenu de cette image correspond à une arborescence hiérarchisée de fichiers linux.

Parfois, l'administrateur d'un calculateur haute performance veut changer le contexte de calcul d'un ensemble de nœuds de service qui sont opérationnels avec une « ancienne » image logicielle de nœud de type arbre adaptée à un « ancien » système d'exploitation. Dans ce cas, il doit mettre en place dans ces nœuds de service une nouvelle image logicielle de nœud de type arbre adaptée à un nouveau système d'exploitation correspondant au nouveau contexte de calcul. Pour ce faire, il peut, par exemple, utiliser un outil de déploiement tel que Ksis® (commercialisé par la société BULL SAS).

Il est rappelé que Ksis® est notamment agencé pour prendre une photographie d'une image adaptée à un système d'exploitation de type linux et de déployer cette photographie sur un très grand nombre de nœuds de service.

Il existe plusieurs méthodes pour réaliser un tel déploiement. L'une d'entre elles consiste :

- à réamorcer (ou « reboot ») des nœuds de service choisis (par exemple via des requêtes PXE (ou GPXE) et DHCP),

- à mettre en place dans chacun des nœuds de service choisis un mini système d'exploitation dédié (ou « embeded »),

- à enclencher et préparer (par partitionnement et formatage) chaque disque de stockage de chacun des nœuds de service choisis,

- à déployer la nouvelle image logicielle de nœud de type arbre selon un procédé en chaîne sur tous les nœuds de service choisis,

- à gérer la chaîne en cas de perte de nœuds de service choisis et/ou de difficulté survenue sur le réseau de communication utilisé,

- à mettre en place une configuration de base permettant de rendre accessibles tous les nœuds de service choisis,

- à faire remonter dans un nœud de gestion les erreurs détectées, les analyses effectuées et le compte-rendu du déploiement.

On notera que toutes les opérations qui précèdent doivent être effectuées de façon synchrone sur tous les nœuds de service choisis et ne peuvent pas être découplées, ce qui ne facilite pas leur surveillance. Par ailleurs, l'étape pendant laquelle on prépare les disques de stockage des nœuds de service choisis arrive très tôt, et donc si l'une des opérations suivantes ne se déroule pas correctement dans un nœud de service choisi (par exemple du fait d'un problème survenu dans une mémoire, un disque de stockage ou du matériel (« hardware »)), l'ancienne organisation de ce nœud de service est perdue, ce qui le rend non opérationnel. L'invention a donc pour but d'améliorer la situation, et notamment de permettre à l'administrateur d'un calculateur haute performance de contrôler de façon plus confortable les opérations de déploiement d'une nouvelle image logicielle de nœud de type arbre.

Elle propose notamment à cet effet un procédé de contrôle, destiné à permettre le contrôle du changement de système d'exploitation dans des nœuds de service comportant chacun au moins un disque de stockage et une mémoire volatile et faisant partie d'un calculateur haute performance, et comprenant :

- une étape (i) dans laquelle on définit pour des nœuds de service choisis une version réduite d'un nouveau système d'exploitation à installer, un noyau d'amorçage, une image logicielle de nœud de type arbre, dite de référence, adaptée à ce nouveau système d'exploitation et comportant une définition d'une instanciation à instaurer dans ces nœuds de service choisis, et un module de lancement propre à installer cette image de référence localement dans chaque nœud de service choisi,

- une étape (ii) dans laquelle on transfère dans les nœuds de service choisis l'image de référence, le noyau d'amorçage, le module de lancement et la version réduite définis, et

- une étape (iii) dans laquelle le noyau d'amorçage transféré dans chaque nœud de service choisi lance le module de lancement transféré dans ce dernier pour installer localement l'image de référence transférée en utilisant la version réduite transférée.

On peut ainsi réaliser quand on le désire un déploiement de type « autonome » grâce à la prise en compte du fait que les nœuds de service du calculateur haute performance sont accessibles.

Le procédé selon l'invention peut comporter d'autres caractéristiques qui peuvent être prises séparément ou en combinaison, et notamment :

- dans un premier mode de réalisation, dans l'étape (ii) on peut transférer ensemble dans les nœuds de service choisis l'image de référence, le noyau d'amorçage, le module de lancement et la version réduite définis, et dans l'étape (iii) le noyau d'amorçage transféré dans chacun des nœuds de service choisis lance le module de lancement transféré avec lui ; - dans un second mode de réalisation, dans l'étape (ii) on peut commencer par transférer dans les nœuds de service choisis l'image de référence, puis on peut transmettre à chacun des nœuds de service choisis un message de déclenchement lui ordonnant de télécharger d'un nœud de gestion du calculateur haute performance le noyau d'amorçage, la version réduite et le module de lancement définis de sorte que ce dernier réalise localement automatiquement l'installation locale après avoir été lancé par le noyau d'amorçage ;

- dans l'étape (iii) chaque module de lancement peut réserver dans la mémoire volatile de son nœud de service choisi une zone de stockage qui est propre à stocker l'image de référence transférée, puis peut charger l'image de référence transférée dans cette zone de stockage, puis peut déclencher une suite de commandes propre à instancier son nœud de service conformément à la définition d'instanciation contenue dans l'image de référence transférée, puis peut déclencher un réamorçage (ou « rebooting ») de son nœud de service ;

dans l'étape (iii), avant de déclencher le réamorçage, chaque module de lancement peut contrôler le stockage de l'image de référence dans le disque de stockage de son nœud de service.

L'invention propose également un produit programme d'ordinateur comprenant un jeu d'instructions qui, lorsqu'il est exécuté par des moyens de traitement, est propre à mettre en œuvre un procédé de contrôle du type de celui présenté ci-avant pour contrôler un changement de système d'exploitation dans des nœuds de service comportant chacun au moins un disque de stockage et une mémoire volatile et faisant partie d'un calculateur haute performance.

L'invention propose également un dispositif, destiné à contrôler le changement de système d'exploitation dans des nœuds de service comportant chacun au moins un disque de stockage et une mémoire volatile et faisant partie d'un calculateur haute performance, et comprenant des moyens de contrôle agencés pour contrôler le transfert dans des nœuds de service choisis d'une version réduite d'un nouveau système d'exploitation à installer, d'un noyau d'amorçage, d'une image logicielle de nœud de type arbre, dite de référence, adaptée à ce nouveau système d'exploitation et comportant une définition d'une instanciation à instaurer dans les nœuds de service choisis, et d'un module de lancement propre, après avoir été lancé par le noyau d'amorçage transféré, à installer localement l'image de référence transférée en utilisant la version réduite transférée.

L'invention propose également un calculateur haute performance comprenant des nœuds de service, comportant chacun au moins un disque de stockage et une mémoire volatile, et un dispositif de contrôle du type de celui présenté ci-avant.

D'autres caractéristiques et avantages de l'invention apparaîtront à l'examen de la description détaillée ci-après, et des dessins annexés, sur lesquels :

- la figure 1 illustre de façon schématique et fonctionnelle un calculateur haute performance équipé d'un exemple de réalisation d'un dispositif de contrôle selon l'invention, et

- la figure 2 illustre un exemple d'algorithme mettant en œuvre un procédé de contrôle selon l'invention.

L'invention a notamment pour objet de proposer un procédé de contrôle, et un dispositif de contrôle D associé, destinés à permettre le contrôle du changement de système d'exploitation dans des nœuds de service Nij d'un calculateur haute performance CHP comprenant également un nœud de gestion NG.

On a schématiquement illustré sur la figure 1 un exemple non limitatif de calculateur haute performance CHP. Dans cet exemple, les nœuds de service N du calculateur CHP sont regroupés dans N groupes (dits à haute disponibilité (ou HA)) Gi (avec i = 1 à N). Chaque groupe (à haute disponibilité) Gi comporte M(i) nœuds (de service) Ny (avec j = 1 à M(i)). Par exemple, N est égal à 10 et M(i) est égal à 500 quel que soit le groupe Gi considéré (et donc quelle que soit la valeur de l'indice i). Mais le nombre de nœuds Ny pourrait varier d'un groupe Gi à l'autre Gr. Par ailleurs, le nombre N de groupes Gi peut prendre n'importe quelle valeur supérieure ou égale à un (1 ). De même, le nombre M(i) de nœuds Ny d'un groupe Gi peut prendre n'importe quelle valeur supérieure ou égale à trois (3). Les nœuds (de service) N ou les groupes Gi peuvent, par exemple, être couplés les uns aux autres et au nœud de gestion NG via au moins un réseau de communication (comme par exemple l'Internet).

Chaque nœud Ny dispose de ressources qui sont généralement partagées avec les autres nœuds Ny (j'≠ j) de son groupe Gi, sous le contrôle d'un logiciel de haute disponibilité (ou HA (« High Availability »)). Ces ressources peuvent être de tout type dès lors qu'il s'agit de services configurables qui sont utiles au calculateur CHP ou à une application tournant dans ce calculateur CHP.

Par ailleurs, chaque nœud Ny comprend au moins un disque de stockage DS et une mémoire volatile MV, par exemple de type RAM (« Random Access Memory »). De plus, chaque nœud Ny est instancié de manière à fonctionner conformément à une image logicielle de nœud de type arbre adaptée à un système d'exploitation (ou « operating System »). Par conséquent, on considère ici que chaque nœud Ny est opérationnel. On notera que l'image logicielle (de nœud de type arbre), qui constitue une fois instanciée un système d'exploitation, est stockée (ou chargée) dans la mémoire volatile MV de chaque nœud Ny.

Il est ici rappelé que le système d'exploitation est chargé d'assurer l'interface entre des logiciels applicatifs (ou « software ») et du matériel informatique (ou « hardware »).

Le nœud de gestion NG comprend de préférence un outil de configuration OC destiné à configurer des ressources de nœuds Ny. On considère dans ce qui suit, à titre d'exemple non limitatif, que l'outil de configuration OC est Kconf® (commercialisé par la société BULL SAS).

Comme indiqué plus haut, l'invention propose un procédé destiné à permettre le contrôle du changement de système d'exploitation dans des nœuds Ny choisis du calculateur CHP. Par exemple, tous les nœuds Ny du calculateur CHP peuvent être concernés par ce changement. Dans une première variante, ce sont tous les nœuds Ny de l'un au moins des groupes Gi qui peuvent être concernés par ce changement. Dans une seconde variante, seuls certains nœuds Ny de l'un au moins des groupes Gi peuvent être concernés par ce changement. Ce procédé comprend des première (i), deuxième (ii) et troisième (iii) étapes. Au moins la deuxième étape (ii) peut être mise en œuvre par un dispositif de contrôle D selon l'invention.

Dans l'exemple non limitatif illustré sur la figure 1 , le dispositif de contrôle D fait partie du nœud de gestion NG, et plus précisément du module de déploiement MD (ici Ksis®) de ce dernier (OC). Mais cela n'est pas obligatoire. Il pourrait en effet s'agir d'un équipement qui est externe au nœud de gestion NG mais accessible par ce dernier (CHP), par exemple du fait d'une connexion informatique. Par conséquent, le dispositif de contrôle D peut être réalisé, soit sous la forme de modules logiciels (ou informatiques, ou encore « software ») ; on est alors en présence d'un produit programme d'ordinateur comprenant un jeu d'instructions qui, lorsqu'il est exécuté par des moyens de traitement de type circuits électroniques (ou « hardware »), est propre à mettre en œuvre une partie au moins du procédé de contrôle, soit sous la forme d'une combinaison de modules logiciels et de circuits électroniques.

Durant la première étape (i) du procédé selon l'invention, on (une personne autorisée par l'administrateur du calculateur CHP) définit pour des nœuds (de service) Ny choisis une version réduite VR d'un nouveau système d'exploitation à installer, un noyau d'amorçage NA, une image logicielle de nœud de type arbre IR, dite de référence, adaptée à ce nouveau système d'exploitation et comportant une définition d'une instanciation à instaurer dans ces nœuds Ny choisis, et un module de lancement ML propre à installer cette image de référence IR localement dans chaque nœud Ny choisi.

Il est important de noter que ce qui différencie une image de référence IR (selon l'invention) d'une image logicielle de nœud de type arbre (classique), c'est le fait qu'elle comprend en complément de cette dernière la définition de l'instanciation qui doit être instaurée dans des nœuds Ny choisis. Il s'agit donc d'une photographie d'un nouvel agencement logiciel d'un nœud Ny choisi en présence d'un nouveau système d'exploitation à laquelle est adjointe une suite de commandes d'instanciation destinée à préparer ce nœud Ny choisi, et notamment à provoquer un partitionnement choisi suivi d'un formatage choisi dans un disque de stockage DS de ce nœud Ny choisi. Par exemple, le nouveau système d'exploitation peut être linux ou une version particulière de linux.

Le noyau d'amorçage (ou « boot kernel ») NA est un programme informatique qui est chargé de lancer (ou faire fonctionner) le module de lancement ML associé.

La version réduite VR du nouveau système d'exploitation est un ensemble de commandes destiné à permettre au module de lancement ML de charger l'image de référence I R associée et d'instancier un nœud Nij choisi dans lequel il est transféré. Cet ensemble peut, par exemple, comprendre environ cent commandes.

Le module de lancement ML est un programme informatique qui est chargé, lorsqu'il a été lancé par le noyau d'amorçage NA associé, d'installer une image de référence I R dans le nœud Nij choisi dans lequel il est transféré en utilisant la version réduite VR associée.

Par exemple, et comme illustré non limitativement sur la figure 1 , la version réduite VR, le noyau d'amorçage NA, l'image de référence I R et le module de lancement ML peuvent être stockés dans une mémoire de l'outil de configuration OC, laquelle fait éventuellement partie du module de déploiement MD (voire du dispositif de contrôle D).

On notera que le nœud de gestion NG comprend une interface homme/machine (non représentée) qui peut éventuellement permettre à une personne (autorisée par l'administrateur du calculateur CHP) de concevoir et d'optimiser les définitions de la version réduite VR, du noyau d'amorçage NA, de l'image de référence IR et du module de lancement ML. On notera également que le dispositif de contrôle D peut être éventuellement agencé de manière à superviser ces conception et optimisation de définitions via l'interface homme/machine.

Durant la deuxième étape (ii) du procédé selon l'invention, on transfère dans les nœuds (de service) Nij choisis l'image de référence I R, le noyau d'amorçage NA, le module de lancement ML et la version réduite VR qui ont été définis dans l'étape (i).

Ce transfert peut se faire d'au moins deux façons différentes.

Une première façon consiste à transférer ensemble dans chacun des nœuds Ny choisis l'image de référence IR, le noyau d'amorçage NA, le module de lancement ML et la version réduite VR qui ont été définis dans l'étape (i). Ce transfert est déclenché par le nœud de gestion NG et contrôlé par des moyens de contrôle MC du dispositif de contrôle D à la requête de l'administrateur du calculateur CHP.

Une seconde façon consiste à commencer par transférer dans chacun des nœuds Ny choisis uniquement l'image de référence IR, puis à transmettre à chacun de ces nœuds Ny choisis un message de déclenchement lui ordonnant de télécharger du nœud de gestion NG le noyau d'amorçage NA, la version réduite VR et le module de lancement ML qui ont été définis et qui sont associés à cette image de référence IR transférée. Ces deux transferts peuvent être différés dans le temps, et sont déclenchés par le nœud de gestion NG et contrôlés par des moyens de contrôle MC du dispositif de contrôle D à la requête de l'administrateur du calculateur CHP.

Par exemple, le message de déclenchement déclenche automatiquement dans le nœud Ny qui le reçoit un programme d'amorçage (ou « boot ») de type réseau PXE (ou GPXE) qui va à son tour organiser le téléchargement auprès du nœud de gestion NG.

Chaque transfert peut, par exemple, être réalisé au moyen de la commande « ksis copy » qui est offerte par le module de déploiement Ksis®. Mais toute autre commande (ici) linux de type copie à travers un réseau de communication peut être utilisée.

Une fois que l'image de référence IR a été transférée dans un nœud Ny choisi, elle est stockée dans le disque dur DS de ce dernier (Ny). Par ailleurs, une fois que le noyau d'amorçage NA, la version réduite VR et le module de lancement ML ont été transférés dans un nœud Ny choisi, ils sont stockés dans la mémoire volatile MV de ce dernier (Ny).

Durant la troisième étape (iii) du procédé selon l'invention, le noyau d'amorçage NA transféré dans chaque nœud de service Ny choisi lance le module de lancement ML transféré dans ce dernier (Ny) pour qu'il installe localement l'image de référence IR transférée en utilisant la version réduite VR transférée.

Le déclenchement de cette utilisation locale du module de lancement ML peut se faire automatiquement dès lors que ce module de lancement ML se retrouve stocké dans la mémoire volatile MV d'un nœud Ny choisi en même temps que le noyau d'amorçage NA associé.

Par exemple, dans l'étape (iii) chaque module de lancement ML peut commencer par analyser l'image de référence IR transférée et la capacité de stockage encore disponible dans la mémoire volatile MV de son nœud Ny choisi afin de réserver dans cette mémoire volatile MV une zone de stockage propre à stocker cette image de référence IR. Puis, ce module de lancement ML peut charger l'image de référence I R dans cette zone de stockage. Puis, ce module de lancement ML peut déclencher une suite de commandes propre à instancier son nœud Ny conformément à la définition d'instanciation qui est contenue dans cette image de référence IR. Pour ce faire, il va utiliser les commandes qui sont contenues dans la version réduite VR chargée avec lui dans la mémoire volatile MV. Cela provoque notamment un partitionnement du disque de stockage DS, puis un formatage de ce dernier (DS).

Les opérations d'instanciation étant presque les dernières effectuées, si un quelconque problème intervient avant elles, le nœud Ny ne devient pas non opérationnel car il continue de fonctionner avec l'ancienne image de référence qui n'a pas été désinstallée.

Si l'instanciation a été correctement réalisée, le module de lancement ML déclenche un réamorçage (ou « reboot ») de son nœud Ny afin qu'il fonctionne désormais conformément à la nouvelle image de référence I R installée qui est adaptée au nouveau système d'exploitation.

De préférence, dans l'étape (iii), avant de déclencher le réamorçage (ou reboot), chaque module de lancement ML contrôle le stockage de l'image de référence I R (complète), éventuellement dans une version compressée, dans le disque de stockage DS de son nœud Ny, de sorte qu'en cas de défaut dans l'installation de cette (nouvelle) image de référence IR on ne soit pas obligé de recommencer son transfert (dans ce cas, il suffit de recommencer le transfert du noyau d'amorçage NA, de la version réduite VR et du module de lancement ML associés, ou bien de réinstaller l'ancienne image de référence stockée sur le disque de stockage DS et qui permettait un fonctionnement correct). On notera que chaque module de lancement ML peut également et éventuellement contrôler le stockage de l'ancienne image de référence, éventuellement dans une version compressée, dans le disque de stockage DS de son nœud Nij.

On a schématiquement illustré sur la figure 2 un exemple d'algorithme mettant en œuvre un exemple de procédé de contrôle selon l'invention.

Cet algorithme comprend une sous-étape 1 0 dans laquelle on (une personne) définit pour des nœuds Nij choisis une version réduite VR d'un nouveau système d'exploitation à installer, un noyau d'amorçage NA, une image de référence I R, adaptée à ce nouveau système d'exploitation et comportant une définition d'une instanciation à instaurer dans les nœuds Nij choisis, et un module de lancement ML propre à installer cette image de référence I R localement dans chaque nœud N choisi. On stocke ensuite cette version réduite VR, ce noyau d'amorçage NA, cette image de référence I R et ce module de lancement ML, par exemple dans le nœud de gestion NG du calculateur CHP.

Cette sous-étape 10 constitue ici l'étape (i) du procédé de contrôle selon l'invention.

L'algorithme se poursuit par une sous-étape 20 dans laquelle on (le nœud de gestion NG sous le contrôle du dispositif de contrôle D) transfère dans les nœuds Nij choisis (en une ou deux phases) l'image de référence IR, le noyau d'amorçage NA, le module de lancement ML et la version réduite VR définis dans la sous-étape 1 0.

Cette sous-étape 20 constitue ici l'étape (ii) du procédé de contrôle selon l'invention.

Puis, dans une sous-étape 30, le noyau d'amorçage NA transféré dans chaque nœud Nij choisi lance le module de lancement ML transféré dans ce dernier (Nij) pour installer localement l'image de référence I R transférée en utilisant la version réduite VR.

Enfin, dans une sous-étape 40, chaque module de lancement ML déclenche un réamorçage (ou reboot) de son nœud de service Ny.

Les sous-étapes 30 et 40 constituent ici l'étape (iii) du procédé de contrôle selon l'invention.

On notera que l'invention permet de transférer dans les nœuds de service plusieurs images de référence, afin de permettre à l'administrateur de choisir parmi ces différentes images de référence transférées celle qu'il souhaite mettre en place à un instant donné. Par ailleurs, l'instant où l'administrateur décide de réaliser un transfert peut être celui où le réseau de communication qui couple les nœuds est le plus performant au regard du contexte de sécurité souhaité. En outre, la mise en place de l'une des images de référence transférées peut s'effectuer alors même que le calculateur CHP exécute une tâche. De plus, le déploiement « autonome » qu'offre l'invention permet de réinstaller très facilement, à n'importe quel moment choisi par l'administrateur, une ancienne image de référence.

L'invention ne se limite pas aux modes de réalisation de procédé de contrôle, de dispositif de contrôle, et de calculateur haute performance décrits ci-avant, seulement à titre d'exemple, mais elle englobe toutes les variantes que pourra envisager l'homme de l'art dans le cadre des revendications ci- après.