Supervision et Métrologie pour Exchange 2010


Logo Exchange 2010Comme vous le savez, nous avons migré vers Exchange Server 2010 cet été afin de mettre en oeuvre les nouvelles fonctionnalités que cette version apportait (MailTips, ECP, RBAC, DAG), mais aussi pour disposer d’un temps nécessaire de production suffisant pour se permettre d’avoir une réelle expérience concrète lors de la sortie officielle du produit. Dès la définition du projet, à la fin du mois de Mai 2009, nous avons décidé de mettre des priorités sur un certain nombre de chantiers sous-jacents. L’un de ces chantiers était de définir quelles étaient les informations que nous devions communiquer sur la disponibilité du service ? Sous quel format ? Pour quelle cible ? Pour quel usage ?

Nous avons fini par distinguer la supervision (de nature technique, elle reste orchestrée par System Center Operations Manager 2007 R2 et les Management Packs pour Exchange 2010) et la métrologie. Deux points l’oppose à la supervision. En premier, elle doit tester autant des valeurs et des états (WMI, PowerShell, etc), que la validité d’un workflow. En effet, pour indiquer que les flux de messageries sont totalement fonctionnels, il ne suffit pas de tester que le service soit actif ou que les queues de messages soient opérationnelles, mais que « fonctionnellement »  les messages soient correctement délivrés dans un délai correspondant à un SLA contracter. En second, elle doit être capable d’analyser la dérive d’un système en termes de performances et de stockage et de produire des états pronostics de ce que sera notre environnement dans le futur.

Tableau de métrologie 2OS
Au final, après développement, l’état de métrologie du fonctionnement du service 2OS™ est disponible en ligne à tous les usagers de notre système. Vous en trouverez une capture écran ci-avant. Les calculs de probabilité sont par contre conservés hors ligne, sous forme de tableaux de calcul. L’état de métrologie est disponible en cas de fonctionnement normal du service et permet de connaître plusieurs informations importantes :

  • La disponibilité du service 2OS™ permet de connaitre les seuils de SLA, d’activité et d’inactivité (voir plus bas)
  • L’état des services fonctionnels 2OS™ permet de connaître les services proposés par la plateforme et savoir si ceux-ci sont disponibles
  • L’état des services techniques 2OS™ permet d’avoir quelques informations de haut niveau sur les éléments contrôlés quotidiennement.

Ce document est disponible tous les jours, du Lundi au Vendredi inclus (Pour les usagers ayant un contrat sans option). Des extensions sont prévues pour le support 24/7 mais facturables en sus par société.

Différences entre SLA et période d’activité/inactivité

  • Le SLA d’un serveur (Service Level Agreement) prend en compte la disponibilité du service en excluant les périodes d’interruption si elles ont été planifiées. En clair, le SLA n’est impacté que par les arrêts non planifiés. Ce ratio est calculé sur 365 jours. Il s’agit toujours d’une projection jusqu’à ce qu’on obtienne un an d’activité.
  • L’activité d’un serveur est le ratio qui permet de savoir sa disponibilité, c’est-à-dire à chaque fois qu’il est en état de marche (Ce seuil prend par contre en considération des arrêts planifiés comme non planifiés). . Ce ratio est calculé sur 365 jours. Il s’agit toujours d’une projection jusqu’à ce qu’on obtienne un an d’activité.
  • L’inactivité d’un serveur est le ratio durant lequel le service est rompu (ce seuil prend en compte les arrêts planifiés comme non planifiés). En clair, pour le Serveur 1, il y a eu 3 coupures planifiées (donc, ne comptant pas dans le calcul du SLA, qui ont entrainé trois ruptures de services – qui sont donc comptées dans les périodes d’inactivité car les services d’accès clients sont situés sur ce serveur). Pour les Serveurs 2 et 3, il y a eu également des coupures programmées, mais comme aucun client n’accédait à des services sur ces serveurs, les périodes d’inactivité sont donc restées à 0. Ce ratio est calculé sur 365 jours. Il s’agit toujours d’une projection jusqu’à ce qu’on obtienne un an d’activité.

A propos Arnaud Alcabez

With more than 20 years of experience in computing technologies and 18 years in the world of IT consulting (whose his own company during 9 years - MCT, MCSE, MSS), I have strong and major skills on IT technologies such Exchange, Virtualization, and BPOS/Office365, Cloud strategy and in particular, Microsoft ecosystem. The last 10 years were devoted to growth the MS identification and the business market (large and mid channels) for some French IT companies. Today, as Office365/Exchange Senior Architect at Capgemini, I share my knowledge with internal teams and Capgemini's customers. In parallel, I am acknowledged as a Most Valuable Professional (MVP) since 2003 by Microsoft Corp. I'm a writer for Exchange Magazine in France,the owner and president of the French Exchange Server community (2500 qualified members in September 2008), and one of the five managers on the Exchange Group LinkedIn community. I speak regularly as IT Expert (Level 300/400 sessions) for Microsoft France, for exemple, during the Microsoft Techdays.
Cet article, publié dans Stratégies, est tagué , , , , , . Ajoutez ce permalien à vos favoris.