meetup geneve monitoring -tcs performance et monitoring

17
IT OPS Performance et monitoring Zaïd BOUDAMOUZ Expert applicatif & performance monitoring [email protected] 15.10.2015 © Touring Club Suisse 1

Upload: open-it-services

Post on 06-Apr-2017

664 views

Category:

Technology


4 download

TRANSCRIPT

Page 1: Meetup Geneve Monitoring -TCS Performance et monitoring

© Touring Club Suisse 1

IT OPSPerformance et monitoring

Zaïd BOUDAMOUZ Expert applicatif & performance [email protected]

15.10.2015

Page 2: Meetup Geneve Monitoring -TCS Performance et monitoring

© Touring Club Suisse 2

Sommaire

- Expert applicatif et performance monitoring- Infra TCS en quelques mots - KPI- Monitoring global au TCS- Monitoring IBM Websphere- Assistance Landscape Websphere - WebSphere Application Server Performance Tuning Toolkit- DEMO et quelques stats- Question

10.2015

Page 3: Meetup Geneve Monitoring -TCS Performance et monitoring

© Touring Club Suisse 3

Expert applicatif & performance monitoring

• Expert Applicatif au TCS • Support niveau 2 • Analyse des problèmes «middleware»

• Spécialiste IBM Websphere, anciennement IBM Partner,• Déploiement dans des environnements en cluster

d’applications et de connecteurs SOA• Surveillance des systèmes applicatifs Websphere

• Développeur Senior J2EE, certifié SCJP• 8 ans de consulting (PSA, Delta data, TCS)

10.2015

Page 4: Meetup Geneve Monitoring -TCS Performance et monitoring

© Touring Club Suisse 4

INFRA TCS en quelques mots

• 6 ESX VMware Hyperviseur• 3 au sièges du TCS, 3 à Interroute• 330 VM environ, 30 serveurs physiques

• Plus de 100 applications actives 7j/7, 24h/24 • Applications WEB et Mobiles • Client lourd en JAVA • Applications Back end pour B2B • Environ 20 applications dans le cloud

• Plus de 5000 utilisateurs tout application confondu (excepté application mobile)

10.2015

Page 5: Meetup Geneve Monitoring -TCS Performance et monitoring

© Touring Club Suisse 5

KPI de la semaine 37 à 41

10.2015

Performance & scalabilité affecte la disponibilité. 99.9% = 8.5h d’indispo/an

Le calcul est le suivant

Disponibilité = (MTBF/(MTBF + MTTR)) X 100

MTBF (mean time between failure) MTTR (mean time to recovery)

Page 6: Meetup Geneve Monitoring -TCS Performance et monitoring

© Touring Club Suisse 6

Monitoring global TCS

• Un monitoring global des applications critiques basé sur les produits :• Newtest• Log Nagios• cURL

• Un monitoring Nagios • Plusieurs monitoring spécifiques selon le

domaine (Monitoring Boomi, Monitoring F5 BigIP , Monitoring IBM Websphere )

Page 7: Meetup Geneve Monitoring -TCS Performance et monitoring

© Touring Club Suisse 7

Monitoring IBM Websphere

• Monitoring d’applications J2EE

La Java Virtual Machine est la structure d’accueil d’une application J2EE. Les structures d’accueil sont les espaces d’exécution des conteneurs et des composants, elles servent de médiateur entre les conteneurs et les services systèmes. Les serveurs d’applications J2EE

permettent de développer très rapidement des applications complexes capables de supporter plusieurs milliers de transactions par secondes et plusieurs centaines de milliers d’utilisateurs.

Page 8: Meetup Geneve Monitoring -TCS Performance et monitoring

© Touring Club Suisse 8

Assistance Landscape Websphere

Page 9: Meetup Geneve Monitoring -TCS Performance et monitoring

© Touring Club Suisse 9

Assistance Landscape Websphere

10.2015

Cell=dmgrcell, Profile=dmgr

lge1as073pNode01 (ND 7.0.0.35)

lge3as194pNode01 (ND 7.0.0.35)

lge1as071pNode01 (ND 7.0.0.35)

lge3as193pNode01 (ND 7.0.0.35)

lge1as076pNode01 (ND 7.0.0.35)

lge3as198pNode01 (ND 7.0.0.35)

CLUSTER_A6FRONT

SIB_PRD_01

CLUSTER_A6BACK

CLUSTER_A6INVOICE

CLUSTER_SIBUS

CLUSTER_MUTASSYS

A6_PRD_01 A6_PRD_02 A6_PRD_03 A6_PRD_04

SIB_PRD_02

A6BK_PRD_01 A6BK_PRD_02

A6INV_PRD_02

MUT_PRD_01 MUT_PRD_02

Assys

SIBUS

Assys (back)

Assys Invoice

ATP

Page 10: Meetup Geneve Monitoring -TCS Performance et monitoring

© Touring Club Suisse 10

WebSphere Application Server Performance Tuning Toolkit

10.2015

Scénario FonctionsDétecter au plus vite les exceptions

• Détecter les différents type d’erreurs au plus vite (erreurs servlet, transaction (rollback et timeout), JDBC / JCA (erreur de connexion ou timeout), thread hung, et tout autres exceptions

Détecter les problèmes

• Avoir un diagramme détaillé de l’état du système• Définir des règles permettant de détecter les symptômes d’anomalie système

Consolider la configurarion sde performance

• Tuner tous les serveurs depuis une console d’administration• Exécuter des scripts (python) depuis la console

Faciliter la détermination des problèmes

• Générer les thread dump et les heap dump • Activer les traces de runtime • Extraire le contenu des pool de connexion• Extraire les fichiers SystemOut.log/SystemErr.log

Page 11: Meetup Geneve Monitoring -TCS Performance et monitoring

© Touring Club Suisse 1110.2015

DEMO

Page 12: Meetup Geneve Monitoring -TCS Performance et monitoring

© Touring Club Suisse 12

Demo

• Monitoring globale • Newtest• Boomi• Nagios

Page 13: Meetup Geneve Monitoring -TCS Performance et monitoring

© Touring Club Suisse 13

Quelques stats

10.2015

D’après vous quels sont les causes les plus communes des problèmes de performance ?

Page 14: Meetup Geneve Monitoring -TCS Performance et monitoring

© Touring Club Suisse 14

Quelques chiffres

10.2015

Les requêtes SQL et l’accès en concurrence sont prioritaires, et problèmes de fuite mémoire persistent en 2015.

Les problèmes de performance lié au réseau sont seulement en 3ème position

Page 15: Meetup Geneve Monitoring -TCS Performance et monitoring

15

Quelques chiffres

SOURCE : DZone’s 2015 guide to performance and monitoring

Nagios, Zabbix, et Icinga dominent sur le marché : 70%

Page 16: Meetup Geneve Monitoring -TCS Performance et monitoring

© Touring Club Suisse 16

Questions ?