athena software

14
ATHENA SOFTWARE ATHENA SOFTWARE - Tatjana Jovin -

Upload: emi-melendez

Post on 30-Dec-2015

49 views

Category:

Documents


3 download

DESCRIPTION

ATHENA SOFTWARE. - Tatjana Jovin -. The Athena soft ver : uobičajena softverska kontrolna razvojna platforma ATLAS detektora, napisana u C++ i Python, na osnovu Gaudi arhitekture: Simulacija događaja Trigger-ovanje događaja Rekonstrukcija događaja Fizička analiza - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: ATHENA SOFTWARE

ATHENA SOFTWAREATHENA SOFTWARE

- Tatjana Jovin -

Page 2: ATHENA SOFTWARE

Kompjuterski model Kompjuterski model ATLASATLAS-a-a

The Athena softThe Athena softverver : :uobičajena softverska kontrolnarazvojna platforma ATLASdetektora, napisana u C++ i Python, na osnovu Gaudi arhitekture:• Simulacija događaja• Trigger-ovanje događaja• Rekonstrukcija događaja• Fizička analiza

• Athena softver povezan sa modularnom strukturom modela podataka događaja – EDM – Event Data Model

Distribuirani računarski alatiDistribuirani računarski alati::

• Upravljanje distribuiranim podacima – DDM - The Distributed Data Management

• Distribuirani produkcioni sistem - DPS - The Distributed Production System

• Ganga/pAthena razvojna platforma

za disribuirane analize na GRID-u

• DDM je centralni link između svih komponenti

Page 3: ATHENA SOFTWARE

Athena softversko okruženje • SVN (Subversion) - je verzija alata koja se koristi u

Athena softveru za upravljanje različitim verzijama koda• Mogućnost primene starijih verzija• Klaster koji služi SVN skladištu je atlas-sw.cern.ch • 3 repozitorijuma: atlasoff, atlasusr, atlasgrp

• Definisanje okruženja realizuje se uz pomoć CMT (Configuration Management Tool)• Okruženje se instalira uz pomoć nekoliko skripti• Korišćenje novog paketa zahteva samo dodatak u

listu paketa • Athena je struktuirana na paketima – “Packages”

Page 4: ATHENA SOFTWARE

Arhitektura jednog Paketa u Athena-i

Sadrži datoteku

requiremensts

definisanu konfigurac.

paketa

Sadrži datoteke header

(*.h)

Sadrži:• source datoteke (*.cxx)

• direktorijumcomponent

(*.cxx)

Sadrži jobOptions

(*.py)

Sadrži dokumentac. u vezi paketa

Page 5: ATHENA SOFTWARE

Koncept razvoja paketa u Athena softveru

Glavne komponente Athena softvera prilikom razvoja koda:• Algorithm – poziva alate i primenjuje ih na podatke (u vidu objekata);

operacije u algoritmima treba da budu svedene na minimum; obično su algoritmi i alati smešteni u odvojene direktorijume; mora da sadrži 3 metoda: initialize (), execute (), finalize ()

• AlgTools – slični algoritmu u tome da radi na ulaznim podacima i može da generiše izlazne podatke, ali se razlikuje u tome da može da bude izvršen nekoliko puta po događaju; npr. za definisanje rekonstruisanog elektrona koji je najbliži MC elektronima

• Data objects – “kontejneri” informacija; podaci dostupni od strane algoritama organizovani su u raznim prolaznim skladištima podataka - podaci o događaju upravljani su jednim skladištem, podaci o statusu detektora, geometrija i poravnanje, u drugom, ...

• Services - obezbeđuju način preuzimanja alata i podataka (u vidu objekata) za potrebe algoritama

• JobOptions datoteka – python skripta (default jobOptions.py) koja se upotrebljava za specifiranje konfiguracije algoritma, specifira sve potrebne servise i njihove konfiguracije

Page 6: ATHENA SOFTWARE

Athena Architecture

Page 7: ATHENA SOFTWARE

Produkcija događaja uz pomoć Athena softvera• Generisanje događaja

- Nekoliko generatora na raspolaganju (Pythia, MC@NLO, Herwig, E …)

- Mogućnost da se uključe fizički pod-procesi (Pile-up, …)

• Simulacija detektora- Korišćenje GEANT4- Opis različitih materijala detektora

• Digitalizacija podataka- “Hits” u “Digits”

• Rekonstrukcija fizičkih objekata- ESD, AOD, Backnavigation

• Analiza podataka- Sprovedena uz pomoć ROOT-a

Page 8: ATHENA SOFTWARE

Formati podataka na ATLAS-u – Event Data Model - EDM• Athena – za rekonstrukciju RAW podataka i produkciju i reprocesing

ESD/AOD/DPD • ATLAS – proizvodiće oko 3 PB neobrađenih podataka godišnje; da bi se omogućilo

fizičarima da analiziraju podatke na udaljenim lokacijama, nekoliko tipova skupova podataka, koji odgovaraju različitim fazama rekonstrukcije, su proizvedeni:

• “Byte stream” podaci; ~ 200 Hz, 1.6 MB/event, trajna prezentacija podataka o događajima koji pristižu sa HLT-a

• Raw Data Object Data – RDO – C++ reprezentacija byte-stream informacije• Na Tier-0 (CERN), softver za rekonstrukciju obrađuje sirove podatke u realnom

vremenu i produkuje:• ESD – Event Summary Data – sadrži detaljan izlaz rekonstrukcije detektora u

objektnom (pool/root) formatu: Tracks, Calo Clusters, Calo Cells, objekti iz kombinovane rekonstrukcije itd.; omogućuje brzu optimizaciju algoritama za rekonstrukciju i kalibraciju; 500 kB/event

• AOD – Analysis Object Data – sažetak rekonstruisanog događaja sa (pool/root) objektima: elektroni, mioni, džetovi; sadrži dovoljno informacija za uobičajene analize; 100 kB/event

• DPD – Derived Physics Data – “skimmed/thinned/slimmed” events + drugi korisni “korisnički” podaci izvedeni iz AOD-a i sistema za konstanto praćenje parametara sistema; ~ 10 kB/event; D1PD, D2PD, D3PD

• TAG – metapodaci na nivou događaja, koji skupljaju opšte karakteristike događaja, omogućuju brzu selekciju u AOD i/ili ESD fajlovima i brz pristup delovima podataka o događajima; ~ 1 kB/event

Page 9: ATHENA SOFTWARE

Operativni model• The Tier-0 (CERN) distribuira sve rekonstruisane podatke (ESD/AOD/DPD/TAG) ka svim od 10 Tier-1 i u proseku 10%RAW podataka, tako da potpuna kopija RAW podataka postoji• Tier-1 - distribuira njihove podatke ka > 60 Tier-2’s i re-rekonstruiše njihove RAW podatke po potrebi• Tier-2 - uglavnom za simuulacije i analize na korisničkomnivou na AOD i primarnim DPDs kako bi se proizveli sekundarni itercijarni Derived Physics Data (D2/3PD)• Tier-3 – omogućen pristup GRID-u i lokalnom prostoru na diskovima;doprinosi CPU procesiranju za simulacije i analize• D1PD – proizvedeni na GRID produkcionom sistemu; sadržaj neće

biti specifičan za analizu• D2PD - su u ESD/AOD/DPD formatu, precizniji i sadrže podatke za

analizu• D3PD - sadrže ntuple; pogodni za grafičko predstavljanje konačnih

rezultata

Page 10: ATHENA SOFTWARE

Uvod u fizičku analizu (Tier-2)AOD arhitektura

• Stalna (‘persistent’) prezentacijaATLAS podataka, distribuirana ka svim Tier1 • Proizvedeni rekonstrukcije ili iz ESD-a• Tzv. Stanjivanje (‘slimming’) ESD fajlova; dobijanje fajlova koji imaju jedan C++ objekat za isti fizički objekat• Dodeljeni objekti sa linkovima (point-erima) ka detaljniminformacijama u ESD objektima• U pojedinim slučajevima informacije koje su potrebne na nivouanalize veoma bliske informacijama iz rekonstrukcije• Produkcija Ntuple-i koji se upotrebljavaju kao input-i za analizuputem ROOT-a

Page 11: ATHENA SOFTWARE

Uvod u fizičku analizu Oruđa za analizu algoritama nad AOD

Klase oruđa za analizu - Analysis Tools: - Kombinacije – pr. imamo kontejner elektrona iželimo sve kombinacije 2 elektrona - Kombinacije uz selekciju – interesuju nas samo dobre kombinacije –selectElectron i staviti ih u vektor ePair - Permutacije – želimo da dobijemo sve permutacije od M objekata, gde jeM ≥ N; npr. želimo sve permutacije od npr. 2 džeta - Permutacije uz selekciju – želimo da dobijemo objekte koji su prošlikriterijume zadane funkcijom selekcije – selectBJet i staviti ih u vektor bPair

- Sortiranje – sortiranje kontejnera u odnosu na pT, E, η, φ njihovih objekatau opadajućem nizu - Filteri – želimo npr. da izdvojimo MC Truth događaje za određeni raspad t → Wb → jjb; želimo npr. da kreiramo sopstvenu MC truth kolekciju, kojaima samo određene filtrirane zapise i zapise raspada

Page 12: ATHENA SOFTWARE

Uvod u fizičku analizu Oruđa za analizu algoritama nad AOD

- Oruđa algoritama - AlgTools: 1. Sortiranje – oruđe za pozivanje već opisanog oruđa za sortiranjeprilikom kreiranja sopstvene kolekcije objekata myCollection -

uglavnom sortPT, sortE, sortEta,sortPhi 2. Oruđe za izračunavanje rastojanja ΔR i ΔΦ između dva objekta – Lorencov 4-vektor već implement. računanje ΔR 3. Oruđe koje nam daje odgovor na sledeća pitanja: poklapanje ili“match” po ΔR između rekonstruisanog objekta i MC truth objekta,koje je rastojanje između ta dva objekta ukoliko postoji poklapanje ikoji je to aktuelni MC truth objekat koji je najbliži rekonstuisanomobjektu 4. Klasifikacija po naelektrisanju – npr. imamo kontejner elektronakoji želimo da razdvojimo na dva kontejnera – elektrone i pozitrone

Page 13: ATHENA SOFTWARE

Uvod u fizičku analizu Oruđa za analizu algoritama nad AOD

- Kompozitne čestice – omogućuje korisnicima da kreiraju kompozitne

objekte; npr. kreiranje Z kandidata kao kompozitne čestce od 2 leptona

(elektrona ili miona); možemo da pitamo za masu ili kinematičke

parametre Z bozona; možemo da dodamo 2 Z bozona zajedno da kreiraju

Higs kandidata kao kompozitne čestice

- Navigacija konstituenata – npr. pristupanje kalo. klasterima ili ćelijama

iza džeta i sabiramo ET u ćelijama; kalo. ćelije nisum AOD objekti, “back

navigation” do ESD je neophodno kako bi im se pristupilo

- Poseban uslužni paket – SpecialUtils – npr. želimo da pronađemo

longitudinalnu komponentu impulsa neutrina W → l ν, upotrebljavajući

W masu kao ograničenje i pretp. da neutrino “nosi” nedostajući pT

- Back Navigation – do ESD ili do RAW može biti “trigger”ovana za

pristup objektima – AOD “zna” iz kog ESD je kreiran → za omogućavanje ove

funkcije, potrebno je dodati sledeću liniju u jobOptions datoteku:

EventSelector.BackNavigation = True

Page 14: ATHENA SOFTWARE

Još malo o Athena-i

• Široka primena dinamičkih biblioteka • Jasno razdvajanje između podataka i algoritama; npr. interfejs koji

omogućava pristup podacima o tragu (npr. 4-impuls) odvojen je u različite klase (pakete obično) od koda odgovornog za traženje i građenje traga

• Jasno razdvajanje između “persistent” i “transient” podataka• Prepoznavanje da ima mnogo tipova podataka koji imaju različita vremena

trajanja unutar softvera (npr. statistički podaci akumulirani unutar histograma su dugo živeći u poređenju sa podacima pojedinačnog događaja

• Apstraktni interfejsi – omogućavaju različite softverske implementacije za slične funkcionalnosti, ali optimizovane za različita okruženja; laka manipulacija grupe komponenata koji dele opšti interfejs

• Athena developer ima omogućeno sistem servisa za konfiguraciju poslova, praćenje poslova, praćenje performansi sistema, za otklanjanje grešaka,...

• Athena obezbeđuje mnoge alate u oblasti rada, za snimanje istorije procesiranja podataka, za upravljanje podacima događaja i detektora

• https://twiki.cern.ch/twiki/bin/view/Atlas/AtlasComputing• https://twiki.cern.ch/twiki/bin/view/AtlasProtected/PhysicsAnalysisTools