introduktion til de praktiske øvelser

Post on 02-Jan-2016

38 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

Introduktion til de praktiske øvelser. Vi vil i dag fokusere på tre forskellige online software til SNP analyser snpTree NDtree CSIphylogony. Introduktion til SNP analyser. http://cge.cbs.dtu.dk/services/all.php. snpTree. DRAG’n Drop (eller brug Browse) til at uploade filer. - PowerPoint PPT Presentation

TRANSCRIPT

Introduktion til de praktiske øvelser

Vi vil i dag fokusere på tre forskellige online software til SNP analyser

• snpTree• NDtree• CSIphylogony

Introduktion til SNP analyserhttp://cge.cbs.dtu.dk/services/all.php

DRAG’n Drop (eller brug Browse) til at uploade filer

Vælg en reference (samme bakterielle species)

Vælg data format (her: Assembled genomes)

Vælg minimal distance der skal være imellem SNPs.

snpTree

…eller vælg din egen reference (index case? – draft genome)!!

Prune?Hvad er SNPs…og hvad bruger vi dem til?Hvad er forudsætningen for at vi kan bruge dem?

Lidt om.....filnavne….

Kirsten Siggaard Kirsten_SiggaardIngen MELLEMRUM (eller sære tegn!) i filnavne!!!

Submit……..og vent……eller start et nyt job..

snpTree

Vælg minimal distance der skal være imellem SNPs.

Vælg alt ”CTRL + A” teksten i vinduet

og kopier ”CTRL + C”

Åben herefter MS Excel og sæt teksten ind ”CTRL + V”

Vælg alt ”CTRL + A” teksten i vinduet

og kopier ”CTRL + C”

Åben herefter TreeViewer og sæt teksten ind ”CTRL + V”

http://cge.cbs.dtu.dk/services/TreeViewer-1.0/treeviewer.php

http://cge.cbs.dtu.dk/services/TreeViewer-1.0/treeviewer.php

http://cge.cbs.dtu.dk/services/TreeViewer-1.0/treeviewer.php

Copy/Paste tekst fra NEWICK filen her!

Vil I prøve anden Træ-viewer, så kan man hente FigTree her: http://tree.bio.ed.ac.uk/software/figtree/

Extracting archives:7-ZIP: http://7-zip.org/WinRar: http://www.rarlab.com/download.htm

Bemærk: .vcf filer i Windows er kontakt-filer til Outlook!!

For at åbne en bioinformatisk .vcf fil* skal man højre-klikke på filen og vælge ”Åben med” og vælge ”Notesblok” som standardprogram til denne filtype!

* En bioinformatisk .vcf fil indeholder information om alle SNPs i forhold til referencen for hver af de sekvenser, man har uploadet.

Vælg alt ”CTRL + A” teksten i vinduet

Vælg alt ”CTRL + A” teksten i vinduet og kopier ”CTRL + C”

Åben herefter MS Excel og sæt teksten ind ”CTRL + V”

NDtree

DRAG’n Drop (eller brug Browse) til at uploade filer

Vælg din egen foretrukne reference…eller lad serveren identificere det bedste match fra en meget lang liste af fuldt sekventerede genomer fra NCBI...

Vælg ”Fast mode” i dag…

Find filen i ”Download” eller ”Overførsler” mappen i Windows stifinder

Bemærk: .mat filer i Windows er MS Access filer!!

For at åbne en bioinformatisk .mat distancefil skal man højreklikke på filen og vælge ”Åben med” og vælge ”Notesblok” som standardprogram til denne filtype!

Herefter kopieres indholdet ”CTRL + A”, ”CTRL + C” og sættes ind i Excel ”CTRL + V”

P.S. Output kan være ret svært at læse (det arbejdes der på)

Vælg alt med ”CTRL + A” og kopier ”CTRL + C”

Åben herefter ThreeViewer og sæt teksten ind ”CTRL + V”

http://cge.cbs.dtu.dk/services/TreeViewer-1.0/treeviewer.php

CSI Phylogeny

DRAG’n Drop (eller brug Browse) til at uploade filer

Vælg din egen reference (index case/Typestamme?)!!

Submit dit job

Vælg minimal distance der skal være imellem SNPs.

Vælg alt med ”CTRL + A” og kopier ”CTRL + C”

Åben herefter TreeViewer og sæt teksten ind ”CTRL + V”

http://cge.cbs.dtu.dk/services/TreeViewer-1.0/treeviewer.php

Herefter kopieres indholdet i Notepad med ”CTRL + A”, ”CTRL + C” og sættes ind i Excel ”CTRL + V”

Herefter kopieres indholdet i Notepad med ”CTRL + A”, ”CTRL + C” og sættes ind i Excel ”CTRL + V”

SNP øvelsen

• Øvelsessættet består af 7 Klebsiella pneumoniae stammer relateret til et udbrud af CTX-M-15/SHV-28 producerende K. pneumoniae med udgangspunkt i Hospitalet i Hillerød.

• Herudover vil I få udleveret den nærmest beslægtede (fuldt sekventerede) NCBI reference stammer.

• Og et ESBL producerende E. coli stamme til at teste med.

Test dataNavn År Dato Sted Patient Species

Kpn_1 2006 04.01 A 1 K. pneumoniae

Kpn_2 2008 22.01 B 2 K. pneumoniae

Kpn_3 2008 14.07 B 3 K. pneumoniae

Kpn_4 2008 02.12 A 4 K. pneumoniae

Kpn_5 2008 14.03 C 5 K. pneumoniae

Kpn_6 2009 03.04 A 4 K. pneumoniae

Kpn_7 2009 06.08 C 6 K. pneumoniae

Ref_1084 ? ? NCBI Reference K. pneumoniae

Ec 2008 E. coli

Leg og lær….

• Tanken er, at I kan prøve én eller flere af de forskellige SNP web-servere af med dette testsæt.• Det er muligt at sætte mere end ét job over ad gangen….• …..men husk på, at vi er 25, der gør det samtidig, hvilket godt kan

have en effekt på hastigheden af serveren.

• Skulle det gå helt galt, kan vi blive nødt til at genstarte serveren…!!

I kan få tilsendt en e-mail med resultatet

• Resultatet vil kun være tilgængeligt i 48 timer på serveren….herefter slettes linket. Så vil I gerne gemme resultaterne af jeres fremtidige søgninger, er I nødt til at gemme filerne!• Kører I flere jobs, så anbefales det varmt, at I skriver en lille note ned

angående jobbet (Hvilken reference, hvilken prune, hvilke stammer osv.)

Forslag til Jobs, der kan sættes i gangStart med at lave en folder på computerens skrivebord, som I navngiver med jeres initialer.

1. Prøv at køre enten snpTree, Ndtree eller CSI Phylogony med de 7 teststammer. Brug introduktionen fra før til at sikre jer, at I starter det, med de korrekte parametre.

Note snpTree: Vælg en af de 5 Klebsiella’er i NCBI listen og husk at vælge ”Assembled genomes” som input!Note NDtree: Prøv at lade NDtree selv finde referencen ved at lade feltet ”Template file” stå tomt.Note CSI Phylogeny: Vælg filen ”Ref_1084” som reference.

Kan I identificere udbrudsstammerne imellem de 7 isolater.

Prøv jer frem….I kan prøve at tjekke nogle af outputfilerne ud.

• Kan I finde, hvor mange SNPs der er til forskel imellem de forskellige udbrudsstammer?

• Kan I få hentet NEWICK filen og få den over i TreeViewer? Prøv at ændre på træet i ThreeViewer.

Prøv jer frem….Prøv at gentage jobbet med ændrede parametre (højere prune, ændre reference, samme sæt med en af de to andre web-servere..).

• Får I samme resultater?• Hvordan reagerer de forskellige SNP-servere på at der kommer en

forkert species (her E. coli) med i analysen?

Prøv jer frem….Prøv at gentage jobbet med ændrede parametre: • højere prune• ændre reference til index case (kpn_1)• samme sæt data med en af de to andre web-servere.

• Får I samme resultater med de ændrede parametre?• Hvordan reagerer de forskellige SNP-servere på at der kommer en

forkert species (her E. coli) med i analysen?

Resultater…..1. snpTree, alle 7 stammer, reference (MGH….), 10 prune2. snpTree, alle 7 stammer, reference (kpn_7), 10 prune3. NDtree, alle 7 stammer, ingen valgt reference4. CSI Phylogeny, alle 7 stammer, Ref (1084), 10 prune5. snpTree, 6 sidste stammer, Ref (kpn_1), 10 prune6. NDtree, 6 sidste stammer, Ref (kpn_1)7. CSI Phylogeny, 6 sidste stammer, Ref (kpn_1), 10 prune8. CSI Phylogeny, 7 + EC, Ref (1084), 10 prune9. snpTree, 7 + EC, Ref (1084), 10 prune10. NDtree, 7 + EC, Ref (1084)11. snpTree, 6 udbrudsstammer, Ref (kpn_1), prune 1012. NDtree, 6 udbrudsstammer, Ref (kpn_1)13. CSI Phylogeny, 6 udbrudsstammer, Ref (kpn_1), prune 10

1. snpTree, alle 7 stammer, reference (MGH….), 10 prune

2. snpTree, alle 7 stammer, reference (kpn_7), 10 prune

3. NDtree, alle 7 stammer, ingen valgt reference

4. CSI Phylogeny, alle 7 stammer, Ref (1084), 10 prune

5. snpTree, 6 sidste stammer, Ref (kpn_1), 10 prune

6. NDtree, 6 sidste stammer, Ref (kpn_1)

7. CSI Phylogeny, 6 sidste stammer, Ref (kpn_1), 10 prune

8. CSI Phylogeny, 7 + EC, Ref (1084), 10 prune

9. snpTree, 7 + EC, Ref (1084), 10 prune

10. NDtree, 7 + EC, Ref (1084)

11. snpTree, 6 udbrudsstammer, Ref (kpn_1), prune 10

12. NDTree, 6 udbrudsstammer, Ref (kpn_1),

13. CSI Phylogeny, 6 udbrudsstammer, Ref (kpn_1), prune 10

top related