bioinformatyka - strefa studenta - wydział rolnictwa i...
TRANSCRIPT
Bioinformatyka
wykłady dla I r. studiów magisterskich, biologia (SGGW)2012 / 2013
Krzysztof Pawłowski
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Wykład 8.X.2012
Co to jest bioinformatyka? Program wykładów Zastosowanie bioinformatyki:
sekwencjonowanie genomów
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Rozwiązywanie problemów biologicznych metodami obliczeniowymi
Solving biological problems by computational means
Some synonyms: In silico biology Computational biology / Biocomputing Theoretical biology
Substantial overlaps: Computational chemistry / cheminformatics Systems biology Structural biology Theoretical biophysics
„definicja”bioinformatyki / biologii obliczeniowej
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
• Objects: small molecules, structural motifs and domains, proteins, transcripts, genes, organelles, cells, tissues, organs, organisms
• Objects’ attributes: sequences, 3-D structures, expression data, clinical data, publications,….
Zakres zainteresowańbioinformatyki
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
„oficjalne” definicje NIH
Bioinformatics: approaches for expanding the use of biological, medical, behavioral or health data, including those to acquire, store, organize, archive, analyze, or visualize such data.
Computational Biology: The development and application of data-analytical and theoretical methods, mathematical modeling and computational simulation techniques to the study of biological, behavioral, and social systems.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Bioinformatics (wikipedia)
Bioinformatics and computational biology involve the use or development of techniques, including applied mathematics, informatics, statistics, computer science, artificial intelligence, chemistry, and biochemistry to solve biological problems, usually on the molecular level.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Bioinformatics (wikipedia, contd.)
The primary goal of bioinformatics is to increase our understanding of biological processes. What sets it apart from other approaches, however, is its focus on developing and applying computationally intensive techniques (e.g., data mining, and machine learning algorithms) to achieve this goal. Major research efforts in the field include sequence alignment, gene finding, genome assembly, protein structure alignment, protein structure prediction, prediction of gene expression and protein-protein interactions, and the modeling of evolution.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Bioinformatyka (wikipedia)
Bioinformatyka to dyscyplina zajmująca się stosowaniem narzędzi matematycznych i informatycznych do rozwiązywania problemów z nauk biologicznych. Z bioinformatyką powiązane są: genomika, proteomika, metabolomika i transkryptomika.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
„bioinformatyka” – nowa dyscyplina?
…ale pod innymi nazwami rozwijała sięprzynajmniej od lat 60.
Publikacje bioinformatyczne (PubMed)
1
10
100
1000
10000
100000
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Dygresja.Syn na zawsze w głowie matkiWojciech Moskal, sciencemag.org30.09.2012 , aktualizacja: 30.09.2012 16:35
Kobiety, które są w ciąży z chłopcami, zatrzymują część ich materiału genetycznego. Synowskie DNA rozsiewa się nawet do matczynych mózgów - dowiedli naukowcy z USA Powiedzenie, że syn jest oczkiem w głowie matki, nabiera więc całkiem
nowego znaczenia. W końcu oko to narząd zmysłu, jest więc integralnączęścią układu nerwowego. A uczeni z Ośrodka Badań nad Rakiem im. Freda Hutchinsona w Seattle pracujący pod wodzą dr J. Lee Nelson znaleźli obcy materiał genetyczny w najważniejszej części tego układu - korze mózgowej. Co więcej, to specyficzne "zanieczyszczenie", opisane w ostatnim wydaniu magazynu "PloS ONE", prawdopodobnie chroni matkęprzed niektórymi chorobami.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Bioinformatyka w Google
17 500 000
47 300 241 000 1 160 000 1 140 000 1 730 000
126 000 000
27 700 000
bioin
formati
cs
bioin
formaty
ka
bioin
formati
ka
bioin
formati
k
bioin
formati
ca
bioin
formati
que
biolo
gy
biolo
gia
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
bioinformatyka
BIOINFORMATYKA BIOINFORMATYKA -- dziedzina interdyscyplinarnadziedzina interdyscyplinarna
biologia (molekularna)dane biologiczne
informatyka narzędzia,metody
i obliczenia komputerowe= +
fizyka i chemia
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
BIOINFORMATYKA BIOINFORMATYKA -- celecele
Organizowanie i zarządzanie informacjami o makrocząsteczkach i innych danych biologicznych w formieskomputeryzowanych (cyfrowych) zapisów - baz danych
Analiza tych danych za pomocą metod obliczeniowych, rozwój metod i algorytmów
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
DNA
BIOINFORMATYKA BIOINFORMATYKA -- poziomy analizpoziomy analiz
mRNA
białka
interakcje i metabolizm
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
genom
BIOINFORMATYKA BIOINFORMATYKA -- poziomy analizpoziomy analiz
wszystkie sekwencje DNA zawarte w organizmie, geny,
sekwencje regulatorowe
genomikagenomika
poziom badań przedmiot badań dziedzina badań
poszukiwanie sekwencjikodujących, rozpoznawanie
eksonów i intronów, organizacja genomów,porównanie sekwencji
tematy badań
transkryptom wszystkie sekwencje RNA zawarte w organizmie transkryptomikatranskryptomika analiza ekspresji genów
proteom wszystkie białka zawarte w organizmie
proteomikaproteomikaporównanie sekwencji,
identyfikacja zachowanychregionów, przewidywanniestruktury, oddziaływania
metabolom wszystkie procesy metabolicznezachodzące w organizmie,
metabolity
metabolomikametabolomika określanie sieci i szlakówmetabolicznych, symulacje
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Program wykładów
Genomy Sekwencje biologiczne Biologiczne bazy danych Struktury makrocząsteczek biologicznych Elementy biologii systemowej Elementy epigenetyki
…dygresje w stronę biologii, fizyki, chemii
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
zaliczenie
Ćwiczenia:lista obecności & kolokwium (a)
Wykład:kolokwium (b)
Ocena: średnia z ocen z kolokwiów a i b, jeśli obie oceny > 2
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
SekwencjonowanieSekwencjonowanie DNADNA1977Sanger i współpr. – metoda terminacji łańcucha, dideoksy1987Prober i współpr. – znakowanie fluorescencyjne i zautomatyzowanie metody
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Etapy Etapy sekwencjonowaniasekwencjonowania genomgenomóóww
Wybór zachodzących pojedynczych klonów do sekwencjonowania
Oczyszczanie chromosomów
Pofragmentowanie metodą sonikacji na odcinki o długości 100 kpz (kbp) lub większe
Klonowanie fragmentów w wektorach (YAC, BAC)
Tworzenie mapy chromosomu
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
ObrObróóbka sekwencji HTGSbka sekwencji HTGSFaza 0
Faza 1
Faza 2
Faza 3
contigs
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
1977Sanger i współpr. - fag X 174 (5,4 tys. pz)
SekwencjonowanieSekwencjonowanie genomgenomóóww
1995Fleischmann i współpr. - Haemophilus influenzae (1.8 mln pz)
1981Anderson i współpr. - mtDNA człowieka (17 tys. pz)
Fraser i współpr. - Mycoplasma genitalium (0.6 mln pz)
1997Blattner i współpr. – Escherichia coli (4.6 mln pz)Kunst i współpr. – Bacillus subtilis (4.2 mln pz)
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
19961997
Goffeau i współpr. Saccharomyces cerevisiae (13 mln pz)
SekwencjonowanieSekwencjonowanie genomgenomóóww
1998The C. elegans Sequencing ConsortiumCaenorhabditis elegans (100 mln pz)
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Human Genome Projectod 1990
Celera Genomicsod 1998
VI 2000OIgłoszenie zakończenie prac nad wstępną wersją genomu ludzkiego; zsekwencjonowano:
85 %99 %Konferencja prasowa w Białym Domu w towarzystwie premiera Wielkiej Brytanii i prezydenta USA. Zespoły HPG oraz Celery postanowiły ze sobą współpracować
w końcowej fazie badań po okresie zażartej konkurencji.
SekwencjonowanieSekwencjonowanie genomu czgenomu człłowiekaowieka
Francis CollinsCraig Venter
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Human Genome ProjectCelera Genomics
II 2001niezależna publikacja wyników w:
Venter i współpracownicy THE GENOME INTERNATIONAL SEQUENCING CONSORTIUM
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Kompletnie Kompletnie zsekwencjonowanezsekwencjonowane genomygenomy Eucaryota:
Drosophila melanogaster
Saccharomyces cerevisiae Schizosaccharomyces pombe Candida glabratha Encephalitozoon cuniculi GB-M1….
Caenorhabditis elegans
Entamoeba histolytica Plasmodium falciparum Trypanosoma cruzi….
Homo sapiens Mus musculus
Arabidopsis thaliana Oryza sativa
KRĘGOWCE (3)
ROŚLINY (5)
OWADY (2)
GRZYBY (17)
PIERWOTNIAKI (8)
NICIENIE (1)
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
„Prywatne” genomymedycyna zindywidualizowana?
James Watson (2008) Craig Venter (2007)
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)