bioinformatyka - strefa studenta - wydział rolnictwa i...

27
Bioinformatyka wykłady dla I r. studiów magisterskich, biologia (SGGW) 2012 / 2013 Krzysztof Pawłowski You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

Upload: truongnhan

Post on 28-Feb-2019

218 views

Category:

Documents


0 download

TRANSCRIPT

Bioinformatyka

wykłady dla I r. studiów magisterskich, biologia (SGGW)2012 / 2013

Krzysztof Pawłowski

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

Wykład 8.X.2012

Co to jest bioinformatyka? Program wykładów Zastosowanie bioinformatyki:

sekwencjonowanie genomów

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

Rozwiązywanie problemów biologicznych metodami obliczeniowymi

Solving biological problems by computational means

Some synonyms: In silico biology Computational biology / Biocomputing Theoretical biology

Substantial overlaps: Computational chemistry / cheminformatics Systems biology Structural biology Theoretical biophysics

„definicja”bioinformatyki / biologii obliczeniowej

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

• Objects: small molecules, structural motifs and domains, proteins, transcripts, genes, organelles, cells, tissues, organs, organisms

• Objects’ attributes: sequences, 3-D structures, expression data, clinical data, publications,….

Zakres zainteresowańbioinformatyki

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

„oficjalne” definicje NIH

Bioinformatics: approaches for expanding the use of biological, medical, behavioral or health data, including those to acquire, store, organize, archive, analyze, or visualize such data.

Computational Biology: The development and application of data-analytical and theoretical methods, mathematical modeling and computational simulation techniques to the study of biological, behavioral, and social systems.

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

Bioinformatics (wikipedia)

Bioinformatics and computational biology involve the use or development of techniques, including applied mathematics, informatics, statistics, computer science, artificial intelligence, chemistry, and biochemistry to solve biological problems, usually on the molecular level.

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

Bioinformatics (wikipedia, contd.)

The primary goal of bioinformatics is to increase our understanding of biological processes. What sets it apart from other approaches, however, is its focus on developing and applying computationally intensive techniques (e.g., data mining, and machine learning algorithms) to achieve this goal. Major research efforts in the field include sequence alignment, gene finding, genome assembly, protein structure alignment, protein structure prediction, prediction of gene expression and protein-protein interactions, and the modeling of evolution.

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

Bioinformatyka (wikipedia)

Bioinformatyka to dyscyplina zajmująca się stosowaniem narzędzi matematycznych i informatycznych do rozwiązywania problemów z nauk biologicznych. Z bioinformatyką powiązane są: genomika, proteomika, metabolomika i transkryptomika.

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

„bioinformatyka” – nowa dyscyplina?

…ale pod innymi nazwami rozwijała sięprzynajmniej od lat 60.

Publikacje bioinformatyczne (PubMed)

1

10

100

1000

10000

100000

1988

1989

1990

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

2006

2007

2008

2009

2010

2011

2012

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

Dygresja.Syn na zawsze w głowie matkiWojciech Moskal, sciencemag.org30.09.2012 , aktualizacja: 30.09.2012 16:35

Kobiety, które są w ciąży z chłopcami, zatrzymują część ich materiału genetycznego. Synowskie DNA rozsiewa się nawet do matczynych mózgów - dowiedli naukowcy z USA Powiedzenie, że syn jest oczkiem w głowie matki, nabiera więc całkiem

nowego znaczenia. W końcu oko to narząd zmysłu, jest więc integralnączęścią układu nerwowego. A uczeni z Ośrodka Badań nad Rakiem im. Freda Hutchinsona w Seattle pracujący pod wodzą dr J. Lee Nelson znaleźli obcy materiał genetyczny w najważniejszej części tego układu - korze mózgowej. Co więcej, to specyficzne "zanieczyszczenie", opisane w ostatnim wydaniu magazynu "PloS ONE", prawdopodobnie chroni matkęprzed niektórymi chorobami.

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

Bioinformatyka w Google

17 500 000

47 300 241 000 1 160 000 1 140 000 1 730 000

126 000 000

27 700 000

bioin

formati

cs

bioin

formaty

ka

bioin

formati

ka

bioin

formati

k

bioin

formati

ca

bioin

formati

que

biolo

gy

biolo

gia

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

bioinformatyka

BIOINFORMATYKA BIOINFORMATYKA -- dziedzina interdyscyplinarnadziedzina interdyscyplinarna

biologia (molekularna)dane biologiczne

informatyka narzędzia,metody

i obliczenia komputerowe= +

fizyka i chemia

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

BIOINFORMATYKA BIOINFORMATYKA -- celecele

Organizowanie i zarządzanie informacjami o makrocząsteczkach i innych danych biologicznych w formieskomputeryzowanych (cyfrowych) zapisów - baz danych

Analiza tych danych za pomocą metod obliczeniowych, rozwój metod i algorytmów

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

DNA

BIOINFORMATYKA BIOINFORMATYKA -- poziomy analizpoziomy analiz

mRNA

białka

interakcje i metabolizm

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

genom

BIOINFORMATYKA BIOINFORMATYKA -- poziomy analizpoziomy analiz

wszystkie sekwencje DNA zawarte w organizmie, geny,

sekwencje regulatorowe

genomikagenomika

poziom badań przedmiot badań dziedzina badań

poszukiwanie sekwencjikodujących, rozpoznawanie

eksonów i intronów, organizacja genomów,porównanie sekwencji

tematy badań

transkryptom wszystkie sekwencje RNA zawarte w organizmie transkryptomikatranskryptomika analiza ekspresji genów

proteom wszystkie białka zawarte w organizmie

proteomikaproteomikaporównanie sekwencji,

identyfikacja zachowanychregionów, przewidywanniestruktury, oddziaływania

metabolom wszystkie procesy metabolicznezachodzące w organizmie,

metabolity

metabolomikametabolomika określanie sieci i szlakówmetabolicznych, symulacje

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

Program wykładów

Genomy Sekwencje biologiczne Biologiczne bazy danych Struktury makrocząsteczek biologicznych Elementy biologii systemowej Elementy epigenetyki

…dygresje w stronę biologii, fizyki, chemii

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

zaliczenie

Ćwiczenia:lista obecności & kolokwium (a)

Wykład:kolokwium (b)

Ocena: średnia z ocen z kolokwiów a i b, jeśli obie oceny > 2

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

SekwencjonowanieSekwencjonowanie DNADNA1977Sanger i współpr. – metoda terminacji łańcucha, dideoksy1987Prober i współpr. – znakowanie fluorescencyjne i zautomatyzowanie metody

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

Etapy Etapy sekwencjonowaniasekwencjonowania genomgenomóóww

Wybór zachodzących pojedynczych klonów do sekwencjonowania

Oczyszczanie chromosomów

Pofragmentowanie metodą sonikacji na odcinki o długości 100 kpz (kbp) lub większe

Klonowanie fragmentów w wektorach (YAC, BAC)

Tworzenie mapy chromosomu

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

ObrObróóbka sekwencji HTGSbka sekwencji HTGSFaza 0

Faza 1

Faza 2

Faza 3

contigs

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

1977Sanger i współpr. - fag X 174 (5,4 tys. pz)

SekwencjonowanieSekwencjonowanie genomgenomóóww

1995Fleischmann i współpr. - Haemophilus influenzae (1.8 mln pz)

1981Anderson i współpr. - mtDNA człowieka (17 tys. pz)

Fraser i współpr. - Mycoplasma genitalium (0.6 mln pz)

1997Blattner i współpr. – Escherichia coli (4.6 mln pz)Kunst i współpr. – Bacillus subtilis (4.2 mln pz)

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

19961997

Goffeau i współpr. Saccharomyces cerevisiae (13 mln pz)

SekwencjonowanieSekwencjonowanie genomgenomóóww

1998The C. elegans Sequencing ConsortiumCaenorhabditis elegans (100 mln pz)

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

Human Genome Projectod 1990

Celera Genomicsod 1998

VI 2000OIgłoszenie zakończenie prac nad wstępną wersją genomu ludzkiego; zsekwencjonowano:

85 %99 %Konferencja prasowa w Białym Domu w towarzystwie premiera Wielkiej Brytanii i prezydenta USA. Zespoły HPG oraz Celery postanowiły ze sobą współpracować

w końcowej fazie badań po okresie zażartej konkurencji.

SekwencjonowanieSekwencjonowanie genomu czgenomu człłowiekaowieka

Francis CollinsCraig Venter

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

Human Genome ProjectCelera Genomics

II 2001niezależna publikacja wyników w:

Venter i współpracownicy THE GENOME INTERNATIONAL SEQUENCING CONSORTIUM

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

Kompletnie Kompletnie zsekwencjonowanezsekwencjonowane genomygenomy Eucaryota:

Drosophila melanogaster

Saccharomyces cerevisiae Schizosaccharomyces pombe Candida glabratha Encephalitozoon cuniculi GB-M1….

Caenorhabditis elegans

Entamoeba histolytica Plasmodium falciparum Trypanosoma cruzi….

Homo sapiens Mus musculus

Arabidopsis thaliana Oryza sativa

KRĘGOWCE (3)

ROŚLINY (5)

OWADY (2)

GRZYBY (17)

PIERWOTNIAKI (8)

NICIENIE (1)

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

„Prywatne” genomymedycyna zindywidualizowana?

James Watson (2008) Craig Venter (2007)

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)