Вяххи Н. Обучение биоинформатике. Форматы и опыт

27
Обучение биоинформатике Николай Вяххи vyahhi@bioinformaticsinstitute.ru BDBM 2014, June 30

Upload: bigdatabm

Post on 07-Jul-2015

214 views

Category:

Education


3 download

TRANSCRIPT

Page 1: Вяххи Н. Обучение биоинформатике. Форматы и опыт

Обучение биоинформатике

Николай Вяххи[email protected]

BDBM 2014, June 30

Page 2: Вяххи Н. Обучение биоинформатике. Форматы и опыт

!Algorithmic+Biology+Laboratory,+St.+Petersburg,+Russia,++

(Founded+in+2011+by+Prof.+P.A.+Pevzner)+!

Number of people involved: 12 Main achievements: SPAdes – single-cell assembler QUAST – Quality Assessment Tool for Genome Assemblies Online bioinformatics platform Rosalind (http://rosalind.info) Computational mass spectrometry (Antibody sequencing) Expertise in the lab: -algorithm design -software design -genome assembly -data analysis needed to work with microbial, fungal and human related projects -computational and comparative genomics, statistical research and analysis

Community+feedback:!"I'd!like!to!thank!you!for!the!great!job!you!are!doing!with!SPAdes.!It's!a!very!useful!so>ware!”!!A !

!!!!!!!!!!!!!!!!!!!!!!Lionel!Guy,!Uppsala!University!“A!so>ware!called!SPAdes!is!proving!to!be!beIer!than!most!other!tools”!Manoj&&Samanta!

& & & & &&“I!have!a!lot!of!love!for!SPAdes!for!bacterial!genome!assembly”!Mick!Watson,!The!Roslin!InsOtute!

Main distinguishing factors of ABL : The combination of all skills, the expertise listed above and the ability to apply both research and customizing

approaches to individual NGS projects and pipelines.

Page 3: Вяххи Н. Обучение биоинформатике. Форматы и опыт

Центр геномной биоинформатики им. Ф.Г. Добржанского СПбГУ

Создание программного обеспечения GWATCH для визуализации, анализа и распространения данных из исследований по полногеномному скринингу ассоциаций (ПГСА, GWAS).

Совместные с международными партнерами исследования по выявлению генов, вовлеченных в развитие или устойчивость к комплексным заболеваниям человека, в том числе изучение ВИЧ-СПИД в США и Ботсване, рака носоглотки в Китае, гепатита B и рака печени.

Исследования по генетической характеристике штаммов возбудителя туберкулеза в связи с их географическим распространением на территории России и создание базы данных GMTV для сбора, хранения и доступа к этим сведениям.

Построение генетической карты и проведение аннотации новой сборки генома домашней кошки, размещение результатов в общем доступе в с помощью разработанного в лаборатории геномного браузера GARField2.

Участие в ряде геномных проектов, в том числе получение хромосомных сборок геномов гепарда, льва, носорога.

Образовательная деятельность: проведение семинаров, открытого курса лекций по биоинформатике, практических тренингов по современным геномным и биоинформатическим технологиям.

Page 4: Вяххи Н. Обучение биоинформатике. Форматы и опыт

Обучение биоинформатике

Николай Вяххи[email protected]

BDBM 2014, June 30

Page 5: Вяххи Н. Обучение биоинформатике. Форматы и опыт

An Explosion OfBioinformatics Careers

Big data is everywhere, and its influence and practical omnipresence across multiple industries will just continue to grow. For life scientists with expertise and an interest in bioinformatics, computer science, statistics, and related skill sets, the job outlook couldn’t be rosier.

But the subject has evolved from a service, like histology, to its own research arena…. Bioinformaticists are now the motor of the innovation.

June 13, 2014http://sciencecareers.sciencemag.org/career_magazine/previous_issues/articles/2014_06_13/science.opms.r1400143

Page 6: Вяххи Н. Обучение биоинформатике. Форматы и опыт

Институтбиоинформатики

Подготовить новое поколение высококвалифицированных специалистов в области биоинформатики, популяризировать биоинформатику в России и содействовать становлению России как мирового исследовательского центра в области биоинформатики.

1. Алгоритмическая биоинформатика (2010)

2. Биоинформатика для биологов (2013)

Page 7: Вяххи Н. Обучение биоинформатике. Форматы и опыт

Алгоритмическая биоинформатика

Анализ данных NGSСтатистикаМолекулярная биология БиотехнологииАлгоритмы в биоинформатикеCравнительная геномикаНаучный проект

Page 8: Вяххи Н. Обучение биоинформатике. Форматы и опыт

Биоинформатикадля биологов

Дискретная математикаПрограммирование на PythonСтатистикаЯзык программирования RApplications in Genome BioInformaticsНаучный проект

Page 9: Вяххи Н. Обучение биоинформатике. Форматы и опыт

Научные проекты

За учебный год студент участвует в двух проектах.

http://bioinformaticsinstitute.ru/projects

Часть проектов индивидуальные, часть – командные, рассчитанные, как правило, на команду из биолога и информатика.

Page 10: Вяххи Н. Обучение биоинформатике. Форматы и опыт

Научные проекты

Page 11: Вяххи Н. Обучение биоинформатике. Форматы и опыт

Научные проекты

Hmmer on GPU

VCF file storage

Assembly scaling bottlenecks

De novo assembly

Deep learning approach in genomics

Haplotype assembly in dipSPAdes

Immunoglobulin folding

Misassemblies detection without reference

Rearrangement-based fragment assembly

Repeat classification in mammalian genomes

Virtual target screening for KY0211 inhibitor

Polymorphism analysis in diploid genomes

Ragout - de Bruijn graph in reference-assisted assembly

Development of algorithms for Extension index data structure

Page 12: Вяххи Н. Обучение биоинформатике. Форматы и опыт

Научные проекты

Working with synteny blocks of different resolution

Аннотация генов в геноме Cuban-Amazon

Естественный отбор и нейтральная эволюция в митохондриальной ДНК различных групп животных

Молекулярные аспекты создания лекарственных препаратов

Оценка качества транскриптомных сборок

Поиск корреляции между метилированием и социальным статусом в геноме человека

Поиск молекулярных маркеров и разработка диагностической системы предрасположенности к клинической депрессии на основе ПЦР

Поиск однонуклеотидных полиморфизмов штаммов Mycobacterium tuberculosis, распространенных в различных регионах мира

Page 13: Вяххи Н. Обучение биоинформатике. Форматы и опыт

Научные проекты

Связь последовательностей с отклонениями в частотах аминокислот с белок-белковыми взаимодействиями

Скаффолдинг бактериальных контигов с использованием нескольких референсов и дерева на примере геномов Gluconacetobacter

Сравнительный анализ данных по РНК-секвенированию раковых клеток с использованием платформы Trinity

Приложение для клинической интерпретации онкоэкзома человека

Скаффолдинг контигов с использованием базы генов

Сборка модели центромерного района хищников

Сборка MHC региона у гепарда / тигра

Page 14: Вяххи Н. Обучение биоинформатике. Форматы и опыт

Отзывы

“Мне кажется, что один месяц в Институте стоит года в бакалавриате биофака!”

“Огромное спасибо за этот учебный курс!”

“Здорово, что вы есть! Обязательно берите биологов на следующий год. Им тоже нужна биоинформатика и они нужны ей!”

“Печеньки, кофе и различные вкусняшки всенепременно радуют! Поднимают моральных дух :) “

“Мне очень нравится учиться в Институте биоинформатики, все читаемые здесь курсы кажутся мне очень осмысленными и интересными, спасибо!”

“Очень здорово получить опыт работы с биологами и информатиками. Курсы тоже классные!”

“Могу только высказать благодарности всем за замечательные учебные курсы и обстановку!”

“Печеньки какие-то странные и их мало.”

Page 15: Вяххи Н. Обучение биоинформатике. Форматы и опыт

Проблемы

Кого учить?

Мало руководителей для начинающих студентов, но выпускники нарасхват

Большая разница в ожиданиях у студентов биологов и информатиков

Совместные занятия скучноваты

Page 16: Вяххи Н. Обучение биоинформатике. Форматы и опыт

Летняя школа

Ежегодное мероприятие для ста студентов, аспирантов и молодых учёных математических, технических и биологических специальностей, интересующихся биоинформатикой.

Кроме лекций и мастер-классов от ведущих ученых, есть возможность выступить с докладом на мини-конференции и постерной сессии.

Page 17: Вяххи Н. Обучение биоинформатике. Форматы и опыт

Летняя школа

Page 18: Вяххи Н. Обучение биоинформатике. Форматы и опыт

Проблемы

Среди подающих на школу много состоявшихся специалистов и постдоков

Сложно балансировать программу

Page 19: Вяххи Н. Обучение биоинформатике. Форматы и опыт

Rosalind

Rosalind is a platform for learning bioinformatics and programming through problem solving.

• Python Village – несколько задач по Python

• Bioinformatics Stronghold – основная, алгоритмическая биоинформатика

• Bioinformatics Armory – инструменты

• Bioinformatics Textbook Track – задачи к учебнику

• Algorithmic Heights – алгоритмы по Dasgupta et al.

http://rosalind.info

Page 20: Вяххи Н. Обучение биоинформатике. Форматы и опыт

Rosalind

18807 пользователей решили ≥1 задачу

228 задач суммарно

292985 попыток решения задач

170655 успешных попыток

117 преподавателей / 1502 студентов

Page 21: Вяххи Н. Обучение биоинформатике. Форматы и опыт
Page 22: Вяххи Н. Обучение биоинформатике. Форматы и опыт

MOOC Bioinformatics Algorithms

Where Does DNA Replication Begin? (Algorithmic Warm-up)

How Do We Sequence Antibiotics? (Brute Force Algorithms)

Which DNA Patterns Act As Cellular Clocks? (Greedy and Randomized Algorithms)

How Do We Assemble Genomes? (Graph Algorithms)

How Do We Compare Biological Sequences? (Dynamic Programming Algorithms)

Are There Fragile Regions in the Human Genome? (Combinatorial Algorithms)

https://www.coursera.org/course/bioinformatics

Page 23: Вяххи Н. Обучение биоинформатике. Форматы и опыт

MOOC

Page 24: Вяххи Н. Обучение биоинформатике. Форматы и опыт

MOOC

Page 25: Вяххи Н. Обучение биоинформатике. Форматы и опыт

MOOC

Page 26: Вяххи Н. Обучение биоинформатике. Форматы и опыт

Благодарности

+ http://bioinformaticsinstitute.ru/teachers

Page 27: Вяххи Н. Обучение биоинформатике. Форматы и опыт

Спасибо!

Николай Вяххи[email protected]

BDBM 2014, June 30