Вяххи Н. Обучение биоинформатике. Форматы и опыт

Post on 07-Jul-2015

214 Views

Category:

Education

3 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Обучение биоинформатике

Николай Вяххиvyahhi@bioinformaticsinstitute.ru

BDBM 2014, June 30

!Algorithmic+Biology+Laboratory,+St.+Petersburg,+Russia,++

(Founded+in+2011+by+Prof.+P.A.+Pevzner)+!

Number of people involved: 12 Main achievements: SPAdes – single-cell assembler QUAST – Quality Assessment Tool for Genome Assemblies Online bioinformatics platform Rosalind (http://rosalind.info) Computational mass spectrometry (Antibody sequencing) Expertise in the lab: -algorithm design -software design -genome assembly -data analysis needed to work with microbial, fungal and human related projects -computational and comparative genomics, statistical research and analysis

Community+feedback:!"I'd!like!to!thank!you!for!the!great!job!you!are!doing!with!SPAdes.!It's!a!very!useful!so>ware!”!!A !

!!!!!!!!!!!!!!!!!!!!!!Lionel!Guy,!Uppsala!University!“A!so>ware!called!SPAdes!is!proving!to!be!beIer!than!most!other!tools”!Manoj&&Samanta!

& & & & &&“I!have!a!lot!of!love!for!SPAdes!for!bacterial!genome!assembly”!Mick!Watson,!The!Roslin!InsOtute!

Main distinguishing factors of ABL : The combination of all skills, the expertise listed above and the ability to apply both research and customizing

approaches to individual NGS projects and pipelines.

Центр геномной биоинформатики им. Ф.Г. Добржанского СПбГУ

Создание программного обеспечения GWATCH для визуализации, анализа и распространения данных из исследований по полногеномному скринингу ассоциаций (ПГСА, GWAS).

Совместные с международными партнерами исследования по выявлению генов, вовлеченных в развитие или устойчивость к комплексным заболеваниям человека, в том числе изучение ВИЧ-СПИД в США и Ботсване, рака носоглотки в Китае, гепатита B и рака печени.

Исследования по генетической характеристике штаммов возбудителя туберкулеза в связи с их географическим распространением на территории России и создание базы данных GMTV для сбора, хранения и доступа к этим сведениям.

Построение генетической карты и проведение аннотации новой сборки генома домашней кошки, размещение результатов в общем доступе в с помощью разработанного в лаборатории геномного браузера GARField2.

Участие в ряде геномных проектов, в том числе получение хромосомных сборок геномов гепарда, льва, носорога.

Образовательная деятельность: проведение семинаров, открытого курса лекций по биоинформатике, практических тренингов по современным геномным и биоинформатическим технологиям.

Обучение биоинформатике

Николай Вяххиvyahhi@bioinformaticsinstitute.ru

BDBM 2014, June 30

An Explosion OfBioinformatics Careers

Big data is everywhere, and its influence and practical omnipresence across multiple industries will just continue to grow. For life scientists with expertise and an interest in bioinformatics, computer science, statistics, and related skill sets, the job outlook couldn’t be rosier.

But the subject has evolved from a service, like histology, to its own research arena…. Bioinformaticists are now the motor of the innovation.

June 13, 2014http://sciencecareers.sciencemag.org/career_magazine/previous_issues/articles/2014_06_13/science.opms.r1400143

Институтбиоинформатики

Подготовить новое поколение высококвалифицированных специалистов в области биоинформатики, популяризировать биоинформатику в России и содействовать становлению России как мирового исследовательского центра в области биоинформатики.

1. Алгоритмическая биоинформатика (2010)

2. Биоинформатика для биологов (2013)

Алгоритмическая биоинформатика

Анализ данных NGSСтатистикаМолекулярная биология БиотехнологииАлгоритмы в биоинформатикеCравнительная геномикаНаучный проект

Биоинформатикадля биологов

Дискретная математикаПрограммирование на PythonСтатистикаЯзык программирования RApplications in Genome BioInformaticsНаучный проект

Научные проекты

За учебный год студент участвует в двух проектах.

http://bioinformaticsinstitute.ru/projects

Часть проектов индивидуальные, часть – командные, рассчитанные, как правило, на команду из биолога и информатика.

Научные проекты

Научные проекты

Hmmer on GPU

VCF file storage

Assembly scaling bottlenecks

De novo assembly

Deep learning approach in genomics

Haplotype assembly in dipSPAdes

Immunoglobulin folding

Misassemblies detection without reference

Rearrangement-based fragment assembly

Repeat classification in mammalian genomes

Virtual target screening for KY0211 inhibitor

Polymorphism analysis in diploid genomes

Ragout - de Bruijn graph in reference-assisted assembly

Development of algorithms for Extension index data structure

Научные проекты

Working with synteny blocks of different resolution

Аннотация генов в геноме Cuban-Amazon

Естественный отбор и нейтральная эволюция в митохондриальной ДНК различных групп животных

Молекулярные аспекты создания лекарственных препаратов

Оценка качества транскриптомных сборок

Поиск корреляции между метилированием и социальным статусом в геноме человека

Поиск молекулярных маркеров и разработка диагностической системы предрасположенности к клинической депрессии на основе ПЦР

Поиск однонуклеотидных полиморфизмов штаммов Mycobacterium tuberculosis, распространенных в различных регионах мира

Научные проекты

Связь последовательностей с отклонениями в частотах аминокислот с белок-белковыми взаимодействиями

Скаффолдинг бактериальных контигов с использованием нескольких референсов и дерева на примере геномов Gluconacetobacter

Сравнительный анализ данных по РНК-секвенированию раковых клеток с использованием платформы Trinity

Приложение для клинической интерпретации онкоэкзома человека

Скаффолдинг контигов с использованием базы генов

Сборка модели центромерного района хищников

Сборка MHC региона у гепарда / тигра

Отзывы

“Мне кажется, что один месяц в Институте стоит года в бакалавриате биофака!”

“Огромное спасибо за этот учебный курс!”

“Здорово, что вы есть! Обязательно берите биологов на следующий год. Им тоже нужна биоинформатика и они нужны ей!”

“Печеньки, кофе и различные вкусняшки всенепременно радуют! Поднимают моральных дух :) “

“Мне очень нравится учиться в Институте биоинформатики, все читаемые здесь курсы кажутся мне очень осмысленными и интересными, спасибо!”

“Очень здорово получить опыт работы с биологами и информатиками. Курсы тоже классные!”

“Могу только высказать благодарности всем за замечательные учебные курсы и обстановку!”

“Печеньки какие-то странные и их мало.”

Проблемы

Кого учить?

Мало руководителей для начинающих студентов, но выпускники нарасхват

Большая разница в ожиданиях у студентов биологов и информатиков

Совместные занятия скучноваты

Летняя школа

Ежегодное мероприятие для ста студентов, аспирантов и молодых учёных математических, технических и биологических специальностей, интересующихся биоинформатикой.

Кроме лекций и мастер-классов от ведущих ученых, есть возможность выступить с докладом на мини-конференции и постерной сессии.

Летняя школа

Проблемы

Среди подающих на школу много состоявшихся специалистов и постдоков

Сложно балансировать программу

Rosalind

Rosalind is a platform for learning bioinformatics and programming through problem solving.

• Python Village – несколько задач по Python

• Bioinformatics Stronghold – основная, алгоритмическая биоинформатика

• Bioinformatics Armory – инструменты

• Bioinformatics Textbook Track – задачи к учебнику

• Algorithmic Heights – алгоритмы по Dasgupta et al.

http://rosalind.info

Rosalind

18807 пользователей решили ≥1 задачу

228 задач суммарно

292985 попыток решения задач

170655 успешных попыток

117 преподавателей / 1502 студентов

MOOC Bioinformatics Algorithms

Where Does DNA Replication Begin? (Algorithmic Warm-up)

How Do We Sequence Antibiotics? (Brute Force Algorithms)

Which DNA Patterns Act As Cellular Clocks? (Greedy and Randomized Algorithms)

How Do We Assemble Genomes? (Graph Algorithms)

How Do We Compare Biological Sequences? (Dynamic Programming Algorithms)

Are There Fragile Regions in the Human Genome? (Combinatorial Algorithms)

https://www.coursera.org/course/bioinformatics

MOOC

MOOC

MOOC

Благодарности

+ http://bioinformaticsinstitute.ru/teachers

Спасибо!

Николай Вяххиvyahhi@bioinformaticsinstitute.ru

BDBM 2014, June 30

top related