fbpx

Czym zajmuje się bioinformatyka?

Grzegorz Papaj , 13 maja 2020

Bioinformatyka

Bioinformatyka jest dyscypliną naukową sytuującą się, jak nietrudno się domyślić, na przecięciu biologii i informatyki. Jednakże to czerpie również z innych dziedzin nauk ścisłych, jak chemia i fizyka. W niniejszym artykule omówimy pokrótce najważniejsze obszary badań bioinformatyki.

Historia

Bioinformatyka zaczęła wyodrębniać się z nauk biologicznych, w szczególności z biochemii i biologii molekularnej, już w połowie XX wieku, gdy dwukrotny noblista Frederic Sanger określił pierwszorzędową strukturę insuliny, czyli jej sekwencję aminokwasową.

Wraz z ustalaniem sekwencji kolejnych białek stało się jasne, iż generowane dane są zbyt duże, by mogły być wygodnie przechowywane i analizowane bez wyspecjalizowanych narzędzi. Pionierką informatyzacji biologicznych danych została Margaret Oakley Dayhoff, twórczyni pierwszego zbioru wszystkich znanych sekwencji białkowych. Jej opublikowany w 1965 roku Atlas of Protein Sequence and Structure, zawierający 65 sekwencji, wydany był jeszcze w wersji książkowej. Po wielokrotnych aktualizacjach stał się podstawą opublikowanej w 1984 roku pierwszej bazy sekwencji białkowych online (Protein Information Resource).

Prace Dayhoff objęły nie tylko zbieranie sekwencji białkowych, lecz również utworzenie pierwszych algorytmów i programów porównujących sekwencje białkowe, tworząc podwaliny analizy porównawczej i filogenetecznej.

Równolegle powstawały analogiczne zbiory sekwencji nukleotydowych. Pierwszą opublikowaną online bazą sekwencji DNA jest GenBank, uruchomiony 1982 roku, a wiec niedługo przed PIR. Uruchomienie GenBank można uznać za symboliczną datę początków współczesnej bioinformatyki.

Bioinformatyka

Teraźniejszość

Prawdziwy rozkwit bioinformatyka przeżyła na przełomie XX i XXI wieku, w czasie, gdy znacząco spadły ceny komputerów, a jednocześnie znacząco wzrosła ich moc obliczeniowa. Nie bez znaczenia była również popularyzacja Internetu jako medium umożliwiającego dostęp do szeregu baz i różnego rodzaju naukowych serwisów obliczeniowych. Równoczesny rozwój technologii obliczeń rozproszonych i powstające w wielu ośrodkach naukowych klastry obliczeniowe o niewyobrażalnej wcześniej mocy sprawiły, że problemy z przyczyn praktycznych wcześniej pozostające poza zasięgiem badaczy zaczęły być rutynowo rozwiązywane. Dzięki dostępowi do dużej mocy obliczeniowej wyniki kalkulacji, na które wcześniej czekało się dni czy tygodnie, można było otrzymać w czasie godzin czy minut.

Dzięki postępującemu spadkowi cen infrastruktury IT wyposażenie w sprzęt nowoczesnego laboratorium bioinformatycznego kosztuje obecnie ułamek kwot niezbędnych do wyekwipowania laboratorium biologicznego czy chemicznego w choćby podstawowy sprzęt. Olbrzymie zasoby danych biologicznych są dostępne bezpłatnie w internecie nie tylko w postaci "surowych" danych, lecz również w postaci narzędzi, przeprowadzających na nich szeregi obliczeń i analiz.

Dzięki powyższym czynnikom bioinformatyka nie jest już przedmiotem akademickim uprawianym gdzieś na marginesach wydziałów matematyki czy biologii, lecz samodzielną i pełnoprawną dyscypliną naukową. Wyniki jej badań nie tylko wpływają na rzeczywistość naukową, lecz mają ogromny wpływ na współczesną farmakologię i medycynę. Nie bez powodu wielu ekspertów właśnie w bioinformatyce upatruje przyszłości nauk biomedycznych, a w praktycznie każdym związanym z biologią molekularną ośrodku naukowym czy badawczym powstało laboratorium lub przynajmniej grupa specjalizująca się w jakimś obszarze bioinformatyki.

Struktura białka

Główne obszary badań bioinformatyki

Rozkwit dziedzin bioinformatycznych związanych z gromadzeniem i przetwarzaniem sekwencji białkowych i nukleotydowych spowodował w krótkim czasie eksplozję innych kierunków badawczych, tej dyscypliny.

I tak w największym skrócie aktualnie można wyróżnić następujące obszary badań bioinformatycznych:

  • analizy sekwencji,
  • badania nad ekspresją,
  • badania strukturalne,
  • analizy systemów biologicznych,
  • badania nad organizacją komórkową.

Analizy sekwencji

Analizy sekwencyjne to najstarszy obszar badań współczesnej bioinformatyki, którego przedmiotem są:

  • sekwencje aminokwasowe białek,
  • sekwencje nukleotydowe (DNA i RNA).

Do działu tego zaliczyć można:

  • badania nad dopasowywaniem (alignments) i porównywaniem sekwencji,
  • rozwój metod związanych ze składaniem (assembly) sekwencji i genomów,
  • opisywanie genów i genomów,
  • analizy filogenetyczne i ewolucyjne poszczególnych genów jak i całych genomów,
  • analizy mutacji punktowych (zwłaszcza w genomie człowieka) i związanych z nimi chorób genetycznych.
Drzewo filogenetyczne

Badania ekspresji

Badania nad ekspresją i współekspresją zarówno na poziomie mRNA jaki i białek pozwalają na analizę zależności i powiązań pomiędzy działaniem produktów różnych genów.

W obszarze tym wykorzystywane są dane pochodzące z wysokoprzepustowych metod badawczych, takich jak mikromacierze, SAGE (Serial Analysis of Gene Expression) czy HTMS (high throughput mass spectrometry).

Bioinformatyka strukturalna

Przedmiotem badań bioinformatyki strukturalnej są struktury makromolekuł (białek, RNA, kompleksy makromolekuł).

Badane struktury pochodzić mogą być ustalane zarówno eksperymentalnie (metody krystalograficzne, NMR, mikroskopy sił atomowych) jak i przewidywane za pomocą metod obliczeniowych (modelowanie struktur).

Wyniki badań bioinformatyki strukturalnej są szeroko stosowane w analizie interakcji, szczególnie przydatnej farmakologii. Techniki takie jak virtual screeningmolecular docking obecnie stanowią pierwszy etap przy projektowaniu nowych leków.

Bioinformatyka systemów

Wzajemne powiązania pomiędzy różnymi białkami, sieci wzajemnej regulacji i sprzężeń zwrotnych i szeroko pojęte modelowanie interakcji między makromolekułami są przedmiotem badań bioinformatyki systemów.

W jej obszarze modelowaniu, mapowaniu i wizualizacji podlegają rozmaite szlaki metaboliczne i sygnałowe, wzajemne wpływy, powiązania i interakcje.

Badania nad organizacją komórkową

Metody bioinformatyczne znalazły również zastosowanie w badaniach nad organizacją komórkową. Skupiają się przede wszystkim nad rozwojem algorytmów i narzędzi związanych z przetwarzaniem wyników pochodzących z różnego rodzaju technik obrazowania mikroskopowego.

Wyniki tych badań prowadzą do informacji o lokalizacji poszczególnych białek i cząsteczek RNA w konkretnych przedziałach komórkowych czy identyfikacji oddziaływań w obrębie chromosomów.

Struktury drugorzędowe białka

Inne

Wyżej wymienione zagadnienia nie stanowią pełnej listy tematów wchodzących w skład bioinformatyki. Jest to dziedzina nadal bardzo młoda i dynamiczna, stale wchodząca w nowe obszary badawcze. Bioinformatyka korzysta nie tylko z metod typowo obliczeniowych, lecz coraz częściej tworzone są nowe wysokoprzepustowe techniki eksperymentalne, generujące terabajty danych.

Osobnym obszarem prac bioinformatycznych jest rozwój nowych algorytmów i narzędzi (oprogramowanie, bazy danych, systemy typu workflow), które ułatwiają i automatyzują pracę z danymi bioinformatycznymi.

Podsumowanie

Bioinformatyka jest aktualnie samodzielną i bardzo prężnie rozwijają cą się dyscypliną naukową, znajdującą zastosowanie nie tylko w badaniach podstawowych, lecz również w diagnostyce, medycynie (w tym medycynie spersonalizowanej), farmakologii i farmakoterapii.

Stanowi olbrzymie pole do popisu zarówno dla naukowców i badaczy jak również dla algorytmików i programistów. Wszystko wskazuje na to, że w przyszłości możemy się spodziewać kolejnych przełomów biomedycznych, które bazować będą właśnie na osiągnięciach bioinformatyki.

1