Přehled

ENCODE (Encyclopedia of DNA Elements) je velký mezinárodní výzkumný program zahájený v roce 2003 s cílem identifikovat a popsat funkční prvky v lidském genomu. Projekt se soustředí na oblasti DNA, které ovlivňují transkripci, regulaci genů a chromatinovou strukturu, a to i v částech genomu, které nepřekladají proteiny. Více informací o projektu najdete na oficiálních stránkách ENCODE a o zapojených institucích na stránce o spolupracovnících.

Hlavní nálezy

Výsledky konsorcia zásadně rozšířily pohled na funkčnost genomu. Mezi klíčové poznatky patří:

  • Podíl genomu přímo kódujícího proteiny je relativně malý; proteiny jsou kódovány zhruba v 1 % celé sekvence. S využitím dostupných evidencí byly identifikovány desítky tisíc genů a jejich izoform.
  • Projekt systematicky mapoval promotorové sekvence a další regulační oblasti; rozsáhlé soubory promotorů jsou dostupné přes odkazy na promotory.
  • Byla identifikována velká čísla potenciálních enhancerů a dalších distálních regulačních prvků, které ovlivňují expresi genů na vzdálenost.
  • Analýzy ukázaly, že značná část genomu vykazuje určitý biochemický evidence activity, tedy oblasti vázající proteiny, transkribované nebo jinak chemicky modifikované; o „biochemické funkci“ genomu se diskutuje jako o širším spektru aktivit než jen o kódování proteinů.
  • Výsledky také podpořily názor, že evoluce fenotypických rozdílů závisí nejen na mutacích v kódujících sekvencích, ale také na variacích v regulačních sekvencích DNA a jejich interakcích s transkripčními faktory (evoluční souvislosti, sekvence DNA).

Metody a rozsah práce

Konsorcium používalo široké spektrum experimentálních a výpočetních technik. Mezi hlavní metody patřilo sekvenování RNA a mapování transkriptů (RNA, přepsaná RNA), identifikace míst vazby transkripčních faktorů pomocí ChIP-seq a dalších technik, a profilování epigenetických značek, zejména modifikací histonů (modifikace histonů), které naznačují aktivní nebo tišená regulační centra. Práce zahrnovala stovky až tisíce experimentů napříč desítkami až stovkami buněčných typů, aby byl pokryt širý repertoár buněčných stavů a kontextů.

Organizace, historie a spolupráce

ENCODE spojil stovky vědců v mnoha zemích a institucích. Kromě laboratoří v USA se na projektu podílely týmy v Velké Británii, Španělsku, Singapuru a Japonsku a dalších lokalitách. Výsledky byly publikovány v otevřených přístupech a souborech dat, což umožnilo široké využití komunitou genomiky a bioinformatiky. Projekt je často citován jako model velkých kooperativních biologických iniciativ.

Význam, aplikace a omezení

ENCODE významně rozšířil znalosti o tom, které části genomu mají regulační úlohu, a poskytl referenční mapy pro interpretaci lidských genetických variant. Tyto mapy pomáhají lépe chápat spojení mezi variantami identifikovanými v populačních studiích a jejich možným vlivem na genovou expresi a nemoci. Zároveň je třeba rozlišovat mezi „biochemickou aktivitou“ a prokazatelnou biologickou funkcí: ne každá oblast s chemickou známkou má nutně kritickou funkci v organismu a interpretace dat vyžaduje opatrnost.

Vývoj po publikaci a další směřování

Po hlavních publikacích projektu ENCODE následovaly další iniciativy zaměřené na funkční validaci elementů, integraci dat s klinickými studiemi a porovnávání regulačních sítí mezi druhy, aby se lépe vysvětlily rozdíly v druzích a jejich fenotypech. Pokračující práce také rozšiřuje katalog transkripčních regulátorů, mapuje vazby specifické pro buňky a časové body a hodnotí dopad genetických variant na regulaci. Pro hlubší seznámení s metodami a datovými sadami jsou dostupné primární zdroje a repozitáře, k nimž vedou odkazy v textu.

Pro další čtení a přístup k datům navštivte příslušné sekce: projekt ENCODE, data o spolupracích a zapojení laboratoří, nebo konkrétní mapy promoterů, enhancerů a vazeb přes odkazy na sekce o promotorech, biochemické aktivitě a epigenetických znacích.