Prosiect gwyddonol yw Ensembl sydd yn cael ei redeg ar y cyd gan y Sefydliad Biowybodeg Ewropeaidd a Sefydliad Sanger yr Ymddiriedolaeth Wellcome. Cafodd ei lansio yn 1999 fel yr oedd Prosiect y Genom Dynol yn dirwyn i ben.[1] Nod y prosiect yw i ddarparu adnodd canolog ar gyfer genetegwyr, biolegwyr moleciwlaidd ac ymchwilwyr eraill sy'n astudio genomau dynol, fertebrau eraill ac organebau model.[2] Mae Ensembl yn un o lawer o borwyr genom a ddefnyddir gan wyddonwyr ar gyfer adalw gwybodaeth genomig.

Ensembl
Enghraifft o'r canlynolcronfa ddata ar-lein, biological database Edit this on Wikidata
Rhan oGENCODE, ELIXIR EMBL-EBI Node Edit this on Wikidata
Gwladwriaethy Deyrnas Unedig Edit this on Wikidata
Gwefanhttp://www.ensembl.org/ Edit this on Wikidata
Tudalen Comin Ffeiliau perthnasol ar Gomin Wicimedia

Cefndir

golygu

Mae'r genom dynol yn cynnwys tri biliwn pâr o fasau, sy'n codio am tua 20,000–25,000 genyn. Ond does dim llawer i'w ganfod o wybod dilyniant y genom ar ben ei hun heb wybod hefyd am leoliadau genynau a'r cysylltiadau rhyngddynt. Mae modd anodi'r lleoliadau yma â llaw, gan ddefnyddio data o arbrofion wedi eu cyhoeddi mewn cyfnodolion gwyddonol. Fodd bynnag, mae hyn yn waith araf a dyfal. Opsiwn arall yw anodiad awtomatig – defnyddio pŵer cyfrifiadurol i gymharu dilyniannau protein a DNA.

Yn y prosiect Ensembl, mae data dilyniant genom yn cael ei fwydo i mewn i system anodi gyfrifiadurol (cyfres o sgriptiau yn yr iaith gyfrifiadurol Perl), gan greu casgliad o leoliadau genynau rhagweledig a'u harbed mewn cronfa ddata ar gyfer eu hymdrin ymhellach. Mae Ensembl yn rhyddhau'r holl wybodaeth i'w defnyddio gan y gymuned ymchwil fyd-eang. Gall unrhyw un lawrlwytho data a chôd y prosiect,[3] ac mae gweinydd cronfa ddata agored ar gael er mwyn cysylltu o bell. Mae gwefan Ensembl hefyd yn cynnwys dadansoddiadau gweledol o lawer o'r data.

Dros amser, mae'r prosiect wedi ei ehangu i gynnwys organebau ychwanegol (gan gynnwys organebau model pwysig megis llygod, pryfed ffrwythau a physgod rhesog), yn ogystal ag ystod ehangach o wybodaeth genomig, gan gynnwys amrywiadau genetig a nodweddion rheoli. Ers mis Ebrill 2009, mae chwaer-brosiect i Ensembl wedi estyn ffiniau'r prosiect i gynnwys anifeiliaid heb asgwrn cefn, planhigion, ffyngau, bacteria, a protistiaid, tra bo'r prosiect gwreiddiol yn dal i ganolbwyntio ar fertebratau.

Dangos data genomig

golygu
 
Sgrinlun o borwr genom Ensembl yn dangos y genyn SGCB wedi alino i'r genom dynol.

Rhan bwysig o brosiect Ensembl yw'r gallu i greu deleweddau awtomatig o enynau a data genetig eraill wedi alino at enom cyfeirio. Mae data fel hyn yn cael ei ddangos fel traciau data, a gall defnyddwyr droi'r traciau ymlaen neu i ffwrdd er mwyn gallu edrych ar nodweddion sydd o ddiddordeb iddynt. Mae rhyngwyneb Ensembl hefyd yn galluogi defnyddwyr i chwyddo mannau penodol o'r genom neu symud ar hyd y genom yn hawdd.

Gall y porwr hefyd ddangos data ar gydraniadau gwahanol, o ddangos caryoteipiau cyfan i ddangos dilyniannau DNA ac asidau amino yn fanwl. Mae hefyd modd o edrych ar ddilyniannau tebyg trwy ddiagramau coeden a chymharu genynau cyfatebol mewn ystod o rywogaethau. Gall Ensembl hefyd roi'r un wybodaeth mewn fformatiau eraill, ee FASTA, er mwyn defnyddio'r data mewn rhaglenni eraill.

Gellir agor data o raglenni eraill yn Ensembl hefyd, un ai drwy ddefnyddio gweinydd arlein neu drwy uwchlwytho ffeil mewn fformat cydweddol, megis BAM, BED neu PSL.

Rhywogaethau

golygu

Mae'r genomau sydd wedi eu hanodi yn cynnwys y rhan fwyaf o'r genomau fertebrat sydd wedi eu dilyniannu. Maen nhw'n cynnwys:

Cyfeiriadau

golygu
  1. "Ensembl 2011". Nucleic Acids Res 39 (Database issue): D800–D806. November 2010. doi:10.1093/nar/gkq1064. PMC 3013672. PMID 21045057. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=3013672.
  2. "Ensembl's 10th year". Nucleic Acids Res. 38 (Database issue): D557–62. January 2010. doi:10.1093/nar/gkp972. PMC 2808936. PMID 19906699. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=2808936.
  3. Ruffier, Magali; Kähäri, Andreas; Komorowska, Monika; Keenan, Stephen; Laird, Matthew; Longden, Ian; Proctor, Glenn; Searle, Steve et al. (January 2017). "Ensembl core software resources: storage and programmatic access for DNA sequence and genome annotation". Database 2017 (1). doi:10.1093/database/bax020.

Dolenni allanol

golygu