Ensembl
Prosiect gwyddonol yw Ensembl sydd yn cael ei redeg ar y cyd gan y Sefydliad Biowybodeg Ewropeaidd a Sefydliad Sanger yr Ymddiriedolaeth Wellcome. Cafodd ei lansio yn 1999 fel yr oedd Prosiect y Genom Dynol yn dirwyn i ben.[1] Nod y prosiect yw i ddarparu adnodd canolog ar gyfer genetegwyr, biolegwyr moleciwlaidd ac ymchwilwyr eraill sy'n astudio genomau dynol, fertebrau eraill ac organebau model.[2] Mae Ensembl yn un o lawer o borwyr genom a ddefnyddir gan wyddonwyr ar gyfer adalw gwybodaeth genomig.
Enghraifft o'r canlynol | cronfa ddata ar-lein, biological database |
---|---|
Rhan o | GENCODE, ELIXIR EMBL-EBI Node |
Gwladwriaeth | y Deyrnas Unedig |
Gwefan | http://www.ensembl.org/ |
Ffeiliau perthnasol ar Gomin Wicimedia |
Cefndir
golyguMae'r genom dynol yn cynnwys tri biliwn pâr o fasau, sy'n codio am tua 20,000–25,000 genyn. Ond does dim llawer i'w ganfod o wybod dilyniant y genom ar ben ei hun heb wybod hefyd am leoliadau genynau a'r cysylltiadau rhyngddynt. Mae modd anodi'r lleoliadau yma â llaw, gan ddefnyddio data o arbrofion wedi eu cyhoeddi mewn cyfnodolion gwyddonol. Fodd bynnag, mae hyn yn waith araf a dyfal. Opsiwn arall yw anodiad awtomatig – defnyddio pŵer cyfrifiadurol i gymharu dilyniannau protein a DNA.
Yn y prosiect Ensembl, mae data dilyniant genom yn cael ei fwydo i mewn i system anodi gyfrifiadurol (cyfres o sgriptiau yn yr iaith gyfrifiadurol Perl), gan greu casgliad o leoliadau genynau rhagweledig a'u harbed mewn cronfa ddata ar gyfer eu hymdrin ymhellach. Mae Ensembl yn rhyddhau'r holl wybodaeth i'w defnyddio gan y gymuned ymchwil fyd-eang. Gall unrhyw un lawrlwytho data a chôd y prosiect,[3] ac mae gweinydd cronfa ddata agored ar gael er mwyn cysylltu o bell. Mae gwefan Ensembl hefyd yn cynnwys dadansoddiadau gweledol o lawer o'r data.
Dros amser, mae'r prosiect wedi ei ehangu i gynnwys organebau ychwanegol (gan gynnwys organebau model pwysig megis llygod, pryfed ffrwythau a physgod rhesog), yn ogystal ag ystod ehangach o wybodaeth genomig, gan gynnwys amrywiadau genetig a nodweddion rheoli. Ers mis Ebrill 2009, mae chwaer-brosiect i Ensembl wedi estyn ffiniau'r prosiect i gynnwys anifeiliaid heb asgwrn cefn, planhigion, ffyngau, bacteria, a protistiaid, tra bo'r prosiect gwreiddiol yn dal i ganolbwyntio ar fertebratau.
Dangos data genomig
golyguRhan bwysig o brosiect Ensembl yw'r gallu i greu deleweddau awtomatig o enynau a data genetig eraill wedi alino at enom cyfeirio. Mae data fel hyn yn cael ei ddangos fel traciau data, a gall defnyddwyr droi'r traciau ymlaen neu i ffwrdd er mwyn gallu edrych ar nodweddion sydd o ddiddordeb iddynt. Mae rhyngwyneb Ensembl hefyd yn galluogi defnyddwyr i chwyddo mannau penodol o'r genom neu symud ar hyd y genom yn hawdd.
Gall y porwr hefyd ddangos data ar gydraniadau gwahanol, o ddangos caryoteipiau cyfan i ddangos dilyniannau DNA ac asidau amino yn fanwl. Mae hefyd modd o edrych ar ddilyniannau tebyg trwy ddiagramau coeden a chymharu genynau cyfatebol mewn ystod o rywogaethau. Gall Ensembl hefyd roi'r un wybodaeth mewn fformatiau eraill, ee FASTA, er mwyn defnyddio'r data mewn rhaglenni eraill.
Gellir agor data o raglenni eraill yn Ensembl hefyd, un ai drwy ddefnyddio gweinydd arlein neu drwy uwchlwytho ffeil mewn fformat cydweddol, megis BAM, BED neu PSL.
Rhywogaethau
golyguMae'r genomau sydd wedi eu hanodi yn cynnwys y rhan fwyaf o'r genomau fertebrat sydd wedi eu dilyniannu. Maen nhw'n cynnwys:
- Ffylwm Chordata (anifeiliaid ag asgwrn cefn)
- Mamaliaid
- Euarchontoglires
- Primatiaid: galago, tsimpansî, bod dynol, macaque, lemwr, orangwtang, tarsier;
- Scandentia: llyg y coed;
- Glires (= cnofilod a cheinachffurfiaid): mochyn cwta, llygoden fawr godog, llygoden, llygoden fawr, gwiwer ddaear, pica, cwningen;
- Laurasiatheria: buwch, dolffin, alpaca, mochyn, cath, ci, ceffyl, ystlum, draenog, chwistlen;
- Afrotheria: eliffant, hyracs, tenrec;
- Xenarthra: armellog, diogyn;
- Marsupialia: oposwm, walabi;
- Monotremes: hwyatbig;
- Euarchontoglires
- Adar: iâr, pila gwellt rhesog;
- Lepidosauria: madfall anole;
- Lissamphibia: llyffant Xenopus tropicalis;
- Pysgod teleost: Takifugu rubripes (fugu), Tetraodon nigroviridis (chwyddbysgodyn gwyrdd), Danio rerio (pysgodyn rhesog), Oryzias latipes (medaka), Gasterosteus aculeatus (crothell);
- Cyclostomata: Petromyzon marinus (llysywen bendoll y môr);
- Tunicates: Ciona intestinalis, Ciona savignyi;
- Mamaliaid
- Anifeiliaid di-asgwrn cefn
- Burum: Saccharomyces cerevisiae (burum pobi)
Cyfeiriadau
golygu- ↑ "Ensembl 2011". Nucleic Acids Res 39 (Database issue): D800–D806. November 2010. doi:10.1093/nar/gkq1064. PMC 3013672. PMID 21045057. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=3013672.
- ↑ "Ensembl's 10th year". Nucleic Acids Res. 38 (Database issue): D557–62. January 2010. doi:10.1093/nar/gkp972. PMC 2808936. PMID 19906699. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=2808936.
- ↑ Ruffier, Magali; Kähäri, Andreas; Komorowska, Monika; Keenan, Stephen; Laird, Matthew; Longden, Ian; Proctor, Glenn; Searle, Steve et al. (January 2017). "Ensembl core software resources: storage and programmatic access for DNA sequence and genome annotation". Database 2017 (1). doi:10.1093/database/bax020.