UCSC Genome Browser
L'UCSC Genome Browser (navegador de genomes de la UCSC) és un navegador de genomes en línia i descarregable, que acull la Universitat de Califòrnia, Santa Cruz (UCSC).[1][2][3] Es tracta d'un lloc web interactiu que ofereix accés a dades de seqüències de genomes d'una varietat d'espècies de vertebrats i invertebrats, i organismes model principals, integrats amb una gran col·lecció d'anotacions alineades. El navegador és un visualitzador gràfic optimitzat per a donar suport a un rendiment interactiu ràpid i és un conjunt d'eines basat en web basat en una base de dades MySQL per a la visualització ràpida, l'examen i la consulta de dades en molts nivells. La base de dades del navegador Genome, les eines de navegació, els fitxers de dades i la documentació descarregables es poden trobar al lloc web UCSC Genome Bioinformatics. HistòriaInicialment construït i utilitzat per Jim Kent, un estudiant de postgrau, i David Haussler, professor de informàtica (actualment enginyer biomolecular) de la Universitat de Califòrnia, Santa Cruz (UCSC) el 2000, el navegador de genomes de la UCSC va començar com un recurs per a la distribució dels primers fruits del Projecte Genoma Humà. Finançat pel Howard Hughes Medical Institute i el National Human Genome Research Institute, NHGRI (un dels Instituts Nacionals de Salut dels Estats Units d'Amèrica), el navegador va oferir una visualització gràfica del primer muntatge de cromosoma complet de la seqüència del genoma humà. Actualment, el navegador és utilitzat per genetistes, biòlegs i metges moleculars, així com estudiants i professors d'evolució per accedir a informació genètica. GenomesDes del seu inici, el navegador UCSC s'ha ampliat per adaptar-se a seqüències de genomes de totes les espècies de vertebrats i invertebrats seleccionats per als quals hi ha seqüències genètiques d'alta cobertura. (actualment inclou 46 espècies). És necessària una alta cobertura per permetre la superposició per guiar la construcció de regions contigües més grans. Les seqüències genètiques amb menys cobertura s'inclouen en pistes d'alineament múltiple en alguns navegadors, però la naturalesa fragmentada d'aquests muntats no els fa adequats per a la creació de navegadors complets. En la següent taula es mostren les espècies amb els navegadors de genoma amb totes les funcions.
Funcionalitat del navegadorLa gran quantitat de dades sobre sistemes biològics que s'acumula a la literatura fa que sigui necessari recollir i digitalitzar la informació mitjançant les eines de la bioinformàtica. El navegador de genomes de la UCSC presenta una diversa col·lecció de conjunts de dades d'anotació (conegudes com a «tracks» (pistes) i presentades de manera gràfica), incloent alineacions de mRNA, assignacions d'elements de repetició de l'ADN, prediccions de gens, dades d'expressió de gens, dades d'associació de malalties (que representen les relacions de gens a malalties), i assignacions de xips genètics comercialment disponibles (per exemple, Illumina i Agilent). El paradigma bàsic de la visualització és mostrar la seqüència del genoma en la dimensió horitzontal i mostrar representacions gràfiques de les ubicacions dels mRNAs, prediccions de gens, etc. Els blocs de color al llarg de l'eix de coordenades mostren les ubicacions dels alineaments dels diferents tipus de dades. La capacitat de mostrar aquesta gran varietat de tipus de dades en un únic eix de coordenades fa que el navegador sigui una eina pràctica per a la integració vertical de les dades.
Per trobar un gen o regió genòmica específics, l'usuari pot introduir el nom del gen, un número d'accés d'un RNA, el nom d'una banda citològica genòmica (p.ex., 20p13 per la banda 13 del braç curt del chr20) o una posició cromosòmica (chr17:38,450,000-38,531,000 per la regió del voltant del gen BRCA1) La presentació de les dades en el format gràfic permet al navegador presentar l'accés del vincle a informació detallada sobre qualsevol de les anotacions. La pàgina de detalls genètics de la pista de Genes UCSC proporciona una gran quantitat d'enllaços a informació més específica sobre el gen en molts altres recursos de dades, com ara l'Herència mendeliana en línia (OMIM) i SwissProt. Dissenyat per a la presentació de dades complexes i voluminoses, el navegador UCSC està optimitzat per a la velocitat. Al prealinar els 55 milions d'ARN de GenBank a cadascun dels 81 conjunts de genomes (moltes de les 46 espècies tenen més d'un ensamblat), el navegador permet l'accés instantani a les alineacions de qualsevol ARN a qualsevol de les espècies allotjades. La juxtaposició dels molts tipus de dades permet als investigadors mostrar exactament la combinació de dades que respondran preguntes específiques. Una funcionalitat de sortida pdf / postscript permet exportar una imatge preparada per a la seva publicació en revistes acadèmiques. Una característica única i útil que distingeix el navegador de la UCSC d'altres navegadors de genomes és la naturalesa contínuament variable de la pantalla. Es pot visualitzar la seqüència de qualsevol mida, des d'una única base d'ADN fins al cromosoma sencer (humans chr1 = 245 milions de bases, Mb) amb pistes completes d'anotació. Els investigadors poden mostrar un sol gen, un sol exó o una banda de cromosomes sencera, mostrant desenes o centenars de gens i qualsevol combinació de les nombroses anotacions. Una convenient funció d'arrossegar i ampliar permet a l'usuari triar qualsevol regió de la imatge del genoma i expandir-la per omplir la pantalla completa. Els investigadors també poden utilitzar el navegador per mostrar les seves pròpies dades a través de l'eina Custom Tracks (pistes personalitzades). Aquesta característica permet als usuaris pujar un fitxer de les seves pròpies dades i veure les dades en el context del muntatge del genoma de referència. Els usuaris també poden utilitzar les dades allotjades per la UCSC, creant subconjunts de les dades que trien amb l'eina Table Browser (taules de navegació) (com només el SNP que modifiquen la seqüència d'aminoàcids d'una proteïna) i mostren aquest subconjunt específic de les dades del navegador com a seguiment personalitzat. Qualsevol vista de navegador creada per un usuari, inclosos aquells que continguin Custom Tracks, es poden compartir amb altres usuaris a través de l'eina Saved Sessions (Sessions guardades). A sota de la imatge visualitzada del navegador de genomes UCSC es troben nou categories de camps addicionals que es poden seleccionar i mostrar juntament amb les dades originals. Aquestes categories són mapatge i seqüències, gens i prediccions de gens, fenotip i literatura, mRNA i EST, expressió, regulació, genètica comparativa, variació i repeticions.
Eines d'anàlisiEl lloc web UCSC allotja un conjunt d'eines d'anàlisi del genoma, incloent una interfície gràfica completa per a la mineria de la informació a la base de dades del navegador, una eina d'alineació de la seqüència BLAT[4] que també és útil per trobar seqüències en la seqüència massiva (genoma humà = 3.23 milions de bases [Gb]) de qualsevol dels genomes destacats. Una eina liftOver utilitza alineaments de tot el genoma per permetre la conversió de seqüències d'un ensamblat a un altre o entre espècies. L'eina Genomes Graphs permet als usuaris veure tots els cromosomes alhora i mostrar els resultats dels estudis d'associació de tot el genoma (GWAS). El generador de gens mostra gens agrupats per paràmetres no vinculats a la ubicació del genoma, com el patró d'expressió en els teixits. Codi obert / rèpliquesEl codi base del navegador UCSC és un codi obert per a usos no comercials i té rèpliques locals en molts grups de recerca, cosa que permet la visualització de dades privades en el context de les dades públiques. Les rèpliques del navegador UCSC tenen diverses ubicacions per tot el món, tal com es mostra a la taula.
El codi del navegador també es troba en instal·lacions separades a la UCSC Malaria Genome Browser i a l'Archaea Browser. Referències
Vegeu tambéEnllaços externs
|
Portal di Ensiklopedia Dunia