X625线色林错环湖段、S506线色林错环湖段、S206...

Bioinformatika (gr?ki: bios - ?ivot; engleski: Informatics) je interdisciplinarna oblast koja razvija metode i alate za razumevanje biolo?kih podataka. Kao interdisciplinarno polje nauke, bioinformatika kombinuje informacione tehnologije, statistiku, matematiku i in?injerstvo kako bi analizirala i interpretirala biolo?ke podatke. Bioinformatika se koristi u analizama simulacija biolo?kih pojava koriste?i matemati?ke i statisti?ke tehnike.
Bioinformatika je zajedni?ki termin za oblast biolo?kih studija koje koriste kompjutersko programiranje kao deo svoje metodologije, i kao referenca za specifi?ne analize "toka podataka" koje se ?esto koriste, posebno u podru?ju genomike. Tipi?na primena bioinformatike podrazumeva identifikaciju kandidata gena i nukleotida. ?esto je cilj njihove identifikacije bolje razumevanje genetske osnove raznih bolesti, specifi?nih prilago?avanja organizama, ?eljenih osobina (npr. u poljoprivrednim kulturama), ili razlika izme?u populacija. U manje formalnom tipu, bioinformatika tako?e poku?ava da otkrije organizacione principe unutar nukleinskih kiselina i proteinskih sekvenci.
Bioinformatika je postala zna?ajna oblast mnogih biolo?kih oblasti. U eksperimentalnoj molekularnoj biologiji tehnike poput vizuelizacije biolo?kih podataka i procesiranja signala omogu?avaju izolovanje korisnih rezultata iz velike koli?ine neobra?enih podataka. U genetici i genomici to poma?e da se sekvencioni?u i obele?e genomi i njihove prime?ene mutacije. Tako?e poma?e da se u biolo?koj literaturi razviju biolo?ke i genetske ontologije zbog organizovanja i klasifikacije biolo?kih podataka. Zna?ajna je prilikom analize gena i odnosa izme?u proteina. Bioinformati?ki alati poma?u pri pore?enju geneti?kih i genomskih podataka, ?to olak?ava razumevanje evolutivnih aspekata molekularne biologije. Na kompaktnijem nivou, poma?e da se analiziraju i klasifikuju biolo?ke putanje i mre?e koje imaju zna?ajnu ulogu u biologiji sistema. U strukturalnoj biologiji, poma?e pri simulaciji i modelovanju DNA, RNA i strukture proteina, kao i molekularnih interakcija.
Istorijski, termin bioinformatika nije imao isto zna?enje kao danas. Paulin Hogveg i Ben Hesper su njim 1970. godine ozna?ili istra?ivanje informacionih procesa u biotskim sistemima.[1][2][3] Ta definicija klasifikuje bioinformatiku u oblasti srodne biofizici (istra?ivanje fizi?kih procesa u biolo?kim sistemima) ili biohemiji (istra?ivanje hemijskih procesa u biolo?kim sistemima).[1]

Kompjuteri su postali neophodni u molekularnoj biologiji kada su sekvence proteina postale poznate nakon ?to je Frederik Sanger odredio sekvencu insulina ranih pedesetih godina. Ru?no pore?enje vi?estrukih sekvenci pokazalo se neprakti?nim. Pionir u ovoj oblasti bila je Margaret Oklej Dejhof, koju je David Lipman, direktor Nacionalnog centra za biotehnolo?ke informacije, proglasio "majkom i ocem bioinformatike".[4] Margaret je napravila jednu od prvih baza podataka proteinskih sekvenci, koje su najpre objavljene kao knjige[5] i za?ela je metode poravnanja sekvenci i molekularne evolucije.[6] Drugi rani doprinos bioinformatici dao je Elvin A. Kabat, koji je zapo?eo sa analizom biolo?kih sekvenci 1970 sa obimnim izdanjima sekvenci antitela koje je objavio sa Tai Te Vuom izme?u 1980 i 1991. godine.[7]
Da bi se istra?ilo kako se normalne ?elijske aktivnosti menjaju u razli?itim fazama oboljenja, biolo?ki podaci moraju da budu kombinovani kako bi pru?ili jasniju sliku o ovim aktivnostima. Stoga se oblast bioinformatike razvila tako da najzna?ajniji deo podrazumeva analizu i interpretaciju razli?itih tipova podataka. To uklju?uje nukleotide i sekvence amino kiselina, oblast proteina i proteinskih struktura.[8] Konkretan proces analiziranja i interpretacije ovih podataka smatra se informacionom biologijom. Zna?ajne oblasti bioinformatike i informacione biologije podrazumevaju:
- Razvoj i implementaciju kompjuterskih programa koji omogu?avaju efikasan pristup i upravljanje razli?itim tipovima informacija
- Razvoj novih algoritama (matemati?kih formula) i statisti?kih mera kojima se procenjuju odnosi izme?u ?lanova velikog skupa podataka. Na primer, postoje metode za lociranje gena unutar sekvence, da se predvidi struktura proteina i/ili njena funkcija, i da se klaster analizom klasifikuju sekvence proteina u okviru familija srodnih sekvenci.
Osnovni cilj bioinformatike je pove?anje razumevanja biolo?kih procesa. Ono ?to je izdvaja od drugih procesa je fokus na razvoj i primenu informati?ki intenzivnih tehnika za postizanje tog cilja. Primeri uklju?uju prepoznavanje obrazaca, analizu podataka, ma?insko u?enje, i vizuelizaciju biolo?kih podataka. Fokus istra?ivanja u ovim oblastima uklju?uje poravnanje sekvenci, predvi?anje gena, genomski projekat, dizajn leka, otkrivanje leka, strukturno poravnanje proteina, predvi?anje strukture proteina, predvi?anje ekspresije gena, protein-protein interakcije, izu?avanje genomskih asocijacija, modelovanje evolucije i deobe ?elija - mitoze.
Bioinformatika danas podrazumeva stvaranje i razvoj baza podataka, algoritama, informati?kih i statisti?kih tehnika, kao i teorijske osnove za re?avanje formalnih i prakti?nih problema koji se javljaju u upravljanju i analizi biolo?kih podataka.
Tokom nekoliko prethodnih decenija brz razvoj genomike i drugih tehnologija molekularnog istra?ivanja kao i razvoj informacionih tehnologija proizveo je zna?ajnu koli?inu informacija koje se odnose na molekularnu biologiju. Bioinformatika je naziv kojim se opisuju matemati?ki i informati?ki pristupi kori??eni za potpunije razumevanje biolo?kih procesa.
U uobi?ajene aktivnosti u bioinformatici spadaju mapiranje i analiziranje DNA i sekvenci proteina, poravnanje DNA i proteinskih sekvenci radi njihovog pore?enja i izrada trodimenzionalnih modela proteinskih struktura.
Bioinformatika je nau?na oblast koja je sli?na, ali razli?ita od biolo?ke komputacije i komputacione biologije. Biolo?ka komputacija koristi bioin?injering i biologiju kako bi izgradila biologi?ke kompjutere, dok bioinformatika koristi kompjutere za bolje razumevanje biologije. Bioinformatika i komputaciona biologija imaju sli?ne ciljeve i pristupe, me?utim razlikuju se u obimu: bioinformatika organizuje i analizira osnovne biolo?ke podatke, dok komputaciona biologija gradi teoretske modele biolo?kih sistema, isto kao ?to matemati?ka biologija gradi matemati?ke modele.
Analiziranje biolo?kih podataka kako bi se dobile sadr?ajne informacije podrazumeva pravljenje i upotrebu kompjuterskih programa koji koriste algoritme iz teorije grafova, ve?ta?ke inteligencije, algoritme sa slabo definisanim rezultatima, analize podataka, prepoznavanja obrazaca, procesiranja slika i kompjuterske simulacije. Ovi algoritmi oslanjaju se na saznanja iz diskretne matematike, kontrolne teorije, sistemske teorije, informacione teorije i statistike.
Otkad je ΦX174 genom virusa sekvenciran 1977 godine,[9] DNA sekvence hiljada organizama su dekodirane i prikupljene u bazama podataka. Ove informacione sekvence se analiziraju kako bi se odredili geni koji kodireju proteine, RNA geni, regulacione sekvence, strukturalne karakteristike i vi?estruko ponovljene sekvence. Pore?enjem gena unutar vrste ili izme?u razli?itih vrsti mo?e da poka?e sli?nosti izme?u funkcija proteina, ili odnose izme?u vrsta (kori??enje molekularne filogenije radi izgradnje filogenetskog stabla). Rastom koli?ine podataka odavno je postalo neprakti?no da se DNA sekvence analiziraju ru?no. Danas se ra?unarski programi kao ?to je BLAST koriste kako bi pretra?ili sekvence vi?e od 260.000 organizama, koje sadr?e vi?e od 190 milijardi nukleotida.[10] Takvi programi mogu da kompenzuju mutacije (izme?ane, obrisane ili uba?ene osnove) u DNA sekvenci, i da identifikuju sekvence koje su srodne, ali nisu identi?ne. Varijanta ovakvog poravnanja sekvenci se koristi u samom procesu sekvenciranja. Takozvanim "?otgan sekvenciranjem" (koje je kori??eno u J. Kreg Venter Institutu za sekvenciranje prvog bakterijskog genoma Haemophilus influenzae)[11] nije mogu?e o?itati kompletne hromozome. Taj metod daje sekvence vi?e hiljada malih DNA fragmenata (od 35 do 900 nukleotida, zavisno od tehnologije sekvenciranja). Krajevi ovih fragmenata se preklapaju i, kada su ispravno spojeni programom za poravnanje genoma, mogu se koristiti za rekonstrukciju kompletnog genoma. ?otgan sekvenciranjem brzo se dobijaju sekvence podataka, me?utim potreba za spajanjem fragmenata ve?ih genoma mo?e da bude veoma komplikovana. Za genom veli?ine genoma ?oveka, mo?e da bude potrebno nekoliko dana rada na sna?nim multiprocesorskim kompjuterima sa velikom memorijom za spajanje fragmenata, a rezultat spajanja obi?no sadr?i brojne propuste koji moraju da budu popunjeni kasnije. ?otgan sekvenciranje je izborni metod gotovo svih dana?njih sekvencioniranih genoma, a algoritmi za spajanje, odnosno predvi?anje genoma su kriti?na oblast bioinformati?kih istra?ivanja.
Slede?i smernice koje je postavio projekat ljudskog genoma nakon zatvaranja 2003. godine, Institut za nacionalna istra?ivanja ljudskog genoma je u U.S. razvio novi projekat. Takozvani ENCODE projekat je kolaborativni skup podataka funkcionalnih elemenata ljudskog genoma koji koristi napredne DNA sekvencioniraju?e tehnologije i genomske tiling nizove, tehnologije koje su sposobne da automatski generi?u velike koli?ine podataka sa ni?im tro?kovima istra?ivanja, ali uz isti kvalitet i pouzdanost.
Slede?i aspekat bioinformatike u analizi sekvenci je ozna?avanje. Ono podrazumeva komputaciono predvi?anje gena kako bi se prona?li geni koji kodiraju proteine, RNA geni i ostale funkcionalne sekvence unutar genoma. Nisu svi nukleotidi u genomu delovi gena. U genomima vi?ih organizama veliki deo DNA nema nikakvu o?iglednu funkciju.
U kontekstu genomike ozna?avanje je proces obele?avanja gena i njihovih biolo?kih osobina u DNA sekvenci. Po?eljno je da je ovaj proces automatizovan jer je ve?ina genoma prevelika za ru?no ozna?avanje, pa proces predstavlja "usko grlo" pri poku?aju da se ?to vi?e gena ?to pre ozna?i. Ozna?avanje je mogu?e usled ?injenice da geni imaju prepoznatljive regione po?etka i kraja, iako ta?na sekvenca u ovim regionima mo?e da se razlikuje.
Prvi softver za ozna?avanje genoma napravio je 1995. godine Oven Vajt (Owen White), dok je bio u timu J. Kreg Venter Instituta za genomska istra?ivanja, gde je sekvencionirao i analizirao prvi genom ?ivog organizma, baktriju Haemophilus influenzae.[11] Vajt je napravio softverski sistem koji pronalazi gene (delove genomske sekvence koji kodiraju proteine), prelazne RNA i odre?uje njihove osnovne funkcije. Ve?ina trenutnih sistema za obele?avanje gena funkcioni?e po sli?nom principu, me?utim programi koji se koriste za analizu genoma DNA, kao ?to je GeneMark, program koji je kori??en za pronala?enje gena koji kodiraju proteine u pomenutoj bakteriji konstantno se menjaju i unapre?uju.
Evoluciona biologija je oblast koja izu?ava poreklo i izumiranje vrsta, kao i njihovu promenu tokom vremena. Informatika poma?e evolucionim biolozima omogu?avaju?i istra?iva?ima da:
- prate evoluciju velikog broja organizama merenjem promena u njihovom DNA, umesto samo kroz fizi?ke i fiziolo?ke opservacije,
- porede kompletne genome, ?to dozvoljava istra?ivanje slo?enih evolucionih doga?aja, poput dupliranja gena, horizontalnog transfera gena i predvi?anje bitnih faktora bakterijskih specijacija,
- grade slo?ene komputacione modele populacija radi predvi?anja ishoda sistema tokom vremena[12]
- prate i dele informacije o sve ve?em broju vrsta i organizama.
Budu?i koraci usmereni su ka rekonstruisanju sve kompleksnijeg filogenetskog stabla.
Oblast istra?ivanja unutar kompjuterskih nauka koja koristi genetske algoritme se nekada me?a sa komputacionom evolucionom biologijom, ali ove dve oblasti ne moraju da budu povezane.
Osnova komparativne analize genoma je utvr?ivanje odnosa izme?u gena i ortolo?ke analize ili drugih genomskih osobina u razli?itim organizmima. Uz pomo? takvih, intergenomskih mapa mogu?e je pratiti evolucioni proces odgovoran za razlike izme?u dva genoma. Vi?e takvih evolucionih doga?aja, na raznim organizacionim nivoima oblikuje evoluciju genoma. Na najni?em nivou, ta?kaste mutacije menjaju pojedina?ne nukleotide. Na ve?em nivou, na velikim segmentima hromozoma javlja se dupliranje, transfer, inverzija, transpozicija, brisanje i ubacivanje.[13] Na kraju, ?itavi genomi u?estvuju u procesu hibridizacije, poliploidizacije i endosimbioze, ?esto vode?i ka ubrzanom razdvajanju vrsta. Slo?enost evolucije genoma donosi mnoge uzbudljive izazove za razvoj matemati?kih modela i algoritama, ?irokog spektra razvoja algoritma, statisti?kih i matemati?kih tehnika u opsegu od egzaktne heuristike, fiksnih parametara i aproksimacionih algoritama za probleme zasnovane na ?tedljivim modelima do Monte Karlo metode Markovog lanca za Bajesovsko zaklju?ivanje u analizi problema zasnovanih na modelima verovatno?e.
Mnoga od ovih istra?ivanja zasnovana su na homolo?koj detekciji i komputaciji familije proteina.[14]
Pan genomika je koncept koji su Tetelin (Tettelin) i Medini (Medini) predstavili 2005 godine, a koji je kasnije kasnije razvio osnovu za bioinformatiku. Pan genom je kompletan repertoar gena konkretne taksonomske grupe: iako je inicijalno bio primenjen na evolutivno bliskim rodovima vrsti, mo?e da bude primenjen u ?irem kontekstu poput roda, razdela itd. Podeljen je u dva dela - izvorni genom: set gena zajedni?kih za sve genome unutar istra?ivanja (ovo su obi?no geni klju?ni za opstanak organizma) i promenljivi/fleksibilni genom: set gena koji nije prisutan u svim, ve? u pojedinim ili u vi?e genoma unutar istra?ivanja.
Razvojem naprednih sekvencioniraju?ih tehnologija posedujemo dovoljno sekvencnih podataka, tako da mo?emo da mapiramo gene slo?enih bolesti kao ?to su ?e?erna bolest,[15] neplodnost,[16] rak dojke[17] ili Alchajmerovu bolest.[18] Studije asocijacije genoma predstavljaju koristan pristup pronala?enja ta?nih mutacija odgovornih za te slo?ene bolesti.[19] Kroz ove studije identifikovano je na hiljade DNA varijacija koje su povezane sa sli?nim bolestima i predispozicijama.[20] ?tavi?e, verovatno?a da se geni koriste pri prognoziranju, dijagnozi ili tretmanu bolesti je jedna od najosnovnijih aplikacija. Mnoge studije istra?uju na?ine za precizan izbor odgovornih gena i probleme i stranputice kori??enja gena za predvi?anje ili prognozu bolesti.[21]
Kod raka, genomi zara?enih ?elija se preraspore?uju na slo?ene ili ?ak nepredvidljive na?ine. Veliki napori pri sekvencionisanju ula?u se kako bi se identifikovale ranije nepoznate genske mutacije u raznmim genima u raku. Bioinformatika nastavlja da proizvodi specijalizovane automatske sisteme za obradu obimnih podataka koji su proizvedeni sekvencionisanjem podataka, i da napravi nove algoritme i programe koji bi poredili sekvencionisane rezultate sa rastu?om kolekcijom sekvenci genoma ?oveka i germinativnih polimorfoza. Razvijaju se nove, fizi?ke tehnologije detekcije, poput mikronizova oligonukleotida kako bi se identifikovale hromozomske prednosti i nedostaci (tzv. komparativna hibridizacija genoma), i nizova jednonukleotidnih polimorfizama za detekciju poznatih genskih mutacija. Ove metode detekcije istovremeno mere nekoliko stotina hiljada oblasti genoma i kada se koriste sa velikim obuhvatom podataka za merenje hiljada semplova, generi?u terabajte podataka po eksperimentu. Ogromna koli?ina i novi tipovi podataka pru?aju nove ?anse za bioinformatiku. ?esto se u podacima nalazi zna?ajna varijabilnost, ili ?um, pa se stoga razvijaju skriveni Markovljev model i metode analiza sa promenom ta?ke kako bi vernije predstavile varijabilnost nastalih promena.
Uz napredak koji razvoj naprednih sekvencioniraju?ih tehnologija obezbe?uje oblasti bioinformatike, genomika kancera mogla bi da se drasti?no promeni. Nove metode i algoritmi omogu?avaju bioinformati?arima brzo i lako sekvencionisanje mnogih genoma kancera. Ovo bi moglo da dovede do fleksibilnijeg procesa za klasifikaciju tipova raka analizom mutacija koje su u genomu nastale pod njegovim dejstvom. ?tavi?e, u budu?nosti bi verovatno bilo mogu?e individualno pra?enje stanja pacijenta na osnovu sekvenci uzoraka raka.[22]
Drugi tip podataka koji zahteva zna?ajan informati?ki razvoj je analiza lezija koje se javljaju pri mnogim tumorima.
Ekspresija mnogih gena mo?e da se odredi merenjem nivoa informacionih RNK preko vi?e tehnika, uklju?uju?i DNK mikro?ip, EST sekvenciranje, serijsku analizu ekspresije gena (SAGE), masivno paralelno sekvenciranje potpisa (MPSS), RNA sekvenciranje, poznato i kao "?otgan sekvenciranje celog transkriptoma" (WTSS) ili raznim aplikacijama multipleksiranih hibridizacija. Sve ove tehnike su ekstremno osetljive na ?umove i podlo?ne pristrasnosti u biolo?kim merenjima, pa glavni istra?iva?ki napor u komputacionoj biologiji podrazumeva razvoj statisti?kih alata za odvajanje signala od ?uma u obimnim studijama ekspresije gena. Takve studije se ?esto sprovode kako bi odredile gene koji imaju odre?enu fukkciju u oboljenju: mo?e se porediti mikroniz podataka iz kancerogenih epitelskih ?elija sa podacima iz nekancerogenih ?elija kako bi se odredili delovi koji su klju?ni za odgovaraju?u populaciju kancerogenih ?elija.
Proteinski mikronizovi ili proteinski ?ipovi uz masenu spektrometriju ?irokog propusnog opsega mogu da obezbede snimak proteina prisutnih u biolo?kom uzorku. Bioinformatika ima svoju ulogu u razumevanju proteinskih mikronizova i podataka dobijenih pomenutim metodama; takav pristup ima sli?ne probleme kao i mikronizevi koji se odnose na iRNK, obzirom da oni podrazumevaju pore?enje velikih koli?ina obimnih podataka sa predvi?enim podacima iz sekvenci proteinskih baza podataka i komplikovane statisti?ke analize semplova gde su detektovani vi?estruki, ali nepotpuni peptidi u svakom proteinu.
Regulacija predstavlja slo?en sistem upravljanja doga?ajima po?ev od spoljnog ?elijskog nadra?aja kao ?to je hormon, i vodi ka pove?anju ili smanjenju aktivnosti jednog ili vi?e proteina. Bioinformati?ke tehnike se koriste kako bi se ispitali razni koraci u ovom procesu. Na primer, promoter analiza uklju?uje identifikaciju i prou?avanje sekvencnih motiva u DNA koji okru?uje kodiraju?i region u genu. Ovi motivi uti?u na to do kog nivoa se koji region prepisuje u iRNK. Dobijeni podaci mogu da se iskoriste kako bi se uticalo na genetsku regulaciju: na primer, mogu?e je pore?enje mikronizova pri raznim stanjima organizma kako bi se postavila hipoteza o genima uklju?enim u svakom stanju.
- ↑ 1,0 1,1 Hogeweg P (2011). Searls, David B.. ur. ?The Roots of Bioinformatics in Theoretical Biology”. PLoS Computational Biology 7 (3): e1002021. Bibcode 2011PLSCB...7E0020H. DOI:10.1371/journal.pcbi.1002021. PMC 3068925. PMID 21483479.
- ↑ Hesper B, Hogeweg P (1970). Bioinformatica: een werkconcept. 1. Kameleon. pp. 28–29.
- ↑ Hogeweg P (1978). ?Simulating the growth of cellular forms”. Simulation 31 (3): 90–96. DOI:10.1177/003754977803100305.
- ↑ Moody, Glyn (2004). Digital Code of Life: How Bioinformatics is Revolutionizing Science, Medicine, and Business. ISBN 978-0-471-32788-2.
- ↑ Dayhoff, M.O. (1966) Atlas of protein sequence and structure. National Biomedical Research Foundation, 215 pp.
- ↑ Eck RV, Dayhoff MO (1966). ?Evolution of the structure of ferredoxin based on living relics of primitive amino Acid sequences”. Science 152 (3720): 363–6. Bibcode 1966Sci...152..363E. DOI:10.1126/science.152.3720.363. PMID 17775169.
- ↑ Johnson G, Wu TT (January 2000). ?Kabat Database and its applications: 30 years after the first variability plot”. Nucleic Acids Res 28 (1): 214–218. DOI:10.1093/nar/28.1.214. PMC 102431. PMID 10592229.
- ↑ Attwood TK, Gisel A, Eriksson N-E, Bongcam-Rudloff E (2011). ?Concepts, Historical Milestones and the Central Place of Bioinformatics in Modern Biology: A European Perspective”. Bioinformatics – Trends and Methodologies. InTech. Arhivirano iz originala na datum 2025-08-05. Pristupljeno 8 Jan 2012.
- ↑ Sanger F, Air GM, Barrell BG, Brown NL, Coulson AR, Fiddes CA, Hutchison CA, Slocombe PM, Smith M (February 1977). ?Nucleotide sequence of bacteriophage phi X174 DNA”. Nature 265 (5596): 687–95. Bibcode 1977Natur.265..687S. DOI:10.1038/265687a0. PMID 870828.
- ↑ Benson DA, Karsch-Mizrachi I, Lipman DJ, Ostell J, Wheeler DL (January 2008). ?GenBank”. Nucleic Acids Res. 36 (Database issue): D25–30. DOI:10.1093/nar/gkm929. PMC 2238942. PMID 18073190.
- ↑ 11,0 11,1 Fleischmann RD, Adams MD, White O, Clayton RA, Kirkness EF, Kerlavage AR, Bult CJ, Tomb JF, Dougherty BA, Merrick JM (July 1995). ?Whole-genome random sequencing and assembly of Haemophilus influenzae Rd”. Science 269 (5223): 496–512. Bibcode 1995Sci...269..496F. DOI:10.1126/science.7542800. PMID 7542800.
- ↑ Carvajal-Rodríguez A (2012). ?Simulation of Genes and Genomes Forward in Time”. Current Genomics (Bentham Science Publishers Ltd.) 11 (1): 58–61. DOI:10.2174/138920210790218007. PMC 2851118. PMID 20808525.
- ↑ Brown, TA (2002). ?Mutation, Repair and Recombination”. Genomes (2nd izd.). Manchester (UK): Oxford.
- ↑ Carter, N. P.; Fiegler, H.; Piper, J. (2002). ?Comparative analysis of comparative genomic hybridization microarray technologies: Report of a workshop sponsored by the Wellcome trust”. Wiley Subscription Services, Inc 49 (2): 43–8. DOI:10.1002/cyto.10153.
- ↑ Ionescu-T?rgovi?te, Constantin; Gagniuc, Paul Aurelian; Guja, Cristian. ?Structural Properties of Gene Promoters Highlight More than Two Phenotypes of Diabetes”. PLOS ONE 10 (9): e0137950. DOI:10.1371/journal.pone.0137950. PMC 4574929. PMID 26379145. Arhivirano iz originala na datum 2025-08-05. Pristupljeno 2025-08-05.
- ↑ Aston KI (2014). ?Genetic susceptibility to male infertility: News from genome-wide association studies”. Andrology 2 (3): 315–21. DOI:10.1111/j.2047-2927.2014.00188.x. PMID 24574159.
- ↑ Véron A, Blein S, Cox DG (2014). ?Genome-wide association studies and the clinic: A focus on breast cancer”. Biomarkers in Medicine 8 (2): 287–96. DOI:10.2217/bmm.13.121. PMID 24521025.
- ↑ Tosto G, Reitz C (2013). ?Genome-wide association studies in Alzheimer's disease: A review”. Current Neurology and Neuroscience Reports 13 (10): 381. DOI:10.1007/s11910-013-0381-0. PMC 3809844. PMID 23954969.
- ↑ Londin E, Yadav P, Surrey S, Kricka LJ, Fortina P (2013). ?Use of Linkage Analysis, Genome-Wide Association Studies, and Next-Generation Sequencing in the Identification of Disease-Causing Mutations”. Pharmacogenomics. Methods in Molecular Biology 1015: 127–46. DOI:10.1007/978-1-62703-435-7_8. ISBN 978-1-62703-434-0. PMID 23824853.
- ↑ Hindorff, L.A., (2009). ?Potential etiologic and functional implications of genome-wide association loci for human diseases and traits.”. Proc. Natl. Acad. Sci. USA 106: 9362–9367. DOI:10.1073/pnas.0903103106. PMC 2687147. PMID 19474294.
- ↑ Hall, L.O. (2010). ?Finding the right genes for disease and prognosis prediction.”. System Science and Engineering (ICSSE),2010 International Conference: 1–2. DOI:10.1109/ICSSE.2010.5551766.
- ↑ Hye-Jung, E.C.; Jaswinder, K.; Martin, K.; Samuel, A.A; Marco, A.M (2014). ?“Second-Generation Sequencing for Cancer Genome Analysis””. u: Dellaire, Graham; Berman, Jason N.; Arceci, Robert J.. Cancer Genomics. Boston (US): Academic Press. str. 13–30. DOI:10.1016/B978-0-12-396967-5.00002-5. ISBN 9780123969675.