Análise de dados de expressão gênica: normalização de microarrays e modelagem de redes regulatórias

  • André Fujita USP
  • Mari C. Sogayar USP
  • Carlos E. Ferreira USP

Resumo


Este trabalho tem como objetivos o desenvolvimento de métodos de análise de dados de microarrays, propondo uma nova forma de normalização, e dois modelos para a construção de redes regulatórias de expressão gênica, sendo uma baseada na conectividade dinâmica entre genes ao longo do ciclo celular e a outra que soluciona o problema da dimensionalidade, em que o número de experimentos de microarrays é menor que o número de genes. Apresenta-se, ainda, um pacote de ferramentas com uma interface gráfica amigável contendo diversas técnicas de análise de dados já conhecidas como também as abordagens propostas neste trabalho. Este trabalho originou quatro artigos publicados em três das principais revistas da área.

Referências

Balagurunathan, Y., Dougherty, E.R., Chen, Y., Bittner, M.L. and Trent, J.M. (2002) "Simulation of cDNA microarrays via a parameterized random signal model", Journal of Biomedical Optics. 7:507-523.

Bryd, R.H., Lu, P., Nocedal, J. and Zhu, C. (1995) "A limited memory algorithm for bound constrained optimization", SIAM J. Scientific Computing. 16:1190-1208.

Dudoit, S., Yang, Y.H., Callow, M.J., Speed, T.P. (2002) "Statistical methods for identifying genes with differential expression in replicated cDNA microarray experiments", Stat. Sin. 12:111-139.

Fan, J.Q. and Li, R.Z. (2001) "Variable selection via nonconcave penalized likelihood and its oracle properties", J. Am. Stat. Assoc. 96:1348-1360.

SBC 2008 15 Fan, J.Q. and Peng, H. (2004) "Nonconcave penalized likelihood with a diverging number of parameters", Ann. Stat. 32:928-961.

Fujita, A., Sato, J.R., Rodrigues, L.O., Ferreira, C.E. and Sogayar, M.C. (2006) "Evaluating different methods of microarray data normalization", BMC Bioinformatics. 7:469 (Highly accessed).

Fujita, A., Sato, J.R., Garay-Malpartida, H.M., Morettin, P.A., Sogayar, M.C. and Ferreira, C.E. (2007a) "Time-varying modeling of gene expression regulatory networks using the wavelet dynamic vector autoregressive method", Bioinformatics. 23:1623-1630.

Fujita, A., Sato, J.R., Garay-Malpartida, H.M., Yamaguchi, R., Miyano, S., Sogayar, M.C. and Ferreira, C.E. (2007b) "Modeling large gene expression regulatory networks with sparse vector autoregressive model", BMC Systems Biology. 1:39.

Fujita, A., Sato, J.R., Ferreira, C.E. and Sogayar, M.C. (2007c) "GEDI: a user-friendly toolbox for analysis of large-scale gene expression data", BMC Bioinformatics. 8:457 (Highly accessed).

Granger, C.W.J. (1969) "Investigating causal relation by econometric and cross-sectional method", Econometrica. 37: 424-438.

Hunter, D.R. (2004) "MM algorithm for generalized Bradley-Terry models", Ann. Stat. 32:384-406.

Hunter, D.R. and Lange, K. (2004) "A tutorial on MM algorithms", Am. Stat. 58:30-37.

Tibshirani, R. (1996) "Regression shrinkage and selection via the Lasso", Journal of the Royal Statistical Society, Series B. 58:267-288.

Tusher, V. and Tibshirani, R. (2001) "Significance analysis of microarrays applied to the ionizing radiation response", PNAS. 98:5116-5121.

Vapnik, V.N. (1998) "Statistical learning theory", New York: Wiley.
Publicado
12/07/2008
FUJITA, André; SOGAYAR, Mari C.; FERREIRA, Carlos E.. Análise de dados de expressão gênica: normalização de microarrays e modelagem de redes regulatórias. In: CONCURSO DE TESES E DISSERTAÇÕES (CTD), 21. , 2008, Belém/PA. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2008 . p. 9-16. ISSN 2763-8820.