Multivariate analysis applied to clinical studies
practice notes for health professionals
Keywords:
multivariate analysis, statistical data interpretation, statistical modelsAbstract
Multivariate statistical methods allow the simultaneous processing of a set of variables, thereby allowing a more comprehensive and realistic view of a problem studied. This article aimed to present some of the multivariate methods most commonly used in clinical studies. These can be roughly grouped into: dependency methods (multivariate linear regression, logistic regression and the Cox proportional model); and interdependence methods (principal component analysis, cluster analysis and correspondence analysis). For each method, the background, the parameter estimation and the quality of adjustment, and an example of application were presented. Finally, some aspects that should be considered when performing a multivariate analysis, such as the sample size, the missing data, the outliers, the choice of a statistical package and the establishment of a theoretical model to support the analysis.
Downloads
References
Hair JF, Anderson RE, Tatham RL, Black WC. Análise multivariada de dados. Porto Alegre: Bookman; 2005. 600 p.
Katz MH. Multivariable analysis: a practical guide for clinicians and public health researchers. 3rd ed. Cambridge: Cambridge University Press; 2011. 233 p.
Reboldi G, Angeli F, Verdecchia P. Multivariable analysis in cerebrovascular research: practical notes for the clinician. Cerebrovascular Dis. 2013;35(2):187-93. DOI: 10.1159/000345491
Jackson J. Multivariate techniques: advantages and disadvantages. [Internet]. 2015. [cited 2015 Out 9]. Available from: http://www.ehow.com/info_8247893_multivariate-techniques-advantages-disadvantages.html
Hunt L. Multivariable analysis. Lancet. 1996;348(9033):1017-8.DOI: 10.1016/S0140-6736(05)64926-4
Mingoti SA. Análise de dados através de métodos de estatística multivariada: uma abordagem aplicada. Belo Horizonte: Editora UFMG; 2005.
Possoli S. Técnicas de análise multivariada para avaliação das condições de saúde dos municípios do Rio Grande do Sul, Brasil. Rev Saúde Pública. 1984;18(4):288-300.
Monteiro C, Ladeira R, Silva B. A utilização de técnicas multivariadas na análise do posicionamento e segmentação de empresas do sistema suplementar de saúde. In: Simpósio de Excelência e Gestão em Tecnologia. [Internet]. [citado 2017 Out 10]. Disponível em: http://www.aedb.br/seget/arquivos/artigos07/1324_servicos_fatorial%20e%20cluster.pdf
Alves LB, Belderrain MC, Scarpel RA. Tratamento multivariado de dados por análise de correspondência e análise de agrupamentos. In: Anais do 13o Encontro de Iniciação Científica e Pós-Graduação do ITA. José dos Campos, SP, Brasil. [Internet]. 2007. [citado 2017 Out 10]. Disponível em: http://www.bibl.ita.br/xiiiencita/MEC17.pdf
Hidalgo B, Goodman M. Multivariate or multivariable regression? Am J Public Health. 2013;103(1):39-40. DOI: 10.2105/AJPH.2012.300897
Núñez E, Steyerberg EW, Núñez J. Regression modeling strategies. Rev Esp Cardiol. 2011;64(6):501-7. DOI: 10.1016/j.rec.2011.01.017
Costa DC, Sá MJ, Calheiros JM. The effect of social support on the quality of life of patients with multiple sclerosis. Arq Neuropsiquiatr. 2012;70(2):108-13.
Silva MG, Almeida RT, Bastos EA, Nobre FF. Determinants of cellular atypia detection in the cervical screening program in Rio de Janeiro, Brazil. Rev Panam Salud Publica. 2013;34(2):107-13.
Bustamante-Teixeira MT, Faerstein E, Latorre MR. Técnicas de análise de sobrevida. Cad Saúde Pública. 2002;18(3):579-94.DOI: 10.1590/S0102-311X2002000300003
Carvalho M de S. Análise de sobrevida: teoria e aplicações em saúde. Rio de Janeiro: Editora Fiocruz; 2005.16. Botelho F, Silva C, Cruz F. Epidemiologia explicada – análise de sobrevivência. Acta Urológica. 2009;26(4):33-8.
Ayala AL. Sobrevida de mulheres com câncer de mama, de uma cidade no sul do Brasil. Rev Bras Enferm. 2012;65(4):566-70.DOI: 10.1590/S0034-71672012000400003
Moreira AC. Comparação da análise de componentes principais e da CATPCA na avaliação da satisfação do passageiro de uma transportadora aérea. Inv Op. 2007;27(2):165-78.
Manly BF. Multivariate statistical methods: a primer. 3rd ed. Florida: Chapman & Hall/CRC; 2005. 214 p.
Oliveira KS, Silva DO, Souza WV. Barreiras percebidas por médicos do Distrito Federal para a promoção da alimentação saudável. Cad Saúde Colet. 2014;22(3):260-5. DOI: 10.1590/1414-462X201400030007
Pichiliani M. Data mining na prática: algoritmo K-Means. 2006. [Internet]. [citado 2017 Out 10]. Disponível em: http://imasters.com.br/artigo/4709/sql-server/data-mining-na-pratica-algoritmo-k-means
Feitosa TM, Almeida RT. Perfil de produção do exame citopatológico para controle do câncer do colo do útero em Minas Gerais, Brasil, em 2002. Cad Saúde Pública. 2007;23(4):907-17.DOI: 10.1590/S0102-311X2007000400018
Infantosi AF, Costa JC, Almeida RM. Análise de correspondência: bases teóricas na interpretação de dados categóricos em ciências da saúde. Cad Saúde Pública. 2014;30(3):473-86.DOI: 10.1590/0102-311X00128513
Aranha RN, Faerstein E, Azevedo GM, Werneck G, Lopes CS. Análise de correspondência para avaliação do perfil de mulheres na pós-menopausa e o uso da terapia de reposição hormonal. Cad Saúde Pública. 2004;20(1):100-8.DOI: 10.1590/S0102-311X2004000100024
Peduzzi P, Concato J, Kemper E, Holford TR, Feinstein AR. A simulation study of the number of events per variable in logistic regression analysis. J Clin Epidemiol. 1996;49(12):1373-9.
Melo WA, Carvalho MD. Análise multivariada dos fatores de riscos para prematuridade no sul do Brasil. Rev Eletronica Gestão Saúde. [Internet]. 2014 [citado 2017 Out 10]; 5:398-9. Disponível em: http://www.convibra.com.br/upload/paper/2013/79/2013_79_7817.pdf
Loureiro L, Gameiro M. Interpretação crítica dos resultados estatísticos: para lá da significância estatística. Rev Enf Ref. 2011; serIII(3):151-62.DOI: 10.12707/RIII1009