Post on 18-Apr-2015
DELINEAMENTOS DELINEAMENTOS
CORRELACIONAISCORRELACIONAIS
Stephanie Santana PintoStephanie Santana Pinto
O que a pesquisa correlacional investiga?
Investiga o grau do relacionamento entre duas variáveis ou mais.
Correlação linear simplesCorrelação linear simples
Avaliar se existe Avaliar se existe ASSOCIAÇÃO ASSOCIAÇÃO entre entre
duas características quantitativas é objetivo duas características quantitativas é objetivo
de muitos estudos em ciências da saúde!de muitos estudos em ciências da saúde!
Por exemplo...Por exemplo...
* Quando se pode demonstrar que duas variáveis
quantitativas variam juntas, diz-se que as mesmas estão
correlacionadas.
Correlação linear simplesCorrelação linear simples
Existe correlação entre o tempo dedicado ao estudo e o desempenho dos alunos em determinada disciplina?
N = 8 alunosN = 8 alunos x (horas)x (horas) y (nota)y (nota)
AA 88 1010
BB 77 88
CC 66 44
DD 33 88
EE 33 66
FF 66 99
GG 55 77
HH 22 44
Correlação linear simplesCorrelação linear simples
Diagrama de dispersão
Para avaliar a correlação entre características
quantitativas → dados representados em gráfico
cartesiano de pontos → diagrama de pontos ou diagrama
de dispersão.
0
2
4
6
8
10
12
0 2 4 6 8 10
Horas de estudo (x)
No
ta (
y)
Correlação linear simplesCorrelação linear simples
Diagrama de dispersão
Para avaliar a correlação entre características
quantitativas → dados representados em gráfico
cartesiano de pontos → diagrama de pontos ou diagrama
de dispersão.
0
2
4
6
8
10
12
0 2 4 6 8 10
Horas de estudo (x)
No
ta (
y)
Correlação linear simplesCorrelação linear simples
Diagrama de dispersão
Para avaliar a correlação entre características
quantitativas → dados representados em gráfico
cartesiano de pontos → diagrama de pontos ou diagrama
de dispersão.
0
2
4
6
8
10
12
0 2 4 6 8 10
Horas de estudo (x)
No
ta (
y)
Correlação linear simplesCorrelação linear simples
Diagrama de dispersão
Para avaliar a correlação entre características
quantitativas → dados representados em gráfico
cartesiano de pontos → diagrama de pontos ou diagrama
de dispersão.
0
2
4
6
8
10
12
0 2 4 6 8 10
Horas de estudo (x)
No
ta (
y)
Associação não é perfeita!
Correlação linear simplesCorrelação linear simples
Coeficiente de correlação produto-momento (r)
Outra forma de se avaliar a correlação é usar um
COEFICIENTE, que tem a vantagem de ser um número
puro, o qual é independente da unidade de medida das
variáveis.
** Medida da intensidade de associação entre 2 variáveis Medida da intensidade de associação entre 2 variáveis
quantitativas!quantitativas!
Fórmula de cálculo proposta por Karl Pearson em 1896 →
coeficiente de correlação de Pearson!
Correlação linear simplesCorrelação linear simples
Variação no coeficiente de correlação
O coeficiente de correlação pode variar entre -1 e +1!
Quando não existe correlação entre x e y → pontos se
distribuem em nuvens circulares!
Associações de grau intermediário apresentam nuvens
inclinadas elípticas → mais estreitas maior a correlação!
Nuvem elíptica paralela a um dos eixos do gráfico, a
correlação é nula!
Pontos formam nuvem cujo eixo principal é uma curva →
r não mede corretamente a associação entre as variáveis!
Correlação linear simplesCorrelação linear simples
Teste de hipóteses sobre a correlação
Raciocínio do teste
Quando se calcula o coeficiente r em uma amostra
Estimando associação verdadeira entre x e y existente
na população!
Exemplo da correlação entre horas de estudo e nota
da prova, foi obtido um r = 0,58.
Entretanto...
Não existe a certeza de que na população de alunos haja,
efetivamente, correlação entre horas de estudo e nota na prova,
pois foi estudada apenas uma parte da população!
Correlação linear simplesCorrelação linear simples
Para realizar um teste de hipóteses sobre a
existência de correlação, usa-se um raciocínio análogo
ao dos testes de hipóteses sobre médias.
Além disso...
Avaliar significância do coeficiente de correlação
Testa-se a H0!
Utilizando para tanto a distribuição t.
Correlação linear simplesCorrelação linear simples
Etapas do teste de hipóteses da correlação
(1) Elaboração das hipóteses
H0: ρ = 0
HA: ρ ≠ 0
(2) Escolha do nível de significância
α = 0,05
(3) Determinação do valor crítico do teste:
tα;gl = t0,05;6 = 2,447 (gl = n – 2, n é o número de pares de valores x,y)
(4) Determinação do valor calculado de t:
tcalc = tcal = 1,74 para r = 0,58
(5) Como tcal = 1,74 < t0,05;6 = 2,45, não se rejeita H0
r√1 – r2
n - 2
(6) Conclusão:
Não existe evidência de correlação entre tempo dedicado ao
estudo e o desempenho obtido na prova. O valor de r foi
casual.
Correlação linear simplesCorrelação linear simples
Suponha que existam razões para se acreditar que
essa conclusão não espelha a realidade. Como interpretar o
resultado obtido?
* Teste estatístico não apóia a existência de correlação
populacional, isso pode ser explicado:
- Não existe correlação entre x e y e o valor de r foi um
resultado casual;
- Existe correlação entre x e y, entretanto não foi possível
mostrar esta associação pelo pequeno tamanho da amostra.
Correlação linear simplesCorrelação linear simples
Avaliação qualitativa de r quanto à intensidade
rr A correlação é ditaA correlação é dita
00 NulaNula
0 – 0,30 – 0,3 FracaFraca
0,3 ├ 0,60,3 ├ 0,6 RegularRegular
0,6 ├ 0,90,6 ├ 0,9 ForteForte
0,9 ├ 10,9 ├ 1 Muito ForteMuito Forte
11 Plena ou perfeitaPlena ou perfeita
Correlação linear simplesCorrelação linear simples
Coeficiente de determinação
É o quadrado do coeficiente de correlação e informa
que fração da variabilidade de uma característica é
explicada estatisticamente pela outra variável.
r2 = 0,64
Durante caminhada na água, Durante caminhada na água,
64% da variação que se 64% da variação que se
observa na amostra em relação observa na amostra em relação
a FC explica-se porque a a FC explica-se porque a
mesma amostra varia também mesma amostra varia também
em relação ao VOem relação ao VO22!!
Correlação linear simplesCorrelação linear simples
Requisitos ao estudo da correlação (Pearson)
Tanto a variável x quanto a y têm distribuição normal;
O grau de variação em torno dos diferentes valores de
x e y é o mesmo (homocedasticidade);
Coeficiente de correlação mede uma ASSOCIAÇÃO ASSOCIAÇÃO e não um
relação de causa e efeito!
Correlação linear simplesCorrelação linear simples
SSE x VO2
r2 = 0,14556
8
10
12
14
16
18
20
0,6 0,8 1 1,2 1,4 1,6 1,8
VO2 (l.min-1)
SS
E
r = 0,432
p = 0,012
Coeficiente de correlação de Spearman
* Variáveis medidas em escala ordinal;
* Variáveis quantitativas não satisfazem as exigências para o
teste de correlação de Pearson (distribuição normal).
Reprodução de uma medida (dias diferentes) e Repetição de uma medida
(mesmo dia)
RMS rectus femoris in water and on dry land
0
50
100
150
200
250
300
0 50 100 150 200 250 300
RMS RF water (mV)
RM
S R
F d
ry l
and
(m
V)
p = 0.001 ICC = 0.924
Reprodução de uma medida (dias diferentes) e Repetição de uma medida
(mesmo dia)
Force production of hip flexors in water and on dry land
0,91
1,11,21,31,41,51,61,71,8
1 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8
Log10 HFL water
Lo
g10
HF
L d
ry l
and
ICC = 0.920 p < 0.001
Regressão linear simplesRegressão linear simplesAplica-se àquelas situações em que há razões
para supor uma relação de causa-efeito entre duas
variáveis quantitativas e se deseja expressar
matematicamente essa relação.
Chama-se...Chama-se...
y depende de x (coloquial)y depende de x (coloquial) y é função de x (matemática)y é função de x (matemática)
Existe regressão de y sobre x (estatística)Existe regressão de y sobre x (estatística)
Regressão linear Regressão linear simplessimples
Em um estudo de regressão...Em um estudo de regressão...
Valores da variável independente (x) geralmente são escolhidos;
Para cada valor escolhido observa-se o valor de y correspondente!
Por exemplo...Por exemplo...
Estudar a forma pela qual a PA depende da idade. Estudar a forma pela qual a PA depende da idade.
Estudar indivíduos com x = 30, 35, 40, 45, etc., anos de idade e Estudar indivíduos com x = 30, 35, 40, 45, etc., anos de idade e
então medir suas PA. Para que resultados sejam fidedignos, então medir suas PA. Para que resultados sejam fidedignos,
indivíduos deverão ser sorteados de uma subpopulação com indivíduos deverão ser sorteados de uma subpopulação com
idades correspondentes.idades correspondentes.
Regressão linear Regressão linear simplessimples
Avaliar possível dependência de y em relação a x;
Expressar matematicamente esta relação (equação).
Análise de regressão simples
Descrevem fenômenos em que há uma variável independente!
Regressão linear Regressão linear simplessimples
A reta de regressão linearA reta de regressão linear
A equação da reta pode ser dada por:
y = A + Bxy = A + Bx
onde
y = variável dependente;
A = coeficiente linear (valor de y quando x = 0)
B = coeficiente angular (inclinação da reta)
x = variável independente
Regressão linear Regressão linear simplessimples
Obtenção da reta de regressãoObtenção da reta de regressão
Mais comum é estudar a regressão entre x e y
utilizando uma amostra da população. Os valores a e b
(estimativas dos valores A e B) são obtidos pelo método dos
mínimos quadrados.
Garante que reta obtida é aquela que se tem as menores Garante que reta obtida é aquela que se tem as menores
distâncias entre os valores observados (x) e a própria reta!distâncias entre os valores observados (x) e a própria reta!
Regressão linear Regressão linear simplessimples
Teste de significância da regressão
Raciocínio do teste
Quando não existe dependência de y em relação a x, o
coeficiente de regressão populacional, B, é igual a zero.
No entanto, valores de b obtidos em amostras
aleatórias da população devem variar, ao acaso, ao redor do
zero.
Etapas do teste de hipóteses da regressão
(1) Elaboração das hipóteses
H0: B = 0
HA: B ≠ 0
(2) Escolha do nível de significância
α = 0,05
(3) tcal > t0,05, rejeita-se H0
(4) Admite-se que existe regressão de y sobre x (α = 0,05)
Regressão linear Regressão linear simplessimples
Regressão linear Regressão linear simplessimples
Utilidades da reta de regressão
A reta de regressão permite:
Representar a dependência de uma variável quantitativa em
relação à outra por meio de uma equação simples;
Prever valores para variável dependente y de acordo com
valores determinados (inclusive não-observados) da variável
independente x.
Regressão linear Regressão linear simplessimples
Requisitos ao uso da regressão linear
A variável y deve ter distribuição normal ou
aproximadamente normal;
O grau de variação em torno dos diferentes valores de
x e y é o mesmo (homocedasticidade);
Pontos do gráfico devem apresentar uma tendência
linear;
Valores de y foram obtidos ao acaso da população e
são independentes um dos outros;
Variável x medida sem erro. Pressupor que os erros
ao se medir x são desprezíveis.
Regressão linear Regressão linear simplessimples
Exemplo prático
Pode-se concluir que a RPE
depende da FC da seguinte forma:
Para cada valor de FC (x)Para cada valor de FC (x)
Estima-se um índice de esforço Estima-se um índice de esforço
percebido (y)!percebido (y)!r2 = 0,99
Regressão linear múltiplaRegressão linear múltiplaConsiste em...Consiste em...
Uso de mais do que uma variável independente usualmente Uso de mais do que uma variável independente usualmente
aumenta a precisão da predição!aumenta a precisão da predição!
Regressão linear Regressão linear múltiplamúltipla
Coeficiente de correlação múltipla (r) Coeficiente de correlação múltipla (r)
Indica a relação entre o fenômeno estudado e a soma de
diferentes pesos das variáveis independentes (explicativas)!
Coeficiente de determinação (RCoeficiente de determinação (R22) )
Quantidade de variância do fenômeno que é explicada ou
considerada pelas variáveis independentes (explicativas)
combinadas!
Regressão linear Regressão linear múltiplamúltipla
Deseja-se encontrar a melhor combinação de
variáveis que darão a predição mais precisa do fenômeno!
Quanto cada variável independente contribui para a
variação total explicada!
Existem vários procedimentos de seleção utilizados para Existem vários procedimentos de seleção utilizados para
esse propósito.esse propósito.
Regressão linear Regressão linear múltiplamúltipla
Regressão múltipla de seleção progressiva (stepwise)
Uma nova variável independente (explicativa) é adicionada a Uma nova variável independente (explicativa) é adicionada a
cada passo.cada passo.
Primeira variável selecionada é aquela que tem a maior
correlação com o fenômeno.
Cada passo subseqüente uma variável é Cada passo subseqüente uma variável é
adicionada àquela, com uma ou mais já escolhidas, adicionada àquela, com uma ou mais já escolhidas,
resultando em uma melhor predição!resultando em uma melhor predição!
Regressão linear Regressão linear múltiplamúltipla
É importante ressaltar que para adicionar variáveis
independentes no modelo, as mesmas não devem apresentar
relações entre elas, pois podem prejudicar na predição!
Regressão múltipla de seleção progressivaRegressão múltipla de seleção progressiva
Variáveis são introduzidas conforme a sua importância e
processo pára quando não existe mais uma contribuição
significativa para predição!
Regressão linear Regressão linear múltiplamúltipla
Regressão múltipla de seleção regressiva (enter)
Variáveis independentes são eliminadas por sua falta de Variáveis independentes são eliminadas por sua falta de
importância para explicar o fenômeno estudado!importância para explicar o fenômeno estudado!
Isto é...Isto é...
Inicia-se testando o modelo de predição com todas
variáveis independentes e de acordo com os seus respectivos
graus de significância, excluem-se aquelas variáveis que não
contribuem para predição e conseqüentemente explicação do
fenômeno.
Regressão linear Regressão linear múltiplamúltipla
Método do R quadrado máximo
Melhor de todos os modelos possíveis de uma
única variável é selecionado, assim como o melhor
modelo de duas variáveis, o melhor modelo de três
variáveis e assim por diante.
Modelo avaliado de acordo com o valor de RModelo avaliado de acordo com o valor de R22!!
Regressão linear Regressão linear múltiplamúltipla
Procedimento de regressão gradativa
Variação da técnica progressiva, exceto pelo fato de que
cada vez que uma nova variável independente é introduzida no
modelo é reavaliado se as variáveis que já estão no mesmo
continuam contribuindo significativamente para explicação do
fenômeno.
Maioria dos casos...
Regressão linear Regressão linear múltiplamúltipla
Equações de predição de regressão múltipla
A equação de predição da regressão múltipla é
basicamente aquela do modelo de regressão de duas
variáveis, y = A + Bx. Única diferença é que existe mais do
que uma variável x:
y = A + By = A + B11xx1 1 +B+B22xx2 2 + ... + B+ ... + Biixxii
Regressão linear Regressão linear múltiplamúltipla
Regressão linear Regressão linear múltiplamúltipla
Regressão linear Regressão linear múltiplamúltipla
tetisantana@yahoo.com.br
0,01*0,01*±15,70±15,70132,80132,80± 14,80± 14,80118,00118,00FC (bpm)FC (bpm)
0,002*0,002*±28,40±28,40148,40148,40± 25,20± 25,20102,40102,40GE (kcal)GE (kcal)
0,002*0,002*± 0,90± 0,904,604,60± 0,80± 0,803,203,20GE (kcal GE (kcal .. min min-1-1))
0,002*0,002*± 2,80± 2,8015,5015,50± 2,70± 2,7010,7010,70VOVO22 (ml (ml .. kg kg-1 .-1 . min min-1-1))
0,002*0,002*± 0,18± 0,180,920,92± 0,16± 0,160,630,63VOVO22 (l (l .. min min-1-1))
Sig.Sig.DPDPMédiaMédiaDPDPMédiaMédia
IntervaladoIntervaladoContínuoContínuo