Força da relação:
+ Compartilhamento de variância;
+ Medida da co-variância;Requisitos:
+ A amostra de dados emparelhados (x e y);
+ Dados aleatórios, quantitativos e independentes;
+ Confrimação gráfica (diarama de dispersão);
+ Sensível a outleirs;
+ Distribuição normal; + O coeficiente de correlação varia de 0 a 1;
+ Ele fornece a direção do relacionamento (Positivo, Negativo ou Zero);
+ Positivo: valores altos e altos (x e y);
+ Negativo: valores altos e baixos (x e y);
+ Zero: nenhuma relação linear;
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 5.00 10.00 11.22 18.00 22.00
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 3.000 6.000 5.667 8.000 10.000
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 5.00 10.00 11.22 18.00 22.00
Detalhes:
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 136.4 470.9 747.0 780.4 1032.4 3177.3
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.020 1.835 7.980 12.345 20.910 69.670 26
Ao que corresponde extamente a força de uma correlação?
+ Porporção entre a covariância e a variação individual;
+ Elevando-se ao quadrado têm-se a variância compartilhada (%); + Coeficiente de 0.757 significa 57,30% de variância compartilhada;
+ 42,69% de variância individual meio a meio (21,34%);
+ Tecnicamente uma variável explica 57,30% da variância da outra;
+ Probabilidade do r ocorrer por erro amostral;
+ Probabilidade do r ser fruto do acaso;
+ Regra geral: r será transforma em escore t.
Qual a forma mais eficiente, por quê?
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.020 1.835 7.980 12.345 20.910 69.670 26
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 8.49 14.00 17.60 19.80 24.60 46.80
+ Dada uma correlação é possível predizer os valores y;
+ Estimar quanto y mudará dado uma alteração em x;
+ x variável independente, previsora ou expanatória;
+ y variável resposta ou dependente;
y = a + bx (função linear)
Tecnicamente:
\(Y = \beta_0 + \beta_1 x + \epsilon\).
+ Todos os citados para correlação;
+ Distribuição uniforme dos resíduos;
+ Bo = Intercepto - valor de y quando x = 0;
+ B1 = Inclinação - o quanto y com a mudança de uma unidade de x;
+ Nenhuma reta passará exatmente sobre todos os pontos;
+ A questão é: onde exatamente deveriámos traçar a reta?
+ No ponto em que minimiza as distância em relaçao aos pontos;
+ A distância entre a reta e cada ponto corresponde aos erros;
+ É possível avaliar o modelo pelo nível e erro ou acerto;
+ Erro: soma do qudrado do erro;
+ Acerto: soma do quadrado da regressão.
+ Total: soma do quadrado do erro + soma do quadrado da regressão.
Tem-se que:
+ Soma do quadrado da regressão representa a melhoria na previsão;
+ Outra foma de expressar a medida é a partir de r²;
+ O r² vaira de 0 a 1 quanto maior melhor a previsão;
+ O quadrado do r de pearson corresponde a r²;