14 de outubro de 2019
"Conjunto de dados arrumados são todos iguais, mas cada conjunto de dados bagunçado é bangunçado de sua própria maneira."
Hadley Wickham
+ Cada variável deve ger sua própria coluna; + Cada observação deve ter sua própria linha; + Cada valor deve ter sua própria célua;
+ Qual o centro do conjunto de dados? + Qual a variação contida nele? + Qual tipo de distribuição? + Existem outliers? + Refere-se a quantos momentos no tempo?
+ Variável: Mortalidade Infatil (0-5 anos)
## Min. 1st Qu. Median Mean 3rd Qu. Max. ## 8.49 13.80 16.90 19.25 23.80 46.80
## Min. 1st Qu. Median Mean 3rd Qu. Max. ## 8.49 13.80 16.90 19.25 23.80 46.80
## vars n mean sd median trimmed mad min max range skew kurtosis ## X1 1 5565 19.25 7.14 16.9 18.4 6.08 8.49 46.8 38.31 1.01 0.43 ## se ## X1 0.1
Informação: 1) sd: 7.14; 2) Skew: 1.01; 3) kurtosis: 0.43; 4) CV: 37.09 %.
Conhecimento: 1) A maiorias das obs. - 1sd; 2) Não há obs. a - 2sd; 3) Há obs. a + 3sd.
Conhecimento: 1) Há escores a + 3sd; 2) A maioria está - 1sd.
Conhecimento: 1) Distribuição assimétrica positiva;
Conchec: distibuição não tem formato de sino.
Conhecimento: Existem Outliers;
Conhec: 1) NE > mediana, valores e amplitude; 2) SU < mediana e amplitude.
Conhec: 1) AL > mediana e amplitude; 2) RN < mediana CE < amplitude;
Conhec: 1) PR > mediana; 2) SC < mediana;
+ O fenômeno tem relação com outras variáveis (?):
## vars n mean sd median trimmed mad min max range skew kurtosis ## X1 1 5565 3.03 1.86 2.81 2.9 1.7 0 13.22 13.22 0.86 1.43 ## se ## X1 0.02
## Call:corr.test(x = Munic$Mort, y = Munic$Grav) ## Correlation matrix ## [1] 0.3 ## Sample Size ## [1] 5565 ## Probability values adjusted for multiple tests. ## [1] 0 ## ## To see confidence intervals of the correlations, print with the short=FALSE option