14 de outubro de 2019

Análise Exploratória:

drawing

Dado ?

drawing

Hierarquia:

drawing

Propriedades:

drawing

Propriedades:

drawing

Fácil:

drawing

Será ?

Base de Dados

drawing

  • Encontre as cinco menores ximbras?

Arrumando Dados

"Conjunto de dados arrumados são todos iguais, mas cada conjunto de dados bagunçado é bangunçado de sua própria maneira."

Hadley Wickham

Regras de Arrumação

drawing

+ Cada variável deve ger sua própria coluna;
+ Cada observação deve ter sua própria linha;
+ Cada valor deve ter sua própria célua;

Base de Dados

drawing

Informação

drawing

  • Como extrair informação?

Propriedades

drawing

Informações

drawing

+ Qual o centro do conjunto de dados?
+ Qual a variação contida nele? 
+ Qual tipo de distribuição?
+ Existem outliers?
+ Refere-se a quantos momentos no tempo?

Centro:

  + Variável: Mortalidade Infatil (0-5 anos)
  
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    8.49   13.80   16.90   19.25   23.80   46.80
  • Informação:
    • Mediana (16.90) e Média (19.25);
    • Amplitude: 46.80 - 8.49;
    • 1º e 3º Quart: 13.80; 23.80;
  • Conhecimento:
    • Metade do conjunto tem valor entre 8.49 e 19.90;
    • A melhor estimação de qualquer valor é 19.25;
    • A metade superior do conjunto tem amplitude maior;

Análise Gráfica:

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    8.49   13.80   16.90   19.25   23.80   46.80

Variação:

##    vars    n  mean   sd median trimmed  mad  min  max range skew kurtosis
## X1    1 5565 19.25 7.14   16.9    18.4 6.08 8.49 46.8 38.31 1.01     0.43
##     se
## X1 0.1

Variação:

Informação: 1) sd: 7.14; 2) Skew: 1.01; 3) kurtosis: 0.43; 4) CV: 37.09 %.

Variação:

Conhecimento: 1) A maiorias das obs. - 1sd; 2) Não há obs. a - 2sd; 3) Há obs. a + 3sd.

Variação:

Conhecimento: 1) Há escores a + 3sd; 2) A maioria está - 1sd.

Distribuição:

Conhecimento: 1) Distribuição assimétrica positiva;

Distribuição:

Conchec: distibuição não tem formato de sino.

Outlier:

Conhecimento: Existem Outliers;

Análsie Exploratória:

  • Questão: qual a ditribuição geo-espacial da variável?

Análsie Exploratória:

Conhec: 1) NE > mediana, valores e amplitude; 2) SU < mediana e amplitude.

Comparação de Média

drawing

Análsie Exploratória:

Conhec: 1) AL > mediana e amplitude; 2) RN < mediana CE < amplitude;

Comparação de Medias

drawing

Análsie Exploratória:

Conhec: 1) PR > mediana; 2) SC < mediana;

Comparação de Média

drawing

Análise Exploratória

  + O fenômeno tem relação com outras variáveis (?):

drawing

Análise Exploratória

##    vars    n mean   sd median trimmed mad min   max range skew kurtosis
## X1    1 5565 3.03 1.86   2.81     2.9 1.7   0 13.22 13.22 0.86     1.43
##      se
## X1 0.02

Análise da Correlação

## Call:corr.test(x = Munic$Mort, y = Munic$Grav)
## Correlation matrix 
## [1] 0.3
## Sample Size 
## [1] 5565
## Probability values  adjusted for multiple tests. 
## [1] 0
## 
##  To see confidence intervals of the correlations, print with the short=FALSE option

Análise da Correlação

Análise da Correlação (sem outliers)

Análise da Correlação (NE)

Análise da Correlação (SU)

Slide with Plot