Introdução:

A evasão é um tema de crescente interesse ao redor do mundo (RAMOS, 2017). Historicamente, o ensino superior brasileiro enfrenta altas taxas de evasão escolar. No setor público, a entrada de alunos que, por algum motivo, não finalizam o curso representa uma soma de recursos investidos sem o retorno esperado para sociedade. Segundo Filho et al (2007), o Brasil ainda registra poucos estudos sistemáticos sobre o tema. Nessa nota, nos concentramos na análise da evasão do curso de Ciências Sociais Licenciatura da Universidade Federal de Alagoas (UFAL).

Metodologia:

Originalmente, a base de dados consiste em 721 entradas constando todas as disciplinas/turmas oferecidas no curso entre os semestres de 2010.1 a 2018.2 com número de alunos matriculados acima do número mínimo permitido. Portanto, o estudo cobre todas as disciplinas ministradas nesse período. A princípio a análise compreende todas as observações, porém, na sequência ela explora clivagens por núcleo das disciplinas (comum e específico), por período (iniciais e finais), por área de conhecimento, por disciplinas que mudaram de professor e, por fim, por professor.

Resultados:

Análise Geral:

Nosso ponto de partida será a análise da média da evasão e da retenção por semestre entre 2010.1 e 2018.2. Além disso, examinamos a distribuição das observações dessas duas variáveis.

Evasão e Retenção:

library(openxlsx)
library(psych)
library(ggplot2)
library(stringr)
library(dplyr)
library(viridis)
library(hrbrthemes)
library(Rmisc)

vet2 = seq(2010, 2018, 1)
vv2 <- seq(0.00, 0.40, 0.06)
vv <- (seq(0.0,0.60,0.05))

serie <- read.xlsx("serie.xlsx")

serie$semestre <- as.numeric(serie$semestre)


serie %>%
  ggplot(aes(x=semestre, y=valor, color = medida)) +
  geom_smooth(se = F) + geom_point()+
  scale_color_ft(name = "Medida:")+
  theme_ipsum(base_size = 12) +
  scale_x_continuous(breaks = vet2)+
  scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
  ylab("Proporção da Evasão")+ xlab('Semestres')+ labs(title = paste('Gráfico 01 - Proporção da Evasão por Semestres (2010 - 2018)'))+
  theme(plot.title = element_text( size=12))

Evasão:

serieeva <- read.xlsx("serieeva.xlsx")

serieeva %>%
  ggplot( aes(x=semestre, y= valor)) +
  geom_boxplot()+
  scale_fill_viridis(discrete = TRUE, alpha=0.6) +
  geom_jitter(color="black", size=1.2, alpha=0.5) +
  theme_ipsum()+
  theme(legend.position="none",
        plot.title = element_text(size=11), axis.text.x = element_text(size=6))+
  xlab("Semestres")+
  ylab("Proporção da Evasão")+labs(title = paste('Gráfico 02 - Medidas da Proporção da Evasão por Semestres (2010 - 2018)'))+
  theme(plot.title = element_text( size=12))

geva <- summarySE(serieeva, measurevar="valor", groupvars= "semestre", na.rm = TRUE)
geva <- geva[c(1:17),]


vmed <- (seq(0.0, 0.60, 0.5))

ggplot(geva, aes(x=semestre, y=valor)) + 
  geom_errorbar(aes(ymin=valor-se, ymax=valor+se), width=.3) +
  geom_line() + geom_point() + theme_bw() +
  scale_y_continuous(breaks = vv, limits = c(0, 0.40 ))+
  xlab("Semestre") + 
  ylab("Proporção da Evasão")+
labs(title = paste('        Gráfico 03 - Médias da Proporção da Evasão por Semestres (2010 - 2018)'))+
  theme(plot.title = element_text( size=12), axis.text.x = element_text(size=8))

Medidas Descritivas (Evasão):

describe(serieeva$valor)
##    vars   n mean   sd median trimmed  mad min  max range skew kurtosis
## X1    1 721 0.16 0.18   0.11    0.13 0.16   0 0.83  0.83 1.08      0.5
##      se
## X1 0.01
vdt <- seq(1,40,2)
vu <- seq(0.0,0.80,0.10)

serieeva %>%
  filter(valor > 0.0)%>%
  ggplot( aes(x=valor)) +
  geom_histogram( binwidth=0.02, fill="#778899", color="#778899", alpha=0.9) +
  theme_ipsum() +
  xlab('Proporção da Evasão')+
  scale_x_continuous(breaks = vu)+
  scale_y_continuous(breaks = vdt)+
  ylab('Frequência')+
  geom_vline(xintercept = 0.16, linetype = 2, color = "red")+
  geom_vline(xintercept = 0.52, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 0.34, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 0.70, linetype = 2, color = "#778899")+
labs(title = paste('Gráfico 04 - Frequência da Proporção da Evasão por Semestres (2010 - 2018)'))+
  theme(plot.title = element_text( size=12))

Retenção:

serieret <- read.xlsx("serieret.xlsx")

serieret %>%
  ggplot( aes(x=semestre, y= valor)) +
  geom_boxplot()+
  scale_fill_viridis(discrete = TRUE, alpha=0.6) +
  geom_jitter(color="black", size=1.6, alpha=0.5) +
  theme_ipsum()+
  theme(legend.position="none",
        plot.title = element_text(size=12), axis.text.x = element_text(size=6))+
  xlab("Semestres")+
  ylab("Proporção da Retenção")+
  labs(title = paste('Gráfico 05 - Medidas da Proporção da Retenção por Semestres (2010 - 2018)'))+
  theme(plot.title = element_text( size=12))

geva <- summarySE(serieret, measurevar="valor", groupvars= "semestre", na.rm = TRUE)
geva <- geva[c(1:17),]


vmed <- (seq(0.0, 0.60, 0.5))

ggplot(geva, aes(x=semestre, y=valor)) + 
  geom_errorbar(aes(ymin=valor-se, ymax=valor+se), width=.3) +
  geom_line() + geom_point() + theme_bw() +
  scale_y_continuous(breaks = vv, limits = c(0, 0.40 ))+
  xlab("Semestres") + 
  ylab("Proporção da Retenção")+labs(title = paste('         Gráfico 06 - Médias da Proporção da Retenção por Semestres (2010 - 2018)'))+
  theme(plot.title = element_text( size=12), axis.text.x = element_text(size=8))

Medidas Descritivas:

describe(serieret$valor)
##    vars   n mean   sd median trimmed  mad min max range skew kurtosis   se
## X1    1 721 0.15 0.17    0.1    0.12 0.15   0   1     1 1.44     2.05 0.01
vdt <- seq(1, 60, 5)
vu <- seq(0.0, 1.0,0.10)


serieret %>%
  filter(valor > 0.0)%>%
  ggplot( aes(x=valor)) +
  geom_histogram( binwidth=0.02, fill="#778899", color="#778899", alpha=0.9) +
  theme_ipsum() +
  xlab('Proporção da Retenção')+
  scale_x_continuous(breaks = vu)+
  scale_y_continuous(breaks = vdt)+
  ylab('Frequência')+
  geom_vline(xintercept = 0.15, linetype = 2, color = "red")+
  geom_vline(xintercept = 0.32, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 0.49, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 0.66, linetype = 2, color = "#778899")+
  labs(title = paste('  Gráfico 07 - Frequência da Proporção da Retenção por Semestres (2010 - 2018)'))+
  theme(plot.title = element_text( size=12))

O comportamento das curvas de estimativas das médias mostra uma oscilação constante ao longo do período. Em outros termos, não é possível identificar intervalos com grandes crescimentos ou fortes reduções das medidas. A comparação direta das médias (gráfico 03 e 06) deixa claro esse cenário. A partir dos gráficos de caixa, pode-se observar uma variação de um semestre para o outro, mas não é fácil identificar qualquer padrão. Por fim, os histogramas (gráficos 04 e 07) mostram que: 1) a grande maioria das disciplinas/turma estão abaixo da média nas duas variáveis; 2) há uma assimetria positiva na distribuição das medidas e 3) ambas apresentam algumas observações que podem ser consideradas outliers.

Disciplinas:

Claramente, um elemento relevante para análise da evasão, da retenção e do número de matriculados é a possibilidade de concentração desses fenômenos em algumas disciplinas. Afinal, importa saber quais disciplinas apresentam maior média de evasão e retenção de alunos.

Medidas Descritivas (Evasão):

evadis <- read.xlsx("evadis.xlsx")

describe(evadis$evasão)
##    vars   n mean   sd median trimmed  mad min  max range skew kurtosis
## X1    1 119 0.18 0.18   0.13    0.15 0.12   0 0.83  0.83 1.53     1.97
##      se
## X1 0.02

Evasão:

library(openxlsx)
library(psych)
library(ggplot2)
library(stringr)
library(dplyr)
library(viridis)
library(hrbrthemes)
library(Rmisc)



vv <- (seq(0.0,0.80,0.1))
vdi <- (seq(1,10,1))


evadis %>%
  filter(evasão > 0.0)%>%
  ggplot( aes(x=evasão)) +
  geom_histogram( binwidth=0.02, fill="#778899", color="#778899", alpha=0.9) +
  theme_ipsum() +
  xlab('Proporção da Evasão')+
  scale_x_continuous(breaks = vv)+
  scale_y_continuous(breaks = vdi, limits = c(0, 10))+
  ylab('Frequência')+
  geom_vline(xintercept = 0.18, linetype = 2, color = "red")+
  geom_vline(xintercept = 0.36, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 0.54, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 0.72, linetype = 2, color = "#778899")+
  theme(
    plot.title = element_text(size=12)
  )+ labs(title = paste('Gráfico 08 - Frequência da Proporção Evasão por Disciplina (2010 - 2018)'))+
  theme(plot.title = element_text( size=12))

Medidas Descritivas (Retenção):

describe(evadis$retenção)
##    vars   n mean   sd median trimmed  mad min  max range skew kurtosis
## X1    1 119 0.14 0.15   0.12    0.12 0.13   0 0.73  0.73 1.42     2.16
##      se
## X1 0.01

Retenção:

vv <- (seq(0.0,0.80,0.1))
vdi <- (seq(1,10,1))



evadis %>%
  filter(retenção > 0.0)%>%
  ggplot( aes(x=retenção)) +
  geom_histogram( binwidth=0.02, fill="#778899", color="#778899", alpha=0.9) +
  theme_ipsum() +
  xlab('Proporção da Retenção')+
  scale_x_continuous(breaks = vv)+
  scale_y_continuous(breaks = vdi)+
  ylab('Frequência')+
  geom_vline(xintercept = 0.14, linetype = 2, color = "red")+
  geom_vline(xintercept = 0.29, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 0.44, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 0.59, linetype = 2, color = "#778899")+
  theme(
    plot.title = element_text(size=12)
  )+
 labs(title = paste('Gráfico 09 - Frequência da Proporção da Retenção por Disciplina (2010 - 2018)'))+
  theme(plot.title = element_text( size=12))

Medidas Descritivas (Matriculados):

describe(evadis$matriculados)
##    vars   n  mean   sd median trimmed  mad min  max range skew kurtosis
## X1    1 119 16.37 9.16  13.89   15.13 6.69   6 42.9  36.9  1.2     0.64
##      se
## X1 0.84

Matriculados:

library(Rmisc)

vr <- (seq(0,60,2))
vy <- seq(1,20,1)



evadis%>%
  ggplot( aes(x=matriculados)) +
  geom_histogram( binwidth=2.0, fill="#778899", color="#778899", alpha=0.9) +
  theme_ipsum() +
  xlab('Número de Matriculados')+
  scale_x_continuous(breaks = vr)+
  scale_y_continuous(breaks = vy, limits = c(0,20))+
  ylab('Frequência')+
  geom_vline(xintercept = 16.37, linetype = 2, color = "red")+
  geom_vline(xintercept = 7.21, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 25.53, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 34.69, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 43.85, linetype = 2, color = "#778899")+
  theme(
    plot.title = element_text(size=12)
  )+
 labs(title = paste('Gráfico 10 - Frequência do Número de Matriculados por Disciplina
                                        (2010 - 2018)'))+
  theme(plot.title = element_text( size=12))

evadis%>%
  filter(evasão > 0.1 & retenção > 0.1)%>%
  ggplot(aes(x=evasão, y=retenção)) + 
  geom_point(size=1.0, color="#778899")+
  geom_smooth(method = 'lm', se = F, color="#778899") + 
  scale_x_continuous(breaks = vv)+
  scale_y_continuous(breaks = vv)+
  theme_ipsum()+ xlab('Proporção da Evasão')+ylab('Proporção da Retenção')+
  labs(title = paste('      Gráfico 11 - Proporção da Evasão e  Proporção da Retenção 
                                        por Disciplina (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))+
  geom_vline(xintercept = 0.18, linetype = 2, color = '#778899')+
  geom_hline(yintercept = 0.14, linetype = 2, color = '#778899')

De acordo com os histogramas, apenas oito disciplinas têm médias da proporção da evasão a mais de dois desvios padrões (segunda linha tracejada a direita) da média (linha tracejada vermelha). Esse número é semelhante quanto ao número de matriculados e corresponde a seis quanto a proporção da retenção. O gráfico de dispersão aponta para um correlação negativa fraca entre as proporções da evasão e da retenção. Parte desse resultado explica-se pelo grande número de observações acima das duas médias ao mesmo tempo.

Núcleo das Disciplinas:

De acordo com o Projeto Político Pedagógico (PPC) do curso, a grade curricular é composta por um núcleo comum de disciplinas, em geral, compartilhadas com curso do bacharelado e outro específico, normalmente, de cunho pedagógico. Nessa etapa, investigamos se as variáveis se comportam da mesma maneira nos dois núcleos. Os gráficos abaixo apontam as curvas das estimativas da média das proporções da evasão, da retenção e do número de matriculados.

ev <- read.xlsx("evasn.xlsx")

vet3 = as.numeric(c(2010.1, 2010.2, 2011.1, 2011.2, 2012.1, 2012.2, 2013.1, 2013.2,
                    2014.1, 2014.2, 2015.1, 2015.2, 2016.1, 2016.2, 2017.1, 2017.2, 2018.1, 2018.2))
vet2 = seq(2010, 2018, 1)
vv2 <- seq(0.00, 0.40, 0.06)
vv3 <- seq(5, 70, 5)

ev %>%
  ggplot(aes(x=semestre, y=percevasão, color = núcleo2)) +
  geom_smooth(se = F) + geom_point()+
  scale_color_ft(name = "Núcleos:")+
  theme_ipsum(base_size = 12) +
  scale_x_continuous(breaks = vet2)+
  scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
  ylab("Proporção da Evasão")+ xlab('Semestres')+
  labs(title = paste('Gráfico 12 - Proporção da Evasão por núcleo das disciplinas (2010 - 2018)'))+
  theme(plot.title = element_text( size=12))

ev %>%
  ggplot(aes(x=semestre, y=percretenção, color = núcleo2)) +
  geom_smooth(se=F) + geom_point()+
  scale_color_ft(name = "Núcleos:")+
  scale_x_continuous(breaks = vet2)+
  scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
  theme_ipsum(base_size = 12) +
  ylab("Proporção da Retenção")+ xlab('Semestres')+
  labs(title = paste('Gráfico 13 - Proporção da Retenção por Núcleo das Disciplinas (2010 - 2018)'))+
  theme(plot.title = element_text( size=12))

ev %>%
  ggplot(aes(x=semestre, y=matriculados, color = núcleo2)) +
  geom_smooth(se=F) + geom_point()+
  scale_color_ft(name = "Núcleos:")+
  scale_x_continuous(breaks = vet2)+
  scale_y_continuous(breaks = vv3, limits = c(0.00, 70))+
  theme_ipsum(base_size = 12) +
  ylab("Número de Matriculados")+ xlab('Semestres')+
  labs(title = paste('Gráfico 14 - Número de Matriculados por Núcleo das 
                                     Disciplinas (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

Claramente, há um aumento da evasão nas disciplinas de núcleo específico. A partir de 2016, as disciplinas de núcleo específico passam a registrar estimativas da média maiores que as disciplinas do núcleo comum. Quanto a proporção da retenção, o núcleo comum apresenta as estimas das médias sempre mais altas. O número de matriculados tem estimativas muito próximas nos dois blocos de disciplinas. Outras maneiras de fazer essa comparação é a partir dos gráficos de cinco medidas e da comparação direta das médias.

Evasão:

vbox<-seq(0.0,0.90,length=18)
vbox <- round(vbox, 2)


ggplot(ev, aes(x=núcleo2, y= percevasão, color = núcleo2)) +
  geom_boxplot() +
  scale_color_ft(name = "Núcleos:")+
  geom_jitter(color="black", size=1.6, alpha=0.5) +
  theme_ipsum() +
  scale_y_continuous(breaks = vbox, limits = c(0.0, 0.9))+
  theme(legend.position="none",
        plot.title = element_text(size=12))+
  xlab("Núcleo da Disciplina")+
  ylab("Proporção da Evasão")+
  labs(title = paste('Gráfico 15 - Medidas da Proporção da Evasão por Núcleo das 
                                        Disciplinas (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

geva <- summarySE(ev, measurevar="percevasão", groupvars= "núcleo2", na.rm = TRUE)
geva <- geva[c(1:2),]


vmed <- (seq(0.0, 0.60, 0.5))

ggplot(geva, aes(x=núcleo2, y=percevasão)) + 
  geom_errorbar(aes(ymin=percevasão-se, ymax=percevasão+se), width=.3) +
  geom_line() + geom_point() + theme_bw() +
  scale_y_continuous(breaks = vv, limits = c(0, 0.40 ))+
  xlab("Núcleos") + 
  ylab("Proporção da Evasão")+labs(title = paste('Gráfico 16 - Médias da Proporção da Evasão por Núcleo das Disciplinas (2010 - 2018)'))+
  theme(plot.title = element_text( size=12), axis.text.x = element_text(size=12))

Retenção:

ggplot(ev, aes(x=núcleo2, y= percretenção, color = núcleo2)) +
  geom_boxplot() +
  scale_color_ft(name = "Núcleos:") +
  geom_jitter(color="black", size=1.6, alpha=0.5) +
  theme_ipsum() +
  scale_y_continuous(breaks = vbox, limits = c(0.0, 0.9))+
  theme(legend.position="none",
        plot.title = element_text(size=12))+
  xlab("Núcleo da Disciplina")+
  ylab("Proporção da Retenção")+
  labs(title = paste('Gráfico 17 - Medidas da Proporção de Retenção por Núcleo das
                                Disciplinas (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

geva <- summarySE(ev, measurevar="percretenção", groupvars= "núcleo2", na.rm = TRUE)
geva <- geva[c(1:2),]


vmed <- (seq(0.0, 0.60, 0.5))

ggplot(geva, aes(x=núcleo2, y=percretenção)) + 
  geom_errorbar(aes(ymin=percretenção-se, ymax=percretenção+se), width=.3) +
  geom_line() + geom_point() + theme_bw() +
  scale_y_continuous(breaks = vv, limits = c(0, 0.40 ))+
  xlab("Núcleos") + 
  ylab("Proporção da Evasão")+labs(title = paste('Gráfico 18 - Médias da Proporção da Retenção por Núcleo das Disciplinas (2010 - 2018)'))+
  theme(plot.title = element_text( size=12), axis.text.x = element_text(size=12))

Matriculados:

vbox2 <- seq(0, 70, 8)

ggplot(ev, aes(x=núcleo2, y= matriculados, color = núcleo2)) +
  geom_boxplot() +
   scale_color_ft(name = "Núcleos:")+
  geom_jitter(color="black", size=1.6, alpha=0.5) +
  theme_ipsum() +
  scale_y_continuous(breaks = vv3, limits = c(0, 70))+
  theme(legend.position="none",
        plot.title = element_text(size=12))+
  xlab("Núcleo das Disciplinas")+
  ylab("Número de Matriculados")+
labs(title = paste('Gráfico 19 - Medidas do Número de Matriculados por Núcleo das 
                                   Disciplinas (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

geva <- summarySE(ev, measurevar="matriculados", groupvars= "núcleo2", na.rm = TRUE)
geva <- geva[c(1:2),]


vx <- (seq(1,60,5))

ggplot(geva, aes(x=núcleo2, y=matriculados)) + 
  geom_errorbar(aes(ymin=matriculados-se, ymax=matriculados+se), width=.3) +
  geom_line() + geom_point() + theme_bw() +
  scale_y_continuous(breaks = vx, limits = c(0, 40))+
  xlab("Núcleos") + 
  ylab("Número de Matriculados")+labs(title = paste('               Gráfico 20 - Médias do Número de Matriculados por Núcleo das 
                                                    Disciplinas (2010 - 2018)'))+
  theme(plot.title = element_text( size=12), axis.text.x = element_text(size=12))

De acordo com os gráficos de caixa, em todas as medidas a dispersão é maior dentre as disciplinas de núcleo comum. Quanto a proporção da evasão, a mediana é mais alta dentre as disciplinas do núcleo comum. O mesmo cenário aparece na proporção da retenção, o detalhe quanto a essa medida é que aproximadamente metade das disciplinas do núcleo comum tem retenção acima de 75% das disciplinas de núcleo específico. Claramente, a diferença entre as distribuições é menor quanto ao número de matriculados. A comparação direta entre as médias mostra que tanto a evasão quanto a retenção é significativamente maior nas disciplinas de núcleo comum. Para finalizar essa comparação, podemos observar como a relação entre evasão e retenção se comporta em cada grupo de disciplinas.

Evasão e Retenção:

ev%>%
  filter(percevasão > 0.1 & percretenção > 0.1)%>%
  ggplot(aes(x=percevasão, y=percretenção, color=núcleo2, shape = factor(núcleo2))) + 
  scale_color_ft(name = "Núcleos:") +
  geom_point(size=2.5, color="#778899") +
  geom_smooth(method = 'lm', se = F) + 
  theme_ipsum()+ xlab('Proporção da Evasão')+ylab('Proporção da Retenção')+
  labs(title = paste('Gráfico 21 - Proporção da Evasão e  Proporção da Retenção por Tipo de
                                          Disciplina (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))+
  geom_hline(yintercept = 0.17, linetype = 2, color = 'grey')+
  geom_hline(yintercept = 0.11, linetype = 2, color = '#69b3a2')+
  geom_vline(xintercept = 0.17, linetype = 2, color = 'grey')+
  geom_vline(xintercept = 0.14, linetype = 2, color = '#69b3a2')+
  guides(shape = FALSE) 

Tanto nas disciplinas de núcleo comum, quanto nas de núcleo específico a correlação é negativa. Portanto, quanto maior a proproção da evasão menor tende a ser da retenção. As linhas pontilhadas sinalizam as médias das duas variáveis em cada um dos núcleos. A partir delas e da inclinação das retas nota-se que a relação é mais forte nas disciplinas de núcleo comum.

Períodos Iniciais:

Até aqui os dados foram analisados no agregado, com todos os períodos juntos. Todavia, a queda no número de alunos, comum nos primeiros períodos, aponta para a concentração da proporção da evasão nos semestres iniciais do curso. Dessa forma, concentramos nossa atenção na análise dos dados desses períodos.

Evasão:

evaper <- read.xlsx("evaper.xlsx")

evaper %>%
  ggplot(aes(x=semestre, y=percevasão, color = periodo2)) +
  geom_smooth(se = F) + geom_point()+
  scale_color_brewer(name = "Periodos:")+
  theme_ipsum(base_size = 12) +
  scale_x_continuous(breaks = vet2)+
  scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
  ylab("Proporção da Evasão")+ xlab('Semestres')+
  labs(title = paste('Gráfico 22 - Proporção da Evasão nos Períodos Iniciais
                                            (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

Retenção:

evaper %>%
  ggplot(aes(x=semestre, y=percretenção, color = periodo2)) +
  geom_smooth(se=F) + geom_point()+
  scale_color_brewer(name = "Periodos:")+
  scale_x_continuous(breaks = vet2)+
  scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
  theme_ipsum(base_size = 12) +
  ylab("Proporção da Retenção")+ xlab('Semestres')+
  labs(title = paste('Gráfico 23 - Proporção da Retenção nos Períodos Iniciais 
                                    (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

Matriculados:

evaper %>%
  ggplot(aes(x=semestre, y=matriculados, color = periodo2)) +
  geom_smooth(se=F) + geom_point()+
  scale_color_brewer(name = "Periodos:")+
  scale_x_continuous(breaks = vet2)+
  scale_y_continuous(breaks = vv3, limits = c(0.00, 70))+
  theme_ipsum(base_size = 12) +
  ylab("Número de Matriculados")+ xlab('Semestres')+
  labs(title = paste('Gráfico 24 - Número de Matriculados nos Períodos Iniciais
                                    (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

Quanto a proporção da evasão, a curva que mais se destaca é a do primeiro período. Há uma queda na estimativa da média entre 2010 e 2012, nos quatro anos seguintes (oito semestres posteriores) a curva inverte seu comportamento e apresenta um crescimento. Por fim, nos dois últimos anos a curva volta a registrar uma queda na estimativa. Contrariamente, as curvas de todos os demais períodos apresentam um crescimento nos últimos períodos analisados. Nesse cenário, o destaque vai para o crescimento registrado no quarto período. Quanto a proporção da retenção, a oscilação ao longo do período é comportamento comum a todas as curvas. Por fim, em relação ao número de matriculados, as curvas do primeiro e do segundo períodos apresentam comportamentos peculiares. As estimativas do primeiro período apresentam uma queda entre 2010 e 2013, na sequência registram um crescimento e volta a apresentar uma queda entre 2015 e 2018. A curva do segundo período apresenta uma queda de mais de 50% entre os anos de 2010 e 2013.

Para analisar com mais detalhes o que acontece com a proporção da evasão, com a da retenção e com o número de matriculados nos períodos iniciais do curso, apresentamos uma comparação direta das médias.
library(Rmisc)

novo <- c("Primeiro", "Segundo", "Terceiro", "Quarto")

evaper$periodo2 <- factor(evaper$periodo2, novo)

geva <- summarySE(evaper, measurevar="percevasão", groupvars= "periodo2", na.rm = TRUE)
geva <- geva[c(1:4),]


ggplot(geva, aes(x=periodo2, y=percevasão)) + 
  geom_errorbar(aes(ymin=percevasão-se, ymax=percevasão+se), width=.3) +
  geom_point() + theme_bw() +
  scale_y_continuous(breaks = vv2, limits = c(0.0, 0.3))+
  xlab("Período das Disciplinas") + 
  ylab("Proporção da Evasão")+
  labs(title = paste('Gráfico 25 - Médias da Proporção da Evasão nos Períodos Iniciais (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

novo <- c("Primeiro", "Segundo", "Terceiro", "Quarto")

evaper$periodo2 <- factor(evaper$periodo2, novo)


geva <- summarySE(evaper, measurevar="percretenção", groupvars= "periodo2", na.rm = TRUE)
geva <- geva[c(1:4),]

ggplot(geva, aes(x=periodo2, y=percretenção)) + 
  geom_errorbar(aes(ymin=percretenção-se, ymax=percretenção+se), width=.3) +
  geom_point() + theme_bw() +
  scale_y_continuous(breaks = vv2, limits = c(0.0, 0.3))+
  xlab("Período das Disciplinas") + 
  ylab("Proporção da Retenção")+
  labs(title = paste('Gráfico 26 - Médias da Proporção de Retenção nos Períodos Iniciais (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

novo <- c("Primeiro", "Segundo", "Terceiro", "Quarto")

evaper$periodo2 <- factor(evaper$periodo2, novo)


geva <- summarySE(evaper, measurevar="matriculados", groupvars= "periodo", na.rm = TRUE)
geva <- geva[c(1:4),]

ggplot(geva, aes(x=periodo, y=matriculados)) + 
  geom_errorbar(aes(ymin=matriculados-se, ymax=matriculados+se), width=.3) +
  geom_point() + theme_bw() +
  scale_y_continuous(breaks = vv3, limits = c(0, 50))+
  xlab("Período das Disciplinas") + 
  ylab("Número de Matriculados)")+
  labs(title = paste('Gráfico 27 - Média do Número de Matriculados nos Períodos Iniciais (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

Tanto a proporção da evasão quanto a do número de matriculados apresentam médias decrescentes a partir do primeiro período. Especificamente, a média da proporção da evasão no primeiro período ultrapassa os 25%. A menor incidência ocorre no quarto período, a magnitude do fenômeno cai para um patamar pouco acima de 12%. O número de matriculados reforça esse dado, precisamente, o número médio de matriculados cai de 37 no primeiro período para menos de 20 no quarto. Para finalizar a análise nos primeiros períodos, apresentamos uma gráfico de dispersão com a proporção da evasão e a proporção da retenção.

evaper%>%
  filter(percevasão > 0.1 & percretenção > 0.1)%>%
  ggplot(aes(x=percevasão, y=percretenção, color=periodo2, shape = factor(periodo2))) + 
  scale_color_brewer(name = "Períodos:")+
  geom_point(size=2.5, color="#778899") +
  geom_smooth(method = 'lm', se = F) + 
  theme_ipsum()+ xlab('Proporção da Evasão')+ylab('Proporção da Retenção')+
  labs(title = paste('Gráfico 28 - Proporção da Evasão e Proporção da Retenção no Perídos Iniciais (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))+
  geom_hline(yintercept = 0.17, linetype = 2, color = 'grey')+
  geom_hline(yintercept = 0.11, linetype = 2, color = '#69b3a2')+
  geom_vline(xintercept = 0.17, linetype = 2, color = 'grey')+
  geom_vline(xintercept = 0.14, linetype = 2, color = '#69b3a2')+
  guides(shape = FALSE) 

Com exceção do quarto período, em todos os demais, a correlação entre as proporções da evasão e da retenção é negativa. Portanto, quanto maior a retenção menor a evasão. Apenas para investigar a impressão de que a evasão se concentra nos períodos iniciais vamos observar a estimativa das médias para os períodos finais.

novo <- c("Quinto", "Sexto", "Setimo", "Oitavo", "Nono")

evaper$periodo2 <- factor(evaper$periodo2, novo)

evaper2 <- read.xlsx("evaper2.xlsx")

evaper2 %>%
  ggplot(aes(x=semestre, y=percevasão, color = periodo2)) +
  geom_smooth(se = F) + geom_point()+
  scale_color_brewer(name = "Períodos:")+
  theme_ipsum(base_size = 12) +
  scale_x_continuous(breaks = vet2)+
  scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
  ylab("Proporção da Evasão")+ xlab('Semestres')+
  labs(title = paste('Gráfico 29 - Médias da Proporção da Evasão nos Períodos 
                                        Finais (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

novo <- c("Quinto", "Sexto", "Setimo", "Oitavo", "Nono")

evaper2$periodo2 <- factor(evaper2$periodo2, novo)

geva <- summarySE(evaper2, measurevar="percevasão", groupvars= "periodo2", na.rm = TRUE)
geva <- geva[c(1:5),]


ggplot(geva, aes(x=periodo2, y=percevasão)) +  
  geom_errorbar(aes(ymin=percevasão-se, ymax=percevasão+se), width=.3) +
  geom_point() + theme_bw() +
  scale_y_continuous(breaks = vv2, limits = c(0.0, 0.3))+
  xlab("Período das Disciplinas") + 
  ylab("Proporção da Evasão")+
  labs(title = paste('Gráfico 30 - Média da Proporção da Evasão nos Períodos Finais (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

Claramente, os dados confirmam a impressão. Das cinco curvas, quatro apresentam crescimento entre 2014 e 2017, porém nenhuma das estimativas fica acima de 18%, patamar ultrapassado por diversas estimativas da evasão registrada nos períodos iniciais. Além disso, dos cinco períodos analisados, quatro têm médias abaixo de 12%, apenas o nono período tem uma evasão acima desse patamar.

Área de conhecimento:

Como o curso está divido em, ao menos três, áreas de conhecimento a análise a seguir apresenta o quadro da evasão, da retenção e do número de matriculados considerando essas áreas. Precisamente, as disciplinas foram classificadas em quatro categorias, pela ordem alfabética: 1) Antropologia; 2) Ciência Política; 3) Metodologia e 4) Sociologia.

Evasão:

evarea <- read.xlsx("evarea.xlsx")

evarea %>%
  ggplot(aes(x=semestre, y=percevasão, color = area2)) +
  geom_smooth(se = F) + geom_point()+
  scale_color_brewer(name = "Área:")+
  theme_ipsum(base_size = 12) +
  scale_x_continuous(breaks = vet2)+
  scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
  ylab("Proporção da Evasão")+ xlab('Semestres')+
  labs(title = paste('Gráfico 31 - Média da Proporção da Evasão por Área de Conhecimento
                                            (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

Retenção:

evarea %>%
  ggplot(aes(x=semestre, y=percretenção, color = area2)) +
  geom_smooth(se=F) + geom_point()+
  scale_color_brewer(name = "Área:")+
  scale_x_continuous(breaks = vet2)+
  scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
  theme_ipsum(base_size = 12) +
  ylab("Proporção da Retenção")+ xlab('Semestres')+
  labs(title = paste('Gráfico 32 - Média da Proporção da Retenção por Área de Conhecimento
                                            (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

Matriculados:

evarea %>%
  ggplot(aes(x=semestre, y=matriculados, color = area2)) +
  geom_smooth(se=F) + geom_point()+
  scale_color_brewer(name = "Área:")+
  scale_x_continuous(breaks = vet2)+
  scale_y_continuous(breaks = vv3, limits = c(0.00, 70))+
  theme_ipsum(base_size = 12) +
  ylab("Número de Matriculados")+ xlab('Semestres')+
  labs(title = paste('Gráfico 33 - Média do Número de Matriculados por Área de 
                                  Conhecimento (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

Durante quase todo período analisado, a proporção da evasão é maior nas disciplinas da área de Antropologia. Na maior parte do tempo, a segunda colocação fica com as disciplinas de Ciência Política. Todavia, a curva que apresenta as oscilações mais intensas é a correspondente as disciplinas de Sociologia. Entre 2015 e 2018 a estimativa da média da proporção da evasão nessa área passa de algo próximo a 6% para mais de 20%. Quanto a proporção da retenção e ao número de matriculados, as curvas permanecem muito próximas ao longo de todo período. Merece destaque apenas o número de matriculados das disciplinas de metodologia, há um crescimento entre o início da série e 2015 e uma queda a partir desse ponto. Para auxiliar nessa análise vamos fazer a comparação direta entre as médias da proporção da evasão, da retenção e do número de matriculados durante todo o período.

Evasão:

geva <- summarySE(evarea, measurevar="percevasão", groupvars= "area2", na.rm = TRUE)
geva <- geva[c(1:4),]

ggplot(geva, aes(x=area2, y=percevasão)) + 
  geom_errorbar(aes(ymin=percevasão-se, ymax=percevasão+se), width=.3) +
  geom_line() + geom_point() + theme_bw() +
  scale_y_continuous(breaks = vv2, limits = c(0.0, 0.3))+
  xlab("Áreas") + 
  ylab("Proporção da Evasão")+
  labs(title = paste('       Gráfico 34 - Média da Proporção da Evasão por Área de Conhecimento 
                                          (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

Retenção:

geva <- summarySE(evarea, measurevar="percretenção", groupvars= "area2", na.rm = TRUE)
geva <- geva[c(1:4),]

ggplot(geva, aes(x=area2, y=percretenção)) + 
  geom_errorbar(aes(ymin=percretenção-se, ymax=percretenção+se), width=.3) +
  geom_line() + geom_point() + theme_bw() +
  scale_y_continuous(breaks = vv2, limits = c(0.0, 0.3))+
  xlab("Áreas") + 
  ylab("Proporção da Retenção")+
  labs(title = paste('       Gráfico 35 - Média da Proporção da Retenção por Área de Conhecimento
                                          (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

Matriculados:

geva <- summarySE(evarea, measurevar="matriculados", groupvars= "area2", na.rm = TRUE)
geva <- geva[c(1:4),]

ggplot(geva, aes(x=area2, y=matriculados)) + 
  geom_errorbar(aes(ymin=matriculados-se, ymax=matriculados+se), width=.3) +
  geom_line() + geom_point() + theme_bw() +
  scale_y_continuous(breaks = vv3, limits = c(0, 50))+
  xlab("Áreas") + 
  ylab("Número de Matriculado")+
  labs(title = paste('      Gráfico 36 - Média do Número de Matriculados por Área de Conhecimento
                                              (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

A comparação das médias de todo o período confirma o que as curvas das estimativas já haviam mostrado. As disciplinas da Antropologia são as que registram a maior média da proporção de evasão. Quanto a proporção da retenção, as disciplinas de Sociologia aparecem como aquelas que possuem a maior média, seguida das metodológicas, das antropológicas e as da Ciência Política.

Mudança do Professor:

Parte dos professores acreditam que a didática dos professores que ministram as disciplinas é uma variável importante para explicar os fenômenos da evasão e da retenção. Uma forma de verificar indiretamente essa hipótese é observar se a mudança do professor da disciplina tem efeito nessas medidas. O gráfico abaixo compara a estimativa das médias da proporção da evasão.

Evasão:

evamuda <- read.xlsx("evamuda.xlsx")

evamuda %>%
  ggplot(aes(x=semestre, y=percevasão, color = Mud)) +
  geom_smooth(se = F) + geom_point()+
  scale_color_ft(name = "Mudança:")+
  theme_ipsum(base_size = 12) +
  scale_x_continuous(breaks = vet2)+
  scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
  ylab("Proporção da Evasão")+ xlab('Semestre')+
  labs(title = paste('Gráfico 37 - Média da Proporção da Evasão por Mudança
                              de Professor (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

Retenção:

evamuda %>%
  ggplot(aes(x=semestre, y=percretenção, color = Mud)) +
  geom_smooth(se = F) + geom_point()+
  scale_color_ft(name = "Mudança:")+
  theme_ipsum(base_size = 12) +
  scale_x_continuous(breaks = vet2)+
  scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
  ylab("Proporção Retenção")+ xlab('Semestre')+
  labs(title = paste('Gráfico 38 - Média da Proporção da Retenção por Mudança
                              de Professor (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

Matriculados:

evamuda %>%
  ggplot(aes(x=semestre, y=matriculados, color = Mud)) +
  geom_smooth(se = F) + geom_point()+
  scale_color_ft(name = "Mudança:")+
  theme_ipsum(base_size = 12) +
  scale_x_continuous(breaks = vet2)+
  scale_y_continuous(breaks = vv3, limits = c(0.0, 70))+
  ylab("Número de Matriculados")+ xlab('Semestre')+
  labs(title = paste('Gráfico 39 - Média do Número de Matriculados por Mudança
                              de Professor (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

As curvas oscilação ao longo do período, mas permanecem sempre próximas. Especificamente quanto a evasão, o desenho da curva das disciplinas que mantiveram os professores é semelhante àquela referente as disciplinas que mudaram o docente de um semestre para outro. A comparação das médias dos dois grupos de disciplina no período tornará mais claro o efeito da mudança de professor nas variáveis.

Evasão:
geva <- summarySE(evamuda, measurevar="percevasão", groupvars= "Mud", na.rm = TRUE)
geva <- geva[c(1,2),]

ggplot(geva, aes(x=Mud, y=percevasão)) + 
  geom_errorbar(aes(ymin=percevasão-se, ymax=percevasão+se), width=.3) +
  geom_line() + geom_point() + theme_bw() +scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
  xlab("Mundança de Professor") + 
  ylab("Proporção da Evasão")+
  labs(title = paste('Gráfico 40 - Média da Proporção da Evasão por Mudança de Professor
                                                (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

Retenção:

geva <- summarySE(evamuda, measurevar="percretenção", groupvars= "Mud", na.rm = TRUE)
geva <- geva[c(1,2),]

ggplot(geva, aes(x=Mud, y=percretenção)) + 
  geom_errorbar(aes(ymin=percretenção-se, ymax=percretenção+se), width=.3) +
  geom_line() + geom_point() + theme_bw() +scale_y_continuous(breaks = vv2, limits = c(0.00, 0.30))+
  xlab("Mundança de Professor") + 
  ylab("Proporção da Retenção")+
  labs(title = paste('Gráfico 41 - Média da Proporção da Retenção por Mudança de Professor
                                                  (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

Matriculados:

geva <- summarySE(evamuda, measurevar="matriculados", groupvars= "Mud", na.rm = T)
geva <- geva[c(1:2),]


ggplot(geva, aes(x=Mud, y=matriculados)) + 
  geom_errorbar(aes(ymin=matriculados-se, ymax=matriculados+se), width=.3) +
  geom_line() + geom_point() + theme_bw() +
  scale_y_continuous(breaks = vv3, limits = c(0, 50))+
  xlab("Mundança de Professor") + 
  ylab("Número de Matriculados")+
  labs(title = paste('Gráfico 42 - Média do Número de Matriculados por Mudança
                              de Professor (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

Tanto a proporção da retenção quanto o número de matriculados apresentam médias significativamente mais altas dentre as disciplinas que mudaram de professor. Quanto a proporção da evasão, não há diferença estatisticamente significativa entre as médias. Em outros termos, a mudança do docente não tem efeito sobre a proporção da evasão. A análise a partir dos gráficos de caixa representa a comparação entre os grupos a partir de outras medidas.

Evasão:

ggplot(evamuda, aes(x=Mud, y= percevasão, color = Mud)) +
  geom_boxplot() +
  scale_color_ft(name = "Mudança:")+
  geom_jitter(color="black", size=1.6, alpha=0.5) +
  theme_ipsum() +
  scale_y_continuous(breaks = vbox, limits = c(0.0, 0.9))+
  theme(legend.position="none",
        plot.title = element_text(size=18))+
  xlab("Mudança de Professor")+
  ylab("Proporção Evasão")+
  labs(title = paste('Gráfico 43 - Medidas da Proporção da Evasão por Mudança
                              de Professor (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

Retenção:

ggplot(evamuda, aes(x=Mud, y= percretenção, color = Mud)) +
  geom_boxplot() +
  scale_color_ft(name = "Mudança:") +
  geom_jitter(color="black", size=1.6, alpha=0.5) +
  theme_ipsum() +
  scale_y_continuous(breaks = vbox, limits = c(0.0, 0.9))+
  theme(legend.position="none",
        plot.title = element_text(size=18))+
  xlab("Mudança de Professor")+
  ylab("Proporção Retenção")+
  labs(title = paste('Gráfico 44 - Medidas da Proporção da Retenção por Mudança
                              de Professor (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

Matriculados:

ggplot(evamuda, aes(x=Mud, y= matriculados, color = Mud)) +
  geom_boxplot() +
  scale_color_ft(name = "Mudança:")+
  geom_jitter(color="black", size=1.6, alpha=0.5) +
  theme_ipsum() +
  scale_y_continuous(breaks = vv3, limits = c(0, 70))+
  theme(legend.position="none",
        plot.title = element_text(size=18))+
  xlab("Mudança de Professor")+
  ylab("Número de Matriculados")+
  labs(title = paste('Gráfico 45 - Medidas do Número de Matriculados por Mudança de 
                                      Professor (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

Claramente, quando a medida é a proporção da evasão, o grupo das disciplinas que mantiveram e o grupo das disciplinas que mudaram de professor apresentam caixas semelhantes. Quanto a proporção da retenção, as disciplinas que mudaram de professor apresentam uma distribuição mais dispersa. Além disso, a mediana é mais alta e o terceiro quartil tem uma amplitude claramente maior. Por fim, o número de matriculados segue um comportamento semelhante ao da proporção da retenção, com a mediana maior e a amplitude mais alta do terceiro quartil no grupo de disciplinas que mudaram de professor.

Professor:

Por fim, chegamos ao nível mais desagregado da análise. Uma etapa importante para observar se alguns docentes registram níveis de evasão e de retenção significativamente mais altos que outros. Nessa análise, consideraremos outliers os docentes que estiverem a mais de três desvios padrões da média.

Evasão:

library(psych)

evaprom <- read.xlsx("evaprom.xlsx")

describe(evaprom$evasão)
##    vars  n mean   sd median trimmed  mad min  max range skew kurtosis   se
## X1    1 52 0.18 0.12   0.17    0.17 0.12   0 0.52  0.52 0.49     0.03 0.02
describe(evaprom$retenção)
##    vars  n mean   sd median trimmed  mad min  max range skew kurtosis   se
## X1    1 52 0.18 0.13   0.17    0.17 0.13   0 0.53  0.53  0.7     0.03 0.02
vb <- (seq(1.0,10,1.0))
vv <- (seq(0.0,0.60,0.05))

evaprom %>%
ggplot( aes(x=evasão)) +
  geom_histogram( binwidth=0.02, fill="#778899", color="#778899", alpha=0.9) +
  theme_ipsum() +
  xlab('Proporção da Evasão')+
  scale_x_continuous(breaks = vv)+
  scale_y_continuous(breaks = vb)+
  ylab('Frequência')+
  geom_vline(xintercept = 0.18, linetype = 2, color = "red")+
  geom_vline(xintercept = 0.06, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 0.54, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 0.42, linetype = 2, color = "#778899")+
  theme(
    plot.title = element_text(size=12)
  )+
  labs(title = paste('Gráfico 46 - Frequência da Proporção da Evasão por Professor
                                              (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

Retenção:

vb <- seq(1,10,1)

evaprom %>%
  ggplot( aes(x=retenção)) +
  geom_histogram( binwidth=0.02, fill="#778899", color="#778899", alpha=0.9) +
  theme_ipsum() +
  xlab('Retenção')+
  scale_x_continuous(breaks = vv)+
  scale_y_continuous(breaks = vb)+
  ylab('Frequência')+
  geom_vline(xintercept = 0.18, linetype = 2, color = "red")+
  geom_vline(xintercept = 0.05, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 0.57, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 0.44, linetype = 2, color = "#778899")+
  theme(
    plot.title = element_text(size=15)
  )+
  labs(title = paste('Gráfico 47 - Frequência da Proporção da Retenção por Professor 
                                            (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

Matriculados:

evaprom %>%
  ggplot( aes(x=matriculados)) +
  geom_histogram( binwidth=1.8, fill="#778899", color="#778899", alpha=0.9) +
  theme_ipsum() +
  xlab('Matriculados')+
  scale_x_continuous(breaks = vv3)+
  scale_y_continuous(breaks = vb)+
  ylab('Frequência')+
  geom_vline(xintercept = 20.15, linetype = 2, color = "red")+
  geom_vline(xintercept = 36,29, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 44,36, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 4,01, linetype = 2, color = "#778899")+
  theme(
    plot.title = element_text(size=12)
  )+
  labs(title = paste('Gráfico 48 - Frequência do Número de Matriculados por Professor
                                                  (2010 - 2018)'))+
  theme(plot.title = element_text(size=12))

De acordo com os histogramas, não há professores com médias da proporção da evasão ou da retenção acima de três desvios padrões (posição sinalizada pela última linha pontilhada à direita). Precisamente, apenas dois professores apresentam médias acima de dois desvios padrões da proporção da evasão e três com médias superiores a dois desvios padrões da proporção da retenção. Quanto ao número de matriculados, apenas quatro professores comandaram disciplinas com número de alunos a dois ou mais desvios padrões acima da média.

Conclusão:

As análises realizadas até aqui ajudam a tornar os fenômenos da evasão e da retenção no curso de Licenciatura em Ciências Sociais mais claros. Em resumo, os principais achados mostram que: 1) não há indícios de crescimento do fenômeno; 2) as disciplinas do núcleo comum são as que registram maiores médias de evasão e de retenção (temos, um fenômeno copeiro); 3) os períodos iniciais são os que registram os maiores níveis de evasão e de retenção; 4) As disciplinas de Antropologia são as que apresentam o maior nível de evasão; 5) As disciplinas de Sociologia são as que apresentam os maiores níveis de retenção; 6) disciplinas que mudaram de professor não apresentam evasão acima daquelas que mantem e 7) disciplinas que mudaram de professor registram um nível de retenção maior que aquelas que não mudaram.

Com esse estudo o Núcleo Docente Estruturante (NDE) pretende contribuir com debate sobre os fenômenos da evasão e retenção a fim de planejar ações de combate. Vale informar, a base de dados e o script com as análises que constam nessa nota e com outras que não constam aqui serão disponibilizados no site do Instituto.