Introdução:

A evasão é um tema de crescente interesse ao redor do mundo (RAMOS, 2017). Historicamente, o ensino superior brasileiro enfrenta altas taxas de evasão escolar. No setor público, a entrada de alunos que, por algum motivo, não finalizam o curso representa uma soma de recursos investidos sem o retorno esperado para sociedade. Segundo Filho et al (2007), o Brasil ainda registra poucos estudos sistemáticos sobre o tema. Nessa nota, nos concentramos na análise da evasão do curso de Ciências Sociais Licenciatura da Universidade Federal de Alagoas (UFAL).

Metodologia:

Originalmente, a base de dados consiste em 721 entradas constando todas as disciplinas/turmas oferecidas no curso entre os semestres de 2010.1 a 2018.2 com número de alunos matriculados acima do número mínimo permitido. Portanto, o estudo cobre todas as disciplinas ministradas nesse período. A princípio a análise compreende todas as observações, porém, na sequência ela explora clivagens por núcleo das disciplinas (comum e específico), por período (iniciais e finais), por área de conhecimento, por disciplinas que mudaram de professor e, por fim, por professor.

Resultados:

Análise Geral:

Nosso ponto de partida será a análise da média da evasão e da retenção por semestre entre 2010.1 e 2018.2. Além disso, examinamos a distribuição das observações dessas duas variáveis.

Evasão e Retenção:

library(openxlsx)
library(psych)
library(ggplot2)
library(stringr)
library(dplyr)
library(viridis)
library(hrbrthemes)
library(Rmisc)

vet2 = seq(2010, 2018, 1)
vv2 <- seq(0.00, 0.40, 0.06)
vv <- (seq(0.0,0.60,0.05))

serie <- read.xlsx("serie.xlsx")

serie$semestre <- as.numeric(serie$semestre)


serie %>%
  ggplot(aes(x=semestre, y=valor, color = medida)) +
  geom_smooth(se = F) + geom_point()+
  scale_color_ft(name = "Medida:")+
  theme_ipsum(base_size = 12) +
  scale_x_continuous(breaks = vet2)+
  scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
  ylab("Proporção da Evasão")+ xlab('Semestres')+ labs(title = paste('Gráfico 01 - Proporção da Evasão por Semestres (2010 - 2018)'))+
  theme(plot.title = element_text( size=12))

Evasão:

serieeva <- read.xlsx("serieeva.xlsx")

serieeva %>%
  ggplot( aes(x=semestre, y= valor)) +
  geom_boxplot()+
  scale_fill_viridis(discrete = TRUE, alpha=0.6) +
  geom_jitter(color="black", size=1.2, alpha=0.5) +
  theme_ipsum()+
  theme(legend.position="none",
        plot.title = element_text(size=11), axis.text.x = element_text(size=6))+
  xlab("Semestres")+
  ylab("Proporção da Evasão")+labs(title = paste('Gráfico 02 - Medidas da Proporção da Evasão por Semestres (2010 - 2018)'))+
  theme(plot.title = element_text( size=12))

geva <- summarySE(serieeva, measurevar="valor", groupvars= "semestre", na.rm = TRUE)
geva <- geva[c(1:17),]


vmed <- (seq(0.0, 0.60, 0.5))

ggplot(geva, aes(x=semestre, y=valor)) + 
  geom_errorbar(aes(ymin=valor-se, ymax=valor+se), width=.3) +
  geom_line() + geom_point() + theme_bw() +
  scale_y_continuous(breaks = vv, limits = c(0, 0.40 ))+
  xlab("Semestre") + 
  ylab("Proporção da Evasão")+
labs(title = paste('        Gráfico 03 - Médias da Proporção da Evasão por Semestres (2010 - 2018)'))+
  theme(plot.title = element_text( size=12), axis.text.x = element_text(size=8))

Medidas Descritivas (Evasão):

describe(serieeva$valor)
##    vars   n mean   sd median trimmed  mad min  max range skew kurtosis
## X1    1 721 0.16 0.18   0.11    0.13 0.16   0 0.83  0.83 1.08      0.5
##      se
## X1 0.01
vdt <- seq(1,40,2)
vu <- seq(0.0,0.80,0.10)

serieeva %>%
  filter(valor > 0.0)%>%
  ggplot( aes(x=valor)) +
  geom_histogram( binwidth=0.02, fill="#778899", color="#778899", alpha=0.9) +
  theme_ipsum() +
  xlab('Proporção da Evasão')+
  scale_x_continuous(breaks = vu)+
  scale_y_continuous(breaks = vdt)+
  ylab('Frequência')+
  geom_vline(xintercept = 0.16, linetype = 2, color = "red")+
  geom_vline(xintercept = 0.52, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 0.34, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 0.70, linetype = 2, color = "#778899")+
labs(title = paste('Gráfico 04 - Frequência da Proporção da Evasão por Semestres (2010 - 2018)'))+
  theme(plot.title = element_text( size=12))

Retenção:

serieret <- read.xlsx("serieret.xlsx")

serieret %>%
  ggplot( aes(x=semestre, y= valor)) +
  geom_boxplot()+
  scale_fill_viridis(discrete = TRUE, alpha=0.6) +
  geom_jitter(color="black", size=1.6, alpha=0.5) +
  theme_ipsum()+
  theme(legend.position="none",
        plot.title = element_text(size=12), axis.text.x = element_text(size=6))+
  xlab("Semestres")+
  ylab("Proporção da Retenção")+
  labs(title = paste('Gráfico 05 - Medidas da Proporção da Retenção por Semestres (2010 - 2018)'))+
  theme(plot.title = element_text( size=12))

geva <- summarySE(serieret, measurevar="valor", groupvars= "semestre", na.rm = TRUE)
geva <- geva[c(1:17),]


vmed <- (seq(0.0, 0.60, 0.5))

ggplot(geva, aes(x=semestre, y=valor)) + 
  geom_errorbar(aes(ymin=valor-se, ymax=valor+se), width=.3) +
  geom_line() + geom_point() + theme_bw() +
  scale_y_continuous(breaks = vv, limits = c(0, 0.40 ))+
  xlab("Semestres") + 
  ylab("Proporção da Retenção")+labs(title = paste('         Gráfico 06 - Médias da Proporção da Retenção por Semestres (2010 - 2018)'))+
  theme(plot.title = element_text( size=12), axis.text.x = element_text(size=8))

Medidas Descritivas:

describe(serieret$valor)
##    vars   n mean   sd median trimmed  mad min max range skew kurtosis   se
## X1    1 721 0.15 0.17    0.1    0.12 0.15   0   1     1 1.44     2.05 0.01
vdt <- seq(1, 60, 5)
vu <- seq(0.0, 1.0,0.10)


serieret %>%
  filter(valor > 0.0)%>%
  ggplot( aes(x=valor)) +
  geom_histogram( binwidth=0.02, fill="#778899", color="#778899", alpha=0.9) +
  theme_ipsum() +
  xlab('Proporção da Retenção')+
  scale_x_continuous(breaks = vu)+
  scale_y_continuous(breaks = vdt)+
  ylab('Frequência')+
  geom_vline(xintercept = 0.15, linetype = 2, color = "red")+
  geom_vline(xintercept = 0.32, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 0.49, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 0.66, linetype = 2, color = "#778899")+
  labs(title = paste('  Gráfico 07 - Frequência da Proporção da Retenção por Semestres (2010 - 2018)'))+
  theme(plot.title = element_text( size=12))

O comportamento das curvas de estimativas das médias mostra uma oscilação constante ao longo do período. Em outros termos, não é possível identificar intervalos com grandes crescimentos ou fortes reduções das medidas. A comparação direta das médias (gráfico 03 e 06) deixa claro esse cenário. A partir dos gráficos de caixa, pode-se observar uma variação de um semestre para o outro, mas não é fácil identificar qualquer padrão. Por fim, os histogramas (gráficos 04 e 07) mostram que: 1) a grande maioria das disciplinas/turma estão abaixo da média nas duas variáveis; 2) há uma assimetria positiva na distribuição das medidas e 3) ambas apresentam algumas observações que podem ser consideradas outliers.

Disciplinas:

Claramente, um elemento relevante para análise da evasão, da retenção e do número de matriculados é a possibilidade de concentração desses fenômenos em algumas disciplinas. Afinal, importa saber quais disciplinas apresentam maior média de evasão e retenção de alunos.

Medidas Descritivas (Evasão):

evadis <- read.xlsx("evadis.xlsx")

describe(evadis$evasão)
##    vars   n mean   sd median trimmed  mad min  max range skew kurtosis
## X1    1 119 0.18 0.18   0.13    0.15 0.12   0 0.83  0.83 1.53     1.97
##      se
## X1 0.02

Evasão:

library(openxlsx)
library(psych)
library(ggplot2)
library(stringr)
library(dplyr)
library(viridis)
library(hrbrthemes)
library(Rmisc)



vv <- (seq(0.0,0.80,0.1))
vdi <- (seq(1,10,1))


evadis %>%
  filter(evasão > 0.0)%>%
  ggplot( aes(x=evasão)) +
  geom_histogram( binwidth=0.02, fill="#778899", color="#778899", alpha=0.9) +
  theme_ipsum() +
  xlab('Proporção da Evasão')+
  scale_x_continuous(breaks = vv)+
  scale_y_continuous(breaks = vdi, limits = c(0, 10))+
  ylab('Frequência')+
  geom_vline(xintercept = 0.18, linetype = 2, color = "red")+
  geom_vline(xintercept = 0.36, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 0.54, linetype = 2, color = "#778899")+
  geom_vline(xintercept = 0.72, linetype = 2, color = "#778899")+
  theme(
    plot.title = element_text(size=12)
  )+ labs(title = paste('Gráfico 08 - Frequência da Proporção Evasão por Disciplina (2010 - 2018)'))+
  theme(plot.title = element_text( size=12))