Nota Técnica:
Evasão e Retenção nas Ciências Sociais
Instituto de Ciências Sociais (ICS-UFAL)
Núcleo Docente Estruturante
Prof. José Alexandre
A evasão é um tema de crescente interesse ao redor do mundo (RAMOS, 2017). Historicamente, o ensino superior brasileiro enfrenta altas taxas de evasão escolar. No setor público, a entrada de alunos que, por algum motivo, não finalizam o curso representa uma soma de recursos investidos sem o retorno esperado para sociedade. Segundo Filho et al (2007), o Brasil ainda registra poucos estudos sistemáticos sobre o tema. Nessa nota, nos concentramos na análise da evasão do curso de Ciências Sociais Licenciatura da Universidade Federal de Alagoas (UFAL).
library(openxlsx)
library(psych)
library(ggplot2)
library(stringr)
library(dplyr)
library(viridis)
library(hrbrthemes)
library(Rmisc)
vet2 = seq(2010, 2018, 1)
vv2 <- seq(0.00, 0.40, 0.06)
vv <- (seq(0.0,0.60,0.05))
serie <- read.xlsx("serie.xlsx")
serie$semestre <- as.numeric(serie$semestre)
serie %>%
ggplot(aes(x=semestre, y=valor, color = medida)) +
geom_smooth(se = F) + geom_point()+
scale_color_ft(name = "Medida:")+
theme_ipsum(base_size = 12) +
scale_x_continuous(breaks = vet2)+
scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
ylab("Proporção da Evasão")+ xlab('Semestres')+ labs(title = paste('Gráfico 01 - Proporção da Evasão por Semestres (2010 - 2018)'))+
theme(plot.title = element_text( size=12))
serieeva <- read.xlsx("serieeva.xlsx")
serieeva %>%
ggplot( aes(x=semestre, y= valor)) +
geom_boxplot()+
scale_fill_viridis(discrete = TRUE, alpha=0.6) +
geom_jitter(color="black", size=1.2, alpha=0.5) +
theme_ipsum()+
theme(legend.position="none",
plot.title = element_text(size=11), axis.text.x = element_text(size=6))+
xlab("Semestres")+
ylab("Proporção da Evasão")+labs(title = paste('Gráfico 02 - Medidas da Proporção da Evasão por Semestres (2010 - 2018)'))+
theme(plot.title = element_text( size=12))
geva <- summarySE(serieeva, measurevar="valor", groupvars= "semestre", na.rm = TRUE)
geva <- geva[c(1:17),]
vmed <- (seq(0.0, 0.60, 0.5))
ggplot(geva, aes(x=semestre, y=valor)) +
geom_errorbar(aes(ymin=valor-se, ymax=valor+se), width=.3) +
geom_line() + geom_point() + theme_bw() +
scale_y_continuous(breaks = vv, limits = c(0, 0.40 ))+
xlab("Semestre") +
ylab("Proporção da Evasão")+
labs(title = paste(' Gráfico 03 - Médias da Proporção da Evasão por Semestres (2010 - 2018)'))+
theme(plot.title = element_text( size=12), axis.text.x = element_text(size=8))
describe(serieeva$valor)
## vars n mean sd median trimmed mad min max range skew kurtosis
## X1 1 721 0.16 0.18 0.11 0.13 0.16 0 0.83 0.83 1.08 0.5
## se
## X1 0.01
vdt <- seq(1,40,2)
vu <- seq(0.0,0.80,0.10)
serieeva %>%
filter(valor > 0.0)%>%
ggplot( aes(x=valor)) +
geom_histogram( binwidth=0.02, fill="#778899", color="#778899", alpha=0.9) +
theme_ipsum() +
xlab('Proporção da Evasão')+
scale_x_continuous(breaks = vu)+
scale_y_continuous(breaks = vdt)+
ylab('Frequência')+
geom_vline(xintercept = 0.16, linetype = 2, color = "red")+
geom_vline(xintercept = 0.52, linetype = 2, color = "#778899")+
geom_vline(xintercept = 0.34, linetype = 2, color = "#778899")+
geom_vline(xintercept = 0.70, linetype = 2, color = "#778899")+
labs(title = paste('Gráfico 04 - Frequência da Proporção da Evasão por Semestres (2010 - 2018)'))+
theme(plot.title = element_text( size=12))
serieret <- read.xlsx("serieret.xlsx")
serieret %>%
ggplot( aes(x=semestre, y= valor)) +
geom_boxplot()+
scale_fill_viridis(discrete = TRUE, alpha=0.6) +
geom_jitter(color="black", size=1.6, alpha=0.5) +
theme_ipsum()+
theme(legend.position="none",
plot.title = element_text(size=12), axis.text.x = element_text(size=6))+
xlab("Semestres")+
ylab("Proporção da Retenção")+
labs(title = paste('Gráfico 05 - Medidas da Proporção da Retenção por Semestres (2010 - 2018)'))+
theme(plot.title = element_text( size=12))
geva <- summarySE(serieret, measurevar="valor", groupvars= "semestre", na.rm = TRUE)
geva <- geva[c(1:17),]
vmed <- (seq(0.0, 0.60, 0.5))
ggplot(geva, aes(x=semestre, y=valor)) +
geom_errorbar(aes(ymin=valor-se, ymax=valor+se), width=.3) +
geom_line() + geom_point() + theme_bw() +
scale_y_continuous(breaks = vv, limits = c(0, 0.40 ))+
xlab("Semestres") +
ylab("Proporção da Retenção")+labs(title = paste(' Gráfico 06 - Médias da Proporção da Retenção por Semestres (2010 - 2018)'))+
theme(plot.title = element_text( size=12), axis.text.x = element_text(size=8))
describe(serieret$valor)
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 721 0.15 0.17 0.1 0.12 0.15 0 1 1 1.44 2.05 0.01
vdt <- seq(1, 60, 5)
vu <- seq(0.0, 1.0,0.10)
serieret %>%
filter(valor > 0.0)%>%
ggplot( aes(x=valor)) +
geom_histogram( binwidth=0.02, fill="#778899", color="#778899", alpha=0.9) +
theme_ipsum() +
xlab('Proporção da Retenção')+
scale_x_continuous(breaks = vu)+
scale_y_continuous(breaks = vdt)+
ylab('Frequência')+
geom_vline(xintercept = 0.15, linetype = 2, color = "red")+
geom_vline(xintercept = 0.32, linetype = 2, color = "#778899")+
geom_vline(xintercept = 0.49, linetype = 2, color = "#778899")+
geom_vline(xintercept = 0.66, linetype = 2, color = "#778899")+
labs(title = paste(' Gráfico 07 - Frequência da Proporção da Retenção por Semestres (2010 - 2018)'))+
theme(plot.title = element_text( size=12))
evadis <- read.xlsx("evadis.xlsx")
describe(evadis$evasão)
## vars n mean sd median trimmed mad min max range skew kurtosis
## X1 1 119 0.18 0.18 0.13 0.15 0.12 0 0.83 0.83 1.53 1.97
## se
## X1 0.02
library(openxlsx)
library(psych)
library(ggplot2)
library(stringr)
library(dplyr)
library(viridis)
library(hrbrthemes)
library(Rmisc)
vv <- (seq(0.0,0.80,0.1))
vdi <- (seq(1,10,1))
evadis %>%
filter(evasão > 0.0)%>%
ggplot( aes(x=evasão)) +
geom_histogram( binwidth=0.02, fill="#778899", color="#778899", alpha=0.9) +
theme_ipsum() +
xlab('Proporção da Evasão')+
scale_x_continuous(breaks = vv)+
scale_y_continuous(breaks = vdi, limits = c(0, 10))+
ylab('Frequência')+
geom_vline(xintercept = 0.18, linetype = 2, color = "red")+
geom_vline(xintercept = 0.36, linetype = 2, color = "#778899")+
geom_vline(xintercept = 0.54, linetype = 2, color = "#778899")+
geom_vline(xintercept = 0.72, linetype = 2, color = "#778899")+
theme(
plot.title = element_text(size=12)
)+ labs(title = paste('Gráfico 08 - Frequência da Proporção Evasão por Disciplina (2010 - 2018)'))+
theme(plot.title = element_text( size=12))
describe(evadis$retenção)
## vars n mean sd median trimmed mad min max range skew kurtosis
## X1 1 119 0.14 0.15 0.12 0.12 0.13 0 0.73 0.73 1.42 2.16
## se
## X1 0.01
vv <- (seq(0.0,0.80,0.1))
vdi <- (seq(1,10,1))
evadis %>%
filter(retenção > 0.0)%>%
ggplot( aes(x=retenção)) +
geom_histogram( binwidth=0.02, fill="#778899", color="#778899", alpha=0.9) +
theme_ipsum() +
xlab('Proporção da Retenção')+
scale_x_continuous(breaks = vv)+
scale_y_continuous(breaks = vdi)+
ylab('Frequência')+
geom_vline(xintercept = 0.14, linetype = 2, color = "red")+
geom_vline(xintercept = 0.29, linetype = 2, color = "#778899")+
geom_vline(xintercept = 0.44, linetype = 2, color = "#778899")+
geom_vline(xintercept = 0.59, linetype = 2, color = "#778899")+
theme(
plot.title = element_text(size=12)
)+
labs(title = paste('Gráfico 09 - Frequência da Proporção da Retenção por Disciplina (2010 - 2018)'))+
theme(plot.title = element_text( size=12))
describe(evadis$matriculados)
## vars n mean sd median trimmed mad min max range skew kurtosis
## X1 1 119 16.37 9.16 13.89 15.13 6.69 6 42.9 36.9 1.2 0.64
## se
## X1 0.84
library(Rmisc)
vr <- (seq(0,60,2))
vy <- seq(1,20,1)
evadis%>%
ggplot( aes(x=matriculados)) +
geom_histogram( binwidth=2.0, fill="#778899", color="#778899", alpha=0.9) +
theme_ipsum() +
xlab('Número de Matriculados')+
scale_x_continuous(breaks = vr)+
scale_y_continuous(breaks = vy, limits = c(0,20))+
ylab('Frequência')+
geom_vline(xintercept = 16.37, linetype = 2, color = "red")+
geom_vline(xintercept = 7.21, linetype = 2, color = "#778899")+
geom_vline(xintercept = 25.53, linetype = 2, color = "#778899")+
geom_vline(xintercept = 34.69, linetype = 2, color = "#778899")+
geom_vline(xintercept = 43.85, linetype = 2, color = "#778899")+
theme(
plot.title = element_text(size=12)
)+
labs(title = paste('Gráfico 10 - Frequência do Número de Matriculados por Disciplina
(2010 - 2018)'))+
theme(plot.title = element_text( size=12))
evadis%>%
filter(evasão > 0.1 & retenção > 0.1)%>%
ggplot(aes(x=evasão, y=retenção)) +
geom_point(size=1.0, color="#778899")+
geom_smooth(method = 'lm', se = F, color="#778899") +
scale_x_continuous(breaks = vv)+
scale_y_continuous(breaks = vv)+
theme_ipsum()+ xlab('Proporção da Evasão')+ylab('Proporção da Retenção')+
labs(title = paste(' Gráfico 11 - Proporção da Evasão e Proporção da Retenção
por Disciplina (2010 - 2018)'))+
theme(plot.title = element_text(size=12))+
geom_vline(xintercept = 0.18, linetype = 2, color = '#778899')+
geom_hline(yintercept = 0.14, linetype = 2, color = '#778899')
De acordo com o Projeto Político Pedagógico (PPC) do curso, a grade curricular é composta por um núcleo comum de disciplinas, em geral, compartilhadas com curso do bacharelado e outro específico, normalmente, de cunho pedagógico. Nessa etapa, investigamos se as variáveis se comportam da mesma maneira nos dois núcleos. Os gráficos abaixo apontam as curvas das estimativas da média das proporções da evasão, da retenção e do número de matriculados.
ev <- read.xlsx("evasn.xlsx")
vet3 = as.numeric(c(2010.1, 2010.2, 2011.1, 2011.2, 2012.1, 2012.2, 2013.1, 2013.2,
2014.1, 2014.2, 2015.1, 2015.2, 2016.1, 2016.2, 2017.1, 2017.2, 2018.1, 2018.2))
vet2 = seq(2010, 2018, 1)
vv2 <- seq(0.00, 0.40, 0.06)
vv3 <- seq(5, 70, 5)
ev %>%
ggplot(aes(x=semestre, y=percevasão, color = núcleo2)) +
geom_smooth(se = F) + geom_point()+
scale_color_ft(name = "Núcleos:")+
theme_ipsum(base_size = 12) +
scale_x_continuous(breaks = vet2)+
scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
ylab("Proporção da Evasão")+ xlab('Semestres')+
labs(title = paste('Gráfico 12 - Proporção da Evasão por núcleo das disciplinas (2010 - 2018)'))+
theme(plot.title = element_text( size=12))
ev %>%
ggplot(aes(x=semestre, y=percretenção, color = núcleo2)) +
geom_smooth(se=F) + geom_point()+
scale_color_ft(name = "Núcleos:")+
scale_x_continuous(breaks = vet2)+
scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
theme_ipsum(base_size = 12) +
ylab("Proporção da Retenção")+ xlab('Semestres')+
labs(title = paste('Gráfico 13 - Proporção da Retenção por Núcleo das Disciplinas (2010 - 2018)'))+
theme(plot.title = element_text( size=12))
ev %>%
ggplot(aes(x=semestre, y=matriculados, color = núcleo2)) +
geom_smooth(se=F) + geom_point()+
scale_color_ft(name = "Núcleos:")+
scale_x_continuous(breaks = vet2)+
scale_y_continuous(breaks = vv3, limits = c(0.00, 70))+
theme_ipsum(base_size = 12) +
ylab("Número de Matriculados")+ xlab('Semestres')+
labs(title = paste('Gráfico 14 - Número de Matriculados por Núcleo das
Disciplinas (2010 - 2018)'))+
theme(plot.title = element_text(size=12))
vbox<-seq(0.0,0.90,length=18)
vbox <- round(vbox, 2)
ggplot(ev, aes(x=núcleo2, y= percevasão, color = núcleo2)) +
geom_boxplot() +
scale_color_ft(name = "Núcleos:")+
geom_jitter(color="black", size=1.6, alpha=0.5) +
theme_ipsum() +
scale_y_continuous(breaks = vbox, limits = c(0.0, 0.9))+
theme(legend.position="none",
plot.title = element_text(size=12))+
xlab("Núcleo da Disciplina")+
ylab("Proporção da Evasão")+
labs(title = paste('Gráfico 15 - Medidas da Proporção da Evasão por Núcleo das
Disciplinas (2010 - 2018)'))+
theme(plot.title = element_text(size=12))
geva <- summarySE(ev, measurevar="percevasão", groupvars= "núcleo2", na.rm = TRUE)
geva <- geva[c(1:2),]
vmed <- (seq(0.0, 0.60, 0.5))
ggplot(geva, aes(x=núcleo2, y=percevasão)) +
geom_errorbar(aes(ymin=percevasão-se, ymax=percevasão+se), width=.3) +
geom_line() + geom_point() + theme_bw() +
scale_y_continuous(breaks = vv, limits = c(0, 0.40 ))+
xlab("Núcleos") +
ylab("Proporção da Evasão")+labs(title = paste('Gráfico 16 - Médias da Proporção da Evasão por Núcleo das Disciplinas (2010 - 2018)'))+
theme(plot.title = element_text( size=12), axis.text.x = element_text(size=12))
ggplot(ev, aes(x=núcleo2, y= percretenção, color = núcleo2)) +
geom_boxplot() +
scale_color_ft(name = "Núcleos:") +
geom_jitter(color="black", size=1.6, alpha=0.5) +
theme_ipsum() +
scale_y_continuous(breaks = vbox, limits = c(0.0, 0.9))+
theme(legend.position="none",
plot.title = element_text(size=12))+
xlab("Núcleo da Disciplina")+
ylab("Proporção da Retenção")+
labs(title = paste('Gráfico 17 - Medidas da Proporção de Retenção por Núcleo das
Disciplinas (2010 - 2018)'))+
theme(plot.title = element_text(size=12))
geva <- summarySE(ev, measurevar="percretenção", groupvars= "núcleo2", na.rm = TRUE)
geva <- geva[c(1:2),]
vmed <- (seq(0.0, 0.60, 0.5))
ggplot(geva, aes(x=núcleo2, y=percretenção)) +
geom_errorbar(aes(ymin=percretenção-se, ymax=percretenção+se), width=.3) +
geom_line() + geom_point() + theme_bw() +
scale_y_continuous(breaks = vv, limits = c(0, 0.40 ))+
xlab("Núcleos") +
ylab("Proporção da Evasão")+labs(title = paste('Gráfico 18 - Médias da Proporção da Retenção por Núcleo das Disciplinas (2010 - 2018)'))+
theme(plot.title = element_text( size=12), axis.text.x = element_text(size=12))
vbox2 <- seq(0, 70, 8)
ggplot(ev, aes(x=núcleo2, y= matriculados, color = núcleo2)) +
geom_boxplot() +
scale_color_ft(name = "Núcleos:")+
geom_jitter(color="black", size=1.6, alpha=0.5) +
theme_ipsum() +
scale_y_continuous(breaks = vv3, limits = c(0, 70))+
theme(legend.position="none",
plot.title = element_text(size=12))+
xlab("Núcleo das Disciplinas")+
ylab("Número de Matriculados")+
labs(title = paste('Gráfico 19 - Medidas do Número de Matriculados por Núcleo das
Disciplinas (2010 - 2018)'))+
theme(plot.title = element_text(size=12))
geva <- summarySE(ev, measurevar="matriculados", groupvars= "núcleo2", na.rm = TRUE)
geva <- geva[c(1:2),]
vx <- (seq(1,60,5))
ggplot(geva, aes(x=núcleo2, y=matriculados)) +
geom_errorbar(aes(ymin=matriculados-se, ymax=matriculados+se), width=.3) +
geom_line() + geom_point() + theme_bw() +
scale_y_continuous(breaks = vx, limits = c(0, 40))+
xlab("Núcleos") +
ylab("Número de Matriculados")+labs(title = paste(' Gráfico 20 - Médias do Número de Matriculados por Núcleo das
Disciplinas (2010 - 2018)'))+
theme(plot.title = element_text( size=12), axis.text.x = element_text(size=12))
De acordo com os gráficos de caixa, em todas as medidas a dispersão é maior dentre as disciplinas de núcleo comum. Quanto a proporção da evasão, a mediana é mais alta dentre as disciplinas do núcleo comum. O mesmo cenário aparece na proporção da retenção, o detalhe quanto a essa medida é que aproximadamente metade das disciplinas do núcleo comum tem retenção acima de 75% das disciplinas de núcleo específico. Claramente, a diferença entre as distribuições é menor quanto ao número de matriculados. A comparação direta entre as médias mostra que tanto a evasão quanto a retenção é significativamente maior nas disciplinas de núcleo comum. Para finalizar essa comparação, podemos observar como a relação entre evasão e retenção se comporta em cada grupo de disciplinas.
ev%>%
filter(percevasão > 0.1 & percretenção > 0.1)%>%
ggplot(aes(x=percevasão, y=percretenção, color=núcleo2, shape = factor(núcleo2))) +
scale_color_ft(name = "Núcleos:") +
geom_point(size=2.5, color="#778899") +
geom_smooth(method = 'lm', se = F) +
theme_ipsum()+ xlab('Proporção da Evasão')+ylab('Proporção da Retenção')+
labs(title = paste('Gráfico 21 - Proporção da Evasão e Proporção da Retenção por Tipo de
Disciplina (2010 - 2018)'))+
theme(plot.title = element_text(size=12))+
geom_hline(yintercept = 0.17, linetype = 2, color = 'grey')+
geom_hline(yintercept = 0.11, linetype = 2, color = '#69b3a2')+
geom_vline(xintercept = 0.17, linetype = 2, color = 'grey')+
geom_vline(xintercept = 0.14, linetype = 2, color = '#69b3a2')+
guides(shape = FALSE)
Tanto nas disciplinas de núcleo comum, quanto nas de núcleo específico a correlação é negativa. Portanto, quanto maior a proproção da evasão menor tende a ser da retenção. As linhas pontilhadas sinalizam as médias das duas variáveis em cada um dos núcleos. A partir delas e da inclinação das retas nota-se que a relação é mais forte nas disciplinas de núcleo comum.
Até aqui os dados foram analisados no agregado, com todos os períodos juntos. Todavia, a queda no número de alunos, comum nos primeiros períodos, aponta para a concentração da proporção da evasão nos semestres iniciais do curso. Dessa forma, concentramos nossa atenção na análise dos dados desses períodos.
evaper <- read.xlsx("evaper.xlsx")
evaper %>%
ggplot(aes(x=semestre, y=percevasão, color = periodo2)) +
geom_smooth(se = F) + geom_point()+
scale_color_brewer(name = "Periodos:")+
theme_ipsum(base_size = 12) +
scale_x_continuous(breaks = vet2)+
scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
ylab("Proporção da Evasão")+ xlab('Semestres')+
labs(title = paste('Gráfico 22 - Proporção da Evasão nos Períodos Iniciais
(2010 - 2018)'))+
theme(plot.title = element_text(size=12))
evaper %>%
ggplot(aes(x=semestre, y=percretenção, color = periodo2)) +
geom_smooth(se=F) + geom_point()+
scale_color_brewer(name = "Periodos:")+
scale_x_continuous(breaks = vet2)+
scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
theme_ipsum(base_size = 12) +
ylab("Proporção da Retenção")+ xlab('Semestres')+
labs(title = paste('Gráfico 23 - Proporção da Retenção nos Períodos Iniciais
(2010 - 2018)'))+
theme(plot.title = element_text(size=12))
evaper %>%
ggplot(aes(x=semestre, y=matriculados, color = periodo2)) +
geom_smooth(se=F) + geom_point()+
scale_color_brewer(name = "Periodos:")+
scale_x_continuous(breaks = vet2)+
scale_y_continuous(breaks = vv3, limits = c(0.00, 70))+
theme_ipsum(base_size = 12) +
ylab("Número de Matriculados")+ xlab('Semestres')+
labs(title = paste('Gráfico 24 - Número de Matriculados nos Períodos Iniciais
(2010 - 2018)'))+
theme(plot.title = element_text(size=12))
Quanto a proporção da evasão, a curva que mais se destaca é a do primeiro período. Há uma queda na estimativa da média entre 2010 e 2012, nos quatro anos seguintes (oito semestres posteriores) a curva inverte seu comportamento e apresenta um crescimento. Por fim, nos dois últimos anos a curva volta a registrar uma queda na estimativa. Contrariamente, as curvas de todos os demais períodos apresentam um crescimento nos últimos períodos analisados. Nesse cenário, o destaque vai para o crescimento registrado no quarto período. Quanto a proporção da retenção, a oscilação ao longo do período é comportamento comum a todas as curvas. Por fim, em relação ao número de matriculados, as curvas do primeiro e do segundo períodos apresentam comportamentos peculiares. As estimativas do primeiro período apresentam uma queda entre 2010 e 2013, na sequência registram um crescimento e volta a apresentar uma queda entre 2015 e 2018. A curva do segundo período apresenta uma queda de mais de 50% entre os anos de 2010 e 2013.
Para analisar com mais detalhes o que acontece com a proporção da evasão, com a da retenção e com o número de matriculados nos períodos iniciais do curso, apresentamos uma comparação direta das médias.library(Rmisc)
novo <- c("Primeiro", "Segundo", "Terceiro", "Quarto")
evaper$periodo2 <- factor(evaper$periodo2, novo)
geva <- summarySE(evaper, measurevar="percevasão", groupvars= "periodo2", na.rm = TRUE)
geva <- geva[c(1:4),]
ggplot(geva, aes(x=periodo2, y=percevasão)) +
geom_errorbar(aes(ymin=percevasão-se, ymax=percevasão+se), width=.3) +
geom_point() + theme_bw() +
scale_y_continuous(breaks = vv2, limits = c(0.0, 0.3))+
xlab("Período das Disciplinas") +
ylab("Proporção da Evasão")+
labs(title = paste('Gráfico 25 - Médias da Proporção da Evasão nos Períodos Iniciais (2010 - 2018)'))+
theme(plot.title = element_text(size=12))
novo <- c("Primeiro", "Segundo", "Terceiro", "Quarto")
evaper$periodo2 <- factor(evaper$periodo2, novo)
geva <- summarySE(evaper, measurevar="percretenção", groupvars= "periodo2", na.rm = TRUE)
geva <- geva[c(1:4),]
ggplot(geva, aes(x=periodo2, y=percretenção)) +
geom_errorbar(aes(ymin=percretenção-se, ymax=percretenção+se), width=.3) +
geom_point() + theme_bw() +
scale_y_continuous(breaks = vv2, limits = c(0.0, 0.3))+
xlab("Período das Disciplinas") +
ylab("Proporção da Retenção")+
labs(title = paste('Gráfico 26 - Médias da Proporção de Retenção nos Períodos Iniciais (2010 - 2018)'))+
theme(plot.title = element_text(size=12))
novo <- c("Primeiro", "Segundo", "Terceiro", "Quarto")
evaper$periodo2 <- factor(evaper$periodo2, novo)
geva <- summarySE(evaper, measurevar="matriculados", groupvars= "periodo", na.rm = TRUE)
geva <- geva[c(1:4),]
ggplot(geva, aes(x=periodo, y=matriculados)) +
geom_errorbar(aes(ymin=matriculados-se, ymax=matriculados+se), width=.3) +
geom_point() + theme_bw() +
scale_y_continuous(breaks = vv3, limits = c(0, 50))+
xlab("Período das Disciplinas") +
ylab("Número de Matriculados)")+
labs(title = paste('Gráfico 27 - Média do Número de Matriculados nos Períodos Iniciais (2010 - 2018)'))+
theme(plot.title = element_text(size=12))
Tanto a proporção da evasão quanto a do número de matriculados apresentam médias decrescentes a partir do primeiro período. Especificamente, a média da proporção da evasão no primeiro período ultrapassa os 25%. A menor incidência ocorre no quarto período, a magnitude do fenômeno cai para um patamar pouco acima de 12%. O número de matriculados reforça esse dado, precisamente, o número médio de matriculados cai de 37 no primeiro período para menos de 20 no quarto. Para finalizar a análise nos primeiros períodos, apresentamos uma gráfico de dispersão com a proporção da evasão e a proporção da retenção.
evaper%>%
filter(percevasão > 0.1 & percretenção > 0.1)%>%
ggplot(aes(x=percevasão, y=percretenção, color=periodo2, shape = factor(periodo2))) +
scale_color_brewer(name = "Períodos:")+
geom_point(size=2.5, color="#778899") +
geom_smooth(method = 'lm', se = F) +
theme_ipsum()+ xlab('Proporção da Evasão')+ylab('Proporção da Retenção')+
labs(title = paste('Gráfico 28 - Proporção da Evasão e Proporção da Retenção no Perídos Iniciais (2010 - 2018)'))+
theme(plot.title = element_text(size=12))+
geom_hline(yintercept = 0.17, linetype = 2, color = 'grey')+
geom_hline(yintercept = 0.11, linetype = 2, color = '#69b3a2')+
geom_vline(xintercept = 0.17, linetype = 2, color = 'grey')+
geom_vline(xintercept = 0.14, linetype = 2, color = '#69b3a2')+
guides(shape = FALSE)
Com exceção do quarto período, em todos os demais, a correlação entre as proporções da evasão e da retenção é negativa. Portanto, quanto maior a retenção menor a evasão. Apenas para investigar a impressão de que a evasão se concentra nos períodos iniciais vamos observar a estimativa das médias para os períodos finais.
novo <- c("Quinto", "Sexto", "Setimo", "Oitavo", "Nono")
evaper$periodo2 <- factor(evaper$periodo2, novo)
evaper2 <- read.xlsx("evaper2.xlsx")
evaper2 %>%
ggplot(aes(x=semestre, y=percevasão, color = periodo2)) +
geom_smooth(se = F) + geom_point()+
scale_color_brewer(name = "Períodos:")+
theme_ipsum(base_size = 12) +
scale_x_continuous(breaks = vet2)+
scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
ylab("Proporção da Evasão")+ xlab('Semestres')+
labs(title = paste('Gráfico 29 - Médias da Proporção da Evasão nos Períodos
Finais (2010 - 2018)'))+
theme(plot.title = element_text(size=12))
novo <- c("Quinto", "Sexto", "Setimo", "Oitavo", "Nono")
evaper2$periodo2 <- factor(evaper2$periodo2, novo)
geva <- summarySE(evaper2, measurevar="percevasão", groupvars= "periodo2", na.rm = TRUE)
geva <- geva[c(1:5),]
ggplot(geva, aes(x=periodo2, y=percevasão)) +
geom_errorbar(aes(ymin=percevasão-se, ymax=percevasão+se), width=.3) +
geom_point() + theme_bw() +
scale_y_continuous(breaks = vv2, limits = c(0.0, 0.3))+
xlab("Período das Disciplinas") +
ylab("Proporção da Evasão")+
labs(title = paste('Gráfico 30 - Média da Proporção da Evasão nos Períodos Finais (2010 - 2018)'))+
theme(plot.title = element_text(size=12))
Claramente, os dados confirmam a impressão. Das cinco curvas, quatro apresentam crescimento entre 2014 e 2017, porém nenhuma das estimativas fica acima de 18%, patamar ultrapassado por diversas estimativas da evasão registrada nos períodos iniciais. Além disso, dos cinco períodos analisados, quatro têm médias abaixo de 12%, apenas o nono período tem uma evasão acima desse patamar.
Como o curso está divido em, ao menos três, áreas de conhecimento a análise a seguir apresenta o quadro da evasão, da retenção e do número de matriculados considerando essas áreas. Precisamente, as disciplinas foram classificadas em quatro categorias, pela ordem alfabética: 1) Antropologia; 2) Ciência Política; 3) Metodologia e 4) Sociologia.
evarea <- read.xlsx("evarea.xlsx")
evarea %>%
ggplot(aes(x=semestre, y=percevasão, color = area2)) +
geom_smooth(se = F) + geom_point()+
scale_color_brewer(name = "Área:")+
theme_ipsum(base_size = 12) +
scale_x_continuous(breaks = vet2)+
scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
ylab("Proporção da Evasão")+ xlab('Semestres')+
labs(title = paste('Gráfico 31 - Média da Proporção da Evasão por Área de Conhecimento
(2010 - 2018)'))+
theme(plot.title = element_text(size=12))
evarea %>%
ggplot(aes(x=semestre, y=percretenção, color = area2)) +
geom_smooth(se=F) + geom_point()+
scale_color_brewer(name = "Área:")+
scale_x_continuous(breaks = vet2)+
scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
theme_ipsum(base_size = 12) +
ylab("Proporção da Retenção")+ xlab('Semestres')+
labs(title = paste('Gráfico 32 - Média da Proporção da Retenção por Área de Conhecimento
(2010 - 2018)'))+
theme(plot.title = element_text(size=12))
evarea %>%
ggplot(aes(x=semestre, y=matriculados, color = area2)) +
geom_smooth(se=F) + geom_point()+
scale_color_brewer(name = "Área:")+
scale_x_continuous(breaks = vet2)+
scale_y_continuous(breaks = vv3, limits = c(0.00, 70))+
theme_ipsum(base_size = 12) +
ylab("Número de Matriculados")+ xlab('Semestres')+
labs(title = paste('Gráfico 33 - Média do Número de Matriculados por Área de
Conhecimento (2010 - 2018)'))+
theme(plot.title = element_text(size=12))
geva <- summarySE(evarea, measurevar="percevasão", groupvars= "area2", na.rm = TRUE)
geva <- geva[c(1:4),]
ggplot(geva, aes(x=area2, y=percevasão)) +
geom_errorbar(aes(ymin=percevasão-se, ymax=percevasão+se), width=.3) +
geom_line() + geom_point() + theme_bw() +
scale_y_continuous(breaks = vv2, limits = c(0.0, 0.3))+
xlab("Áreas") +
ylab("Proporção da Evasão")+
labs(title = paste(' Gráfico 34 - Média da Proporção da Evasão por Área de Conhecimento
(2010 - 2018)'))+
theme(plot.title = element_text(size=12))
geva <- summarySE(evarea, measurevar="percretenção", groupvars= "area2", na.rm = TRUE)
geva <- geva[c(1:4),]
ggplot(geva, aes(x=area2, y=percretenção)) +
geom_errorbar(aes(ymin=percretenção-se, ymax=percretenção+se), width=.3) +
geom_line() + geom_point() + theme_bw() +
scale_y_continuous(breaks = vv2, limits = c(0.0, 0.3))+
xlab("Áreas") +
ylab("Proporção da Retenção")+
labs(title = paste(' Gráfico 35 - Média da Proporção da Retenção por Área de Conhecimento
(2010 - 2018)'))+
theme(plot.title = element_text(size=12))
geva <- summarySE(evarea, measurevar="matriculados", groupvars= "area2", na.rm = TRUE)
geva <- geva[c(1:4),]
ggplot(geva, aes(x=area2, y=matriculados)) +
geom_errorbar(aes(ymin=matriculados-se, ymax=matriculados+se), width=.3) +
geom_line() + geom_point() + theme_bw() +
scale_y_continuous(breaks = vv3, limits = c(0, 50))+
xlab("Áreas") +
ylab("Número de Matriculado")+
labs(title = paste(' Gráfico 36 - Média do Número de Matriculados por Área de Conhecimento
(2010 - 2018)'))+
theme(plot.title = element_text(size=12))
A comparação das médias de todo o período confirma o que as curvas das estimativas já haviam mostrado. As disciplinas da Antropologia são as que registram a maior média da proporção de evasão. Quanto a proporção da retenção, as disciplinas de Sociologia aparecem como aquelas que possuem a maior média, seguida das metodológicas, das antropológicas e as da Ciência Política.
Parte dos professores acreditam que a didática dos professores que ministram as disciplinas é uma variável importante para explicar os fenômenos da evasão e da retenção. Uma forma de verificar indiretamente essa hipótese é observar se a mudança do professor da disciplina tem efeito nessas medidas. O gráfico abaixo compara a estimativa das médias da proporção da evasão.
evamuda <- read.xlsx("evamuda.xlsx")
evamuda %>%
ggplot(aes(x=semestre, y=percevasão, color = Mud)) +
geom_smooth(se = F) + geom_point()+
scale_color_ft(name = "Mudança:")+
theme_ipsum(base_size = 12) +
scale_x_continuous(breaks = vet2)+
scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
ylab("Proporção da Evasão")+ xlab('Semestre')+
labs(title = paste('Gráfico 37 - Média da Proporção da Evasão por Mudança
de Professor (2010 - 2018)'))+
theme(plot.title = element_text(size=12))
evamuda %>%
ggplot(aes(x=semestre, y=percretenção, color = Mud)) +
geom_smooth(se = F) + geom_point()+
scale_color_ft(name = "Mudança:")+
theme_ipsum(base_size = 12) +
scale_x_continuous(breaks = vet2)+
scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
ylab("Proporção Retenção")+ xlab('Semestre')+
labs(title = paste('Gráfico 38 - Média da Proporção da Retenção por Mudança
de Professor (2010 - 2018)'))+
theme(plot.title = element_text(size=12))
evamuda %>%
ggplot(aes(x=semestre, y=matriculados, color = Mud)) +
geom_smooth(se = F) + geom_point()+
scale_color_ft(name = "Mudança:")+
theme_ipsum(base_size = 12) +
scale_x_continuous(breaks = vet2)+
scale_y_continuous(breaks = vv3, limits = c(0.0, 70))+
ylab("Número de Matriculados")+ xlab('Semestre')+
labs(title = paste('Gráfico 39 - Média do Número de Matriculados por Mudança
de Professor (2010 - 2018)'))+
theme(plot.title = element_text(size=12))
As curvas oscilação ao longo do período, mas permanecem sempre próximas. Especificamente quanto a evasão, o desenho da curva das disciplinas que mantiveram os professores é semelhante àquela referente as disciplinas que mudaram o docente de um semestre para outro. A comparação das médias dos dois grupos de disciplina no período tornará mais claro o efeito da mudança de professor nas variáveis.
geva <- summarySE(evamuda, measurevar="percevasão", groupvars= "Mud", na.rm = TRUE)
geva <- geva[c(1,2),]
ggplot(geva, aes(x=Mud, y=percevasão)) +
geom_errorbar(aes(ymin=percevasão-se, ymax=percevasão+se), width=.3) +
geom_line() + geom_point() + theme_bw() +scale_y_continuous(breaks = vv2, limits = c(0.00, 0.40))+
xlab("Mundança de Professor") +
ylab("Proporção da Evasão")+
labs(title = paste('Gráfico 40 - Média da Proporção da Evasão por Mudança de Professor
(2010 - 2018)'))+
theme(plot.title = element_text(size=12))
geva <- summarySE(evamuda, measurevar="percretenção", groupvars= "Mud", na.rm = TRUE)
geva <- geva[c(1,2),]
ggplot(geva, aes(x=Mud, y=percretenção)) +
geom_errorbar(aes(ymin=percretenção-se, ymax=percretenção+se), width=.3) +
geom_line() + geom_point() + theme_bw() +scale_y_continuous(breaks = vv2, limits = c(0.00, 0.30))+
xlab("Mundança de Professor") +
ylab("Proporção da Retenção")+
labs(title = paste('Gráfico 41 - Média da Proporção da Retenção por Mudança de Professor
(2010 - 2018)'))+
theme(plot.title = element_text(size=12))
geva <- summarySE(evamuda, measurevar="matriculados", groupvars= "Mud", na.rm = T)
geva <- geva[c(1:2),]
ggplot(geva, aes(x=Mud, y=matriculados)) +
geom_errorbar(aes(ymin=matriculados-se, ymax=matriculados+se), width=.3) +
geom_line() + geom_point() + theme_bw() +
scale_y_continuous(breaks = vv3, limits = c(0, 50))+
xlab("Mundança de Professor") +
ylab("Número de Matriculados")+
labs(title = paste('Gráfico 42 - Média do Número de Matriculados por Mudança
de Professor (2010 - 2018)'))+
theme(plot.title = element_text(size=12))
Tanto a proporção da retenção quanto o número de matriculados apresentam médias significativamente mais altas dentre as disciplinas que mudaram de professor. Quanto a proporção da evasão, não há diferença estatisticamente significativa entre as médias. Em outros termos, a mudança do docente não tem efeito sobre a proporção da evasão. A análise a partir dos gráficos de caixa representa a comparação entre os grupos a partir de outras medidas.
ggplot(evamuda, aes(x=Mud, y= percevasão, color = Mud)) +
geom_boxplot() +
scale_color_ft(name = "Mudança:")+
geom_jitter(color="black", size=1.6, alpha=0.5) +
theme_ipsum() +
scale_y_continuous(breaks = vbox, limits = c(0.0, 0.9))+
theme(legend.position="none",
plot.title = element_text(size=18))+
xlab("Mudança de Professor")+
ylab("Proporção Evasão")+
labs(title = paste('Gráfico 43 - Medidas da Proporção da Evasão por Mudança
de Professor (2010 - 2018)'))+
theme(plot.title = element_text(size=12))
ggplot(evamuda, aes(x=Mud, y= percretenção, color = Mud)) +
geom_boxplot() +
scale_color_ft(name = "Mudança:") +
geom_jitter(color="black", size=1.6, alpha=0.5) +
theme_ipsum() +
scale_y_continuous(breaks = vbox, limits = c(0.0, 0.9))+
theme(legend.position="none",
plot.title = element_text(size=18))+
xlab("Mudança de Professor")+
ylab("Proporção Retenção")+
labs(title = paste('Gráfico 44 - Medidas da Proporção da Retenção por Mudança
de Professor (2010 - 2018)'))+
theme(plot.title = element_text(size=12))
ggplot(evamuda, aes(x=Mud, y= matriculados, color = Mud)) +
geom_boxplot() +
scale_color_ft(name = "Mudança:")+
geom_jitter(color="black", size=1.6, alpha=0.5) +
theme_ipsum() +
scale_y_continuous(breaks = vv3, limits = c(0, 70))+
theme(legend.position="none",
plot.title = element_text(size=18))+
xlab("Mudança de Professor")+
ylab("Número de Matriculados")+
labs(title = paste('Gráfico 45 - Medidas do Número de Matriculados por Mudança de
Professor (2010 - 2018)'))+
theme(plot.title = element_text(size=12))
Claramente, quando a medida é a proporção da evasão, o grupo das disciplinas que mantiveram e o grupo das disciplinas que mudaram de professor apresentam caixas semelhantes. Quanto a proporção da retenção, as disciplinas que mudaram de professor apresentam uma distribuição mais dispersa. Além disso, a mediana é mais alta e o terceiro quartil tem uma amplitude claramente maior. Por fim, o número de matriculados segue um comportamento semelhante ao da proporção da retenção, com a mediana maior e a amplitude mais alta do terceiro quartil no grupo de disciplinas que mudaram de professor.
Por fim, chegamos ao nível mais desagregado da análise. Uma etapa importante para observar se alguns docentes registram níveis de evasão e de retenção significativamente mais altos que outros. Nessa análise, consideraremos outliers os docentes que estiverem a mais de três desvios padrões da média.
library(psych)
evaprom <- read.xlsx("evaprom.xlsx")
describe(evaprom$evasão)
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 52 0.18 0.12 0.17 0.17 0.12 0 0.52 0.52 0.49 0.03 0.02
describe(evaprom$retenção)
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 52 0.18 0.13 0.17 0.17 0.13 0 0.53 0.53 0.7 0.03 0.02
vb <- (seq(1.0,10,1.0))
vv <- (seq(0.0,0.60,0.05))
evaprom %>%
ggplot( aes(x=evasão)) +
geom_histogram( binwidth=0.02, fill="#778899", color="#778899", alpha=0.9) +
theme_ipsum() +
xlab('Proporção da Evasão')+
scale_x_continuous(breaks = vv)+
scale_y_continuous(breaks = vb)+
ylab('Frequência')+
geom_vline(xintercept = 0.18, linetype = 2, color = "red")+
geom_vline(xintercept = 0.06, linetype = 2, color = "#778899")+
geom_vline(xintercept = 0.54, linetype = 2, color = "#778899")+
geom_vline(xintercept = 0.42, linetype = 2, color = "#778899")+
theme(
plot.title = element_text(size=12)
)+
labs(title = paste('Gráfico 46 - Frequência da Proporção da Evasão por Professor
(2010 - 2018)'))+
theme(plot.title = element_text(size=12))
vb <- seq(1,10,1)
evaprom %>%
ggplot( aes(x=retenção)) +
geom_histogram( binwidth=0.02, fill="#778899", color="#778899", alpha=0.9) +
theme_ipsum() +
xlab('Retenção')+
scale_x_continuous(breaks = vv)+
scale_y_continuous(breaks = vb)+
ylab('Frequência')+
geom_vline(xintercept = 0.18, linetype = 2, color = "red")+
geom_vline(xintercept = 0.05, linetype = 2, color = "#778899")+
geom_vline(xintercept = 0.57, linetype = 2, color = "#778899")+
geom_vline(xintercept = 0.44, linetype = 2, color = "#778899")+
theme(
plot.title = element_text(size=15)
)+
labs(title = paste('Gráfico 47 - Frequência da Proporção da Retenção por Professor
(2010 - 2018)'))+
theme(plot.title = element_text(size=12))
evaprom %>%
ggplot( aes(x=matriculados)) +
geom_histogram( binwidth=1.8, fill="#778899", color="#778899", alpha=0.9) +
theme_ipsum() +
xlab('Matriculados')+
scale_x_continuous(breaks = vv3)+
scale_y_continuous(breaks = vb)+
ylab('Frequência')+
geom_vline(xintercept = 20.15, linetype = 2, color = "red")+
geom_vline(xintercept = 36,29, linetype = 2, color = "#778899")+
geom_vline(xintercept = 44,36, linetype = 2, color = "#778899")+
geom_vline(xintercept = 4,01, linetype = 2, color = "#778899")+
theme(
plot.title = element_text(size=12)
)+
labs(title = paste('Gráfico 48 - Frequência do Número de Matriculados por Professor
(2010 - 2018)'))+
theme(plot.title = element_text(size=12))
De acordo com os histogramas, não há professores com médias da proporção da evasão ou da retenção acima de três desvios padrões (posição sinalizada pela última linha pontilhada à direita). Precisamente, apenas dois professores apresentam médias acima de dois desvios padrões da proporção da evasão e três com médias superiores a dois desvios padrões da proporção da retenção. Quanto ao número de matriculados, apenas quatro professores comandaram disciplinas com número de alunos a dois ou mais desvios padrões acima da média.
As análises realizadas até aqui ajudam a tornar os fenômenos da evasão e da retenção no curso de Licenciatura em Ciências Sociais mais claros. Em resumo, os principais achados mostram que: 1) não há indícios de crescimento do fenômeno; 2) as disciplinas do núcleo comum são as que registram maiores médias de evasão e de retenção (temos, um fenômeno copeiro); 3) os períodos iniciais são os que registram os maiores níveis de evasão e de retenção; 4) As disciplinas de Antropologia são as que apresentam o maior nível de evasão; 5) As disciplinas de Sociologia são as que apresentam os maiores níveis de retenção; 6) disciplinas que mudaram de professor não apresentam evasão acima daquelas que mantem e 7) disciplinas que mudaram de professor registram um nível de retenção maior que aquelas que não mudaram.
Com esse estudo o Núcleo Docente Estruturante (NDE) pretende contribuir com debate sobre os fenômenos da evasão e retenção a fim de planejar ações de combate. Vale informar, a base de dados e o script com as análises que constam nessa nota e com outras que não constam aqui serão disponibilizados no site do Instituto.