class: center, middle, inverse, title-slide .title[ # Explorando dados com Dplyr ] .subtitle[ ## Explorando Indicadores Sociais com R e RStudio ] .author[ ### Prof. Ronaldo Baltar, Prof.ª Cláudia S. Baltar ] --- <!-- adjust font size in this css code chunk, currently 120 --> <style type="text/css"> .remark-code{line-height: 1.5; font-size: 120%} @media print { .has-continuation { display: block; } } code.r.hljs.remark-code{ position: relative; overflow-x: hidden; } code.r.hljs.remark-code:hover{ overflow-x:visible; width: 100%; border-top: 1px solid #5A0089; border-right: 1px solid #5A0089; border-bottom: 1px solid #5A0089; border-left: 1px solid #5A0089; } .remark-code-line-highlighted { background-color: #e9ddfe; } </style> # Explorando dados com {dplyr} Esta é uma atividade do curso Explorando Indicadores Sociais, promovido peloo Programa de Formação Complementar em Informática para Pesquisa Social - *InfoSoc*, coordenado pelo Prof. Ronaldo Baltar, em parceria com o Observatório de Populações e Políticas Públicas - *ObPPP*, coordenado pela Prof.ª Cláudia Siqueira Baltar, ambos vinculados ao Dept.º Ciências Sociais e ao Programa de Pós-graduação em Sociologia da Universidade Estadual de Londrina. Acompanhe o passo a passo e veja os resultados de cada função. Em seguida, reproduza em seu computador os códigos para uma melhor compreensão dos resultados. Depois, faça os exercícios de fixação e compreensão dos conteúdos. Vamos usar como exemplo as tabelas c_dic_tbl (dados dos censos demográficos IBGE de 1991, 2000 e 2010) e r_dic_tbl (dados de registros administrativos como RAIS, IDEB e outros), material extraído da base de indicadores sociais do Atlas Brasil (IPEA/PNUD/FJP). --- class: inverse, middle, center # O uso do Pipe %>% --- O pipe tem o objeto de ajudar a escrever o código como um fluxo de funções, passando os dados de uma a outra operação, sem a necessidade de explicitamente ter que ser fazer referência à tabela de dados. count: false ### Com e sem o uso do pipe .panel1-passo01-auto[ ```r # Selecionar as variáveis ANO e IDHM sem o pipe *select(c_dic_tbl, ANO, IDHM) ``` ] .panel2-passo01-auto[ ``` # A tibble: 16,695 × 2 ANO IDHM <dbl> <dbl> 1 1991 0.329 2 1991 0.432 3 1991 0.309 4 1991 0.407 5 1991 0.386 6 1991 0.376 7 1991 0.203 8 1991 0.425 9 1991 0.388 10 1991 0.468 # … with 16,685 more rows ``` ] --- count: false ### Com e sem o uso do pipe .panel1-passo01-auto[ ```r # Selecionar as variáveis ANO e IDHM sem o pipe select(c_dic_tbl, ANO, IDHM) # Com o pipe magrittr *c_dic_tbl ``` ] .panel2-passo01-auto[ ``` # A tibble: 16,695 × 2 ANO IDHM <dbl> <dbl> 1 1991 0.329 2 1991 0.432 3 1991 0.309 4 1991 0.407 5 1991 0.386 6 1991 0.376 7 1991 0.203 8 1991 0.425 9 1991 0.388 10 1991 0.468 # … with 16,685 more rows ``` ``` # A tibble: 16,695 × 237 ANO UF Codmun6 Codmun7 Munic…¹ ESPVIDA FECTOT MORT1 MORT5 RAZDEP SOBRE40 <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 1991 11 110001 1100015 ALTA F… 62.0 4.08 45.6 58.0 73.5 83.8 2 1991 11 110002 1100023 ARIQUE… 66.0 3.72 32.4 41.4 70.0 88.1 3 1991 11 110003 1100031 CABIXI 63.2 3.89 41.5 52.9 77.2 85.1 4 1991 11 110004 1100049 CACOAL 65.0 3.81 35.4 45.2 71.1 87.1 5 1991 11 110005 1100056 CEREJE… 62.7 3.55 43 54.8 71.1 84.6 6 1991 11 110006 1100064 COLORA… 64.5 3.38 37.2 47.5 75.8 86.5 7 1991 11 110007 1100072 CORUMB… 59.3 3.95 56.0 71.2 83.0 80.6 8 1991 11 110008 1100080 COSTA … 62.8 4.19 42.9 54.7 86.4 84.6 9 1991 11 110009 1100098 ESPIGÃ… 64.2 3.84 38.1 48.6 74.2 86.2 10 1991 11 110010 1100106 GUAJAR… 64.7 4.19 36.4 46.5 81.0 86.7 # … with 16,685 more rows, 226 more variables: SOBRE60 <dbl>, T_ENV <dbl>, # E_ANOSESTUDO <dbl>, T_ANALF11A14 <dbl>, T_ANALF15A17 <dbl>, # T_ANALF15M <dbl>, T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, T_ANALF25A29 <dbl>, # T_ANALF25M <dbl>, T_ATRASO_0_BASICO <dbl>, T_ATRASO_0_FUND <dbl>, # T_ATRASO_0_MED <dbl>, T_ATRASO_1_BASICO <dbl>, T_ATRASO_1_FUND <dbl>, # T_ATRASO_1_MED <dbl>, T_ATRASO_2_BASICO <dbl>, T_ATRASO_2_FUND <dbl>, # T_ATRASO_2_MED <dbl>, T_FBBAS <dbl>, T_FBFUND <dbl>, T_FBMED <dbl>, … ``` ] --- count: false ### Com e sem o uso do pipe .panel1-passo01-auto[ ```r # Selecionar as variáveis ANO e IDHM sem o pipe select(c_dic_tbl, ANO, IDHM) # Com o pipe magrittr c_dic_tbl %>% * select(ANO, IDHM) ``` ] .panel2-passo01-auto[ ``` # A tibble: 16,695 × 2 ANO IDHM <dbl> <dbl> 1 1991 0.329 2 1991 0.432 3 1991 0.309 4 1991 0.407 5 1991 0.386 6 1991 0.376 7 1991 0.203 8 1991 0.425 9 1991 0.388 10 1991 0.468 # … with 16,685 more rows ``` ``` # A tibble: 16,695 × 2 ANO IDHM <dbl> <dbl> 1 1991 0.329 2 1991 0.432 3 1991 0.309 4 1991 0.407 5 1991 0.386 6 1991 0.376 7 1991 0.203 8 1991 0.425 9 1991 0.388 10 1991 0.468 # … with 16,685 more rows ``` ] --- count: false ### Com e sem o uso do pipe .panel1-passo01-auto[ ```r # Selecionar as variáveis ANO e IDHM sem o pipe select(c_dic_tbl, ANO, IDHM) # Com o pipe magrittr c_dic_tbl %>% select(ANO, IDHM) ``` ] .panel2-passo01-auto[ ``` # A tibble: 16,695 × 2 ANO IDHM <dbl> <dbl> 1 1991 0.329 2 1991 0.432 3 1991 0.309 4 1991 0.407 5 1991 0.386 6 1991 0.376 7 1991 0.203 8 1991 0.425 9 1991 0.388 10 1991 0.468 # … with 16,685 more rows ``` ``` # A tibble: 16,695 × 2 ANO IDHM <dbl> <dbl> 1 1991 0.329 2 1991 0.432 3 1991 0.309 4 1991 0.407 5 1991 0.386 6 1991 0.376 7 1991 0.203 8 1991 0.425 9 1991 0.388 10 1991 0.468 # … with 16,685 more rows ``` ] <style> .panel1-passo01-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel2-passo01-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel3-passo01-auto { color: black; width: NA%; hight: 33%; float: left; padding-left: 1%; font-size: 80% } </style> --- class: inverse, middle, center # Selecionar variáveis: select() --- count: false ### Quais variáveis você irá escolher? .panel1-passo02-auto[ ```r # Selecionar as variáveis escolhidas *c_dic_tbl ``` ] .panel2-passo02-auto[ ``` # A tibble: 16,695 × 237 ANO UF Codmun6 Codmun7 Munic…¹ ESPVIDA FECTOT MORT1 MORT5 RAZDEP SOBRE40 <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 1991 11 110001 1100015 ALTA F… 62.0 4.08 45.6 58.0 73.5 83.8 2 1991 11 110002 1100023 ARIQUE… 66.0 3.72 32.4 41.4 70.0 88.1 3 1991 11 110003 1100031 CABIXI 63.2 3.89 41.5 52.9 77.2 85.1 4 1991 11 110004 1100049 CACOAL 65.0 3.81 35.4 45.2 71.1 87.1 5 1991 11 110005 1100056 CEREJE… 62.7 3.55 43 54.8 71.1 84.6 6 1991 11 110006 1100064 COLORA… 64.5 3.38 37.2 47.5 75.8 86.5 7 1991 11 110007 1100072 CORUMB… 59.3 3.95 56.0 71.2 83.0 80.6 8 1991 11 110008 1100080 COSTA … 62.8 4.19 42.9 54.7 86.4 84.6 9 1991 11 110009 1100098 ESPIGÃ… 64.2 3.84 38.1 48.6 74.2 86.2 10 1991 11 110010 1100106 GUAJAR… 64.7 4.19 36.4 46.5 81.0 86.7 # … with 16,685 more rows, 226 more variables: SOBRE60 <dbl>, T_ENV <dbl>, # E_ANOSESTUDO <dbl>, T_ANALF11A14 <dbl>, T_ANALF15A17 <dbl>, # T_ANALF15M <dbl>, T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, T_ANALF25A29 <dbl>, # T_ANALF25M <dbl>, T_ATRASO_0_BASICO <dbl>, T_ATRASO_0_FUND <dbl>, # T_ATRASO_0_MED <dbl>, T_ATRASO_1_BASICO <dbl>, T_ATRASO_1_FUND <dbl>, # T_ATRASO_1_MED <dbl>, T_ATRASO_2_BASICO <dbl>, T_ATRASO_2_FUND <dbl>, # T_ATRASO_2_MED <dbl>, T_FBBAS <dbl>, T_FBFUND <dbl>, T_FBMED <dbl>, … ``` ] --- count: false ### Quais variáveis você irá escolher? .panel1-passo02-auto[ ```r # Selecionar as variáveis escolhidas c_dic_tbl %>% * select(ANO, Município, IDHM) ``` ] .panel2-passo02-auto[ ``` # A tibble: 16,695 × 3 ANO Município IDHM <dbl> <chr> <dbl> 1 1991 ALTA FLORESTA D'OESTE 0.329 2 1991 ARIQUEMES 0.432 3 1991 CABIXI 0.309 4 1991 CACOAL 0.407 5 1991 CEREJEIRAS 0.386 6 1991 COLORADO DO OESTE 0.376 7 1991 CORUMBIARA 0.203 8 1991 COSTA MARQUES 0.425 9 1991 ESPIGÃO D'OESTE 0.388 10 1991 GUAJARÁ-MIRIM 0.468 # … with 16,685 more rows ``` ] <style> .panel1-passo02-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel2-passo02-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel3-passo02-auto { color: black; width: NA%; hight: 33%; float: left; padding-left: 1%; font-size: 80% } </style> --- count: false ### Quais variáveis você não vai escolher ! .panel1-passo03-auto[ ```r # Selecionar todas as variáveis, menos as especificadas com - *c_dic_tbl ``` ] .panel2-passo03-auto[ ``` # A tibble: 16,695 × 237 ANO UF Codmun6 Codmun7 Munic…¹ ESPVIDA FECTOT MORT1 MORT5 RAZDEP SOBRE40 <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 1991 11 110001 1100015 ALTA F… 62.0 4.08 45.6 58.0 73.5 83.8 2 1991 11 110002 1100023 ARIQUE… 66.0 3.72 32.4 41.4 70.0 88.1 3 1991 11 110003 1100031 CABIXI 63.2 3.89 41.5 52.9 77.2 85.1 4 1991 11 110004 1100049 CACOAL 65.0 3.81 35.4 45.2 71.1 87.1 5 1991 11 110005 1100056 CEREJE… 62.7 3.55 43 54.8 71.1 84.6 6 1991 11 110006 1100064 COLORA… 64.5 3.38 37.2 47.5 75.8 86.5 7 1991 11 110007 1100072 CORUMB… 59.3 3.95 56.0 71.2 83.0 80.6 8 1991 11 110008 1100080 COSTA … 62.8 4.19 42.9 54.7 86.4 84.6 9 1991 11 110009 1100098 ESPIGÃ… 64.2 3.84 38.1 48.6 74.2 86.2 10 1991 11 110010 1100106 GUAJAR… 64.7 4.19 36.4 46.5 81.0 86.7 # … with 16,685 more rows, 226 more variables: SOBRE60 <dbl>, T_ENV <dbl>, # E_ANOSESTUDO <dbl>, T_ANALF11A14 <dbl>, T_ANALF15A17 <dbl>, # T_ANALF15M <dbl>, T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, T_ANALF25A29 <dbl>, # T_ANALF25M <dbl>, T_ATRASO_0_BASICO <dbl>, T_ATRASO_0_FUND <dbl>, # T_ATRASO_0_MED <dbl>, T_ATRASO_1_BASICO <dbl>, T_ATRASO_1_FUND <dbl>, # T_ATRASO_1_MED <dbl>, T_ATRASO_2_BASICO <dbl>, T_ATRASO_2_FUND <dbl>, # T_ATRASO_2_MED <dbl>, T_FBBAS <dbl>, T_FBFUND <dbl>, T_FBMED <dbl>, … ``` ] --- count: false ### Quais variáveis você não vai escolher ! .panel1-passo03-auto[ ```r # Selecionar todas as variáveis, menos as especificadas com - c_dic_tbl %>% * select(-Município, -Codmun6, -Codmun7) ``` ] .panel2-passo03-auto[ ``` # A tibble: 16,695 × 234 ANO UF ESPVIDA FECTOT MORT1 MORT5 RAZDEP SOBRE40 SOBRE60 T_ENV E_ANOSE…¹ <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 1991 11 62.0 4.08 45.6 58.0 73.5 83.8 66.9 1.82 6.68 2 1991 11 66.0 3.72 32.4 41.4 70.0 88.1 74.2 1.82 7.86 3 1991 11 63.2 3.89 41.5 52.9 77.2 85.1 69 2.59 7.43 4 1991 11 65.0 3.81 35.4 45.2 71.1 87.1 72.4 2.47 8.34 5 1991 11 62.7 3.55 43 54.8 71.1 84.6 68.2 2.46 8.14 6 1991 11 64.5 3.38 37.2 47.5 75.8 86.5 71.4 2.71 8.68 7 1991 11 59.3 3.95 56.0 71.2 83.0 80.6 61.9 1.68 7.01 8 1991 11 62.8 4.19 42.9 54.7 86.4 84.6 68.3 2.49 7.42 9 1991 11 64.2 3.84 38.1 48.6 74.2 86.2 70.9 2.14 7.92 10 1991 11 64.7 4.19 36.4 46.5 81.0 86.7 71.8 3.56 7.88 # … with 16,685 more rows, 223 more variables: T_ANALF11A14 <dbl>, # T_ANALF15A17 <dbl>, T_ANALF15M <dbl>, T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, # T_ANALF25A29 <dbl>, T_ANALF25M <dbl>, T_ATRASO_0_BASICO <dbl>, # T_ATRASO_0_FUND <dbl>, T_ATRASO_0_MED <dbl>, T_ATRASO_1_BASICO <dbl>, # T_ATRASO_1_FUND <dbl>, T_ATRASO_1_MED <dbl>, T_ATRASO_2_BASICO <dbl>, # T_ATRASO_2_FUND <dbl>, T_ATRASO_2_MED <dbl>, T_FBBAS <dbl>, T_FBFUND <dbl>, # T_FBMED <dbl>, T_FBPRE <dbl>, T_FBSUPER <dbl>, T_FLBAS <dbl>, … ``` ] <style> .panel1-passo03-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel2-passo03-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel3-passo03-auto { color: black; width: NA%; hight: 33%; float: left; padding-left: 1%; font-size: 80% } </style> --- count: false ### Selecionar variáveis com base nos caracteres iniciais .panel1-passo04-auto[ ```r # Selecionar as variáveis que começam com IDHM *c_dic_tbl ``` ] .panel2-passo04-auto[ ``` # A tibble: 16,695 × 237 ANO UF Codmun6 Codmun7 Munic…¹ ESPVIDA FECTOT MORT1 MORT5 RAZDEP SOBRE40 <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 1991 11 110001 1100015 ALTA F… 62.0 4.08 45.6 58.0 73.5 83.8 2 1991 11 110002 1100023 ARIQUE… 66.0 3.72 32.4 41.4 70.0 88.1 3 1991 11 110003 1100031 CABIXI 63.2 3.89 41.5 52.9 77.2 85.1 4 1991 11 110004 1100049 CACOAL 65.0 3.81 35.4 45.2 71.1 87.1 5 1991 11 110005 1100056 CEREJE… 62.7 3.55 43 54.8 71.1 84.6 6 1991 11 110006 1100064 COLORA… 64.5 3.38 37.2 47.5 75.8 86.5 7 1991 11 110007 1100072 CORUMB… 59.3 3.95 56.0 71.2 83.0 80.6 8 1991 11 110008 1100080 COSTA … 62.8 4.19 42.9 54.7 86.4 84.6 9 1991 11 110009 1100098 ESPIGÃ… 64.2 3.84 38.1 48.6 74.2 86.2 10 1991 11 110010 1100106 GUAJAR… 64.7 4.19 36.4 46.5 81.0 86.7 # … with 16,685 more rows, 226 more variables: SOBRE60 <dbl>, T_ENV <dbl>, # E_ANOSESTUDO <dbl>, T_ANALF11A14 <dbl>, T_ANALF15A17 <dbl>, # T_ANALF15M <dbl>, T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, T_ANALF25A29 <dbl>, # T_ANALF25M <dbl>, T_ATRASO_0_BASICO <dbl>, T_ATRASO_0_FUND <dbl>, # T_ATRASO_0_MED <dbl>, T_ATRASO_1_BASICO <dbl>, T_ATRASO_1_FUND <dbl>, # T_ATRASO_1_MED <dbl>, T_ATRASO_2_BASICO <dbl>, T_ATRASO_2_FUND <dbl>, # T_ATRASO_2_MED <dbl>, T_FBBAS <dbl>, T_FBFUND <dbl>, T_FBMED <dbl>, … ``` ] --- count: false ### Selecionar variáveis com base nos caracteres iniciais .panel1-passo04-auto[ ```r # Selecionar as variáveis que começam com IDHM c_dic_tbl %>% * select(starts_with("IDHM")) ``` ] .panel2-passo04-auto[ ``` # A tibble: 16,695 × 4 IDHM IDHM_E IDHM_L IDHM_R <dbl> <dbl> <dbl> <dbl> 1 0.329 0.112 0.617 0.516 2 0.432 0.199 0.684 0.593 3 0.309 0.108 0.636 0.43 4 0.407 0.171 0.667 0.593 5 0.386 0.167 0.629 0.547 6 0.376 0.151 0.658 0.536 7 0.203 0.039 0.572 0.373 8 0.425 0.22 0.629 0.553 9 0.388 0.159 0.653 0.561 10 0.468 0.247 0.662 0.625 # … with 16,685 more rows ``` ] <style> .panel1-passo04-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel2-passo04-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel3-passo04-auto { color: black; width: NA%; hight: 33%; float: left; padding-left: 1%; font-size: 80% } </style> --- count: false ### Selecionar variáveis com base nos caracteres finais .panel1-passo05-auto[ ```r *# Selecionar as variáveis que terminam 18M (18 ou mais anos) # Selecionar as variáveis que terminam 18M (18 ou mais anos) ``` ] .panel2-passo05-auto[ ] --- count: false ### Selecionar variáveis com base nos caracteres finais .panel1-passo05-auto[ ```r # Selecionar as variáveis que terminam 18M (18 ou mais anos) # Selecionar as variáveis que terminam 18M (18 ou mais anos) *c_dic_tbl ``` ] .panel2-passo05-auto[ ``` # A tibble: 16,695 × 237 ANO UF Codmun6 Codmun7 Munic…¹ ESPVIDA FECTOT MORT1 MORT5 RAZDEP SOBRE40 <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 1991 11 110001 1100015 ALTA F… 62.0 4.08 45.6 58.0 73.5 83.8 2 1991 11 110002 1100023 ARIQUE… 66.0 3.72 32.4 41.4 70.0 88.1 3 1991 11 110003 1100031 CABIXI 63.2 3.89 41.5 52.9 77.2 85.1 4 1991 11 110004 1100049 CACOAL 65.0 3.81 35.4 45.2 71.1 87.1 5 1991 11 110005 1100056 CEREJE… 62.7 3.55 43 54.8 71.1 84.6 6 1991 11 110006 1100064 COLORA… 64.5 3.38 37.2 47.5 75.8 86.5 7 1991 11 110007 1100072 CORUMB… 59.3 3.95 56.0 71.2 83.0 80.6 8 1991 11 110008 1100080 COSTA … 62.8 4.19 42.9 54.7 86.4 84.6 9 1991 11 110009 1100098 ESPIGÃ… 64.2 3.84 38.1 48.6 74.2 86.2 10 1991 11 110010 1100106 GUAJAR… 64.7 4.19 36.4 46.5 81.0 86.7 # … with 16,685 more rows, 226 more variables: SOBRE60 <dbl>, T_ENV <dbl>, # E_ANOSESTUDO <dbl>, T_ANALF11A14 <dbl>, T_ANALF15A17 <dbl>, # T_ANALF15M <dbl>, T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, T_ANALF25A29 <dbl>, # T_ANALF25M <dbl>, T_ATRASO_0_BASICO <dbl>, T_ATRASO_0_FUND <dbl>, # T_ATRASO_0_MED <dbl>, T_ATRASO_1_BASICO <dbl>, T_ATRASO_1_FUND <dbl>, # T_ATRASO_1_MED <dbl>, T_ATRASO_2_BASICO <dbl>, T_ATRASO_2_FUND <dbl>, # T_ATRASO_2_MED <dbl>, T_FBBAS <dbl>, T_FBFUND <dbl>, T_FBMED <dbl>, … ``` ] --- count: false ### Selecionar variáveis com base nos caracteres finais .panel1-passo05-auto[ ```r # Selecionar as variáveis que terminam 18M (18 ou mais anos) # Selecionar as variáveis que terminam 18M (18 ou mais anos) c_dic_tbl %>% * select(ends_with("18M")) ``` ] .panel2-passo05-auto[ ``` # A tibble: 16,695 × 7 T_ANALF18M T_FUND18M T_MED18M T_ATIV18M T_DES18M PEA18M PIA18M <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 25.7 11.6 4.74 NA NA NA NA 2 18.4 20.0 10.2 NA NA NA NA 3 27.1 11.1 5.18 NA NA NA NA 4 23.3 17.6 8.83 NA NA NA NA 5 22.3 15.2 7.67 NA NA NA NA 6 28.1 14.8 7.31 NA NA NA NA 7 34.1 3.49 2.1 NA NA NA NA 8 20.8 23.6 14.5 NA NA NA NA 9 24.2 15.8 7.36 NA NA NA NA 10 18.1 31.9 19.4 NA NA NA NA # … with 16,685 more rows ``` ] <style> .panel1-passo05-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel2-passo05-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel3-passo05-auto { color: black; width: NA%; hight: 33%; float: left; padding-left: 1%; font-size: 80% } </style> --- count: false ### Selecionar variáveis em sequência .panel1-passo06-auto[ ```r # Selecionar as variáveis de IDHM até IDHM_R *c_dic_tbl ``` ] .panel2-passo06-auto[ ``` # A tibble: 16,695 × 237 ANO UF Codmun6 Codmun7 Munic…¹ ESPVIDA FECTOT MORT1 MORT5 RAZDEP SOBRE40 <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 1991 11 110001 1100015 ALTA F… 62.0 4.08 45.6 58.0 73.5 83.8 2 1991 11 110002 1100023 ARIQUE… 66.0 3.72 32.4 41.4 70.0 88.1 3 1991 11 110003 1100031 CABIXI 63.2 3.89 41.5 52.9 77.2 85.1 4 1991 11 110004 1100049 CACOAL 65.0 3.81 35.4 45.2 71.1 87.1 5 1991 11 110005 1100056 CEREJE… 62.7 3.55 43 54.8 71.1 84.6 6 1991 11 110006 1100064 COLORA… 64.5 3.38 37.2 47.5 75.8 86.5 7 1991 11 110007 1100072 CORUMB… 59.3 3.95 56.0 71.2 83.0 80.6 8 1991 11 110008 1100080 COSTA … 62.8 4.19 42.9 54.7 86.4 84.6 9 1991 11 110009 1100098 ESPIGÃ… 64.2 3.84 38.1 48.6 74.2 86.2 10 1991 11 110010 1100106 GUAJAR… 64.7 4.19 36.4 46.5 81.0 86.7 # … with 16,685 more rows, 226 more variables: SOBRE60 <dbl>, T_ENV <dbl>, # E_ANOSESTUDO <dbl>, T_ANALF11A14 <dbl>, T_ANALF15A17 <dbl>, # T_ANALF15M <dbl>, T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, T_ANALF25A29 <dbl>, # T_ANALF25M <dbl>, T_ATRASO_0_BASICO <dbl>, T_ATRASO_0_FUND <dbl>, # T_ATRASO_0_MED <dbl>, T_ATRASO_1_BASICO <dbl>, T_ATRASO_1_FUND <dbl>, # T_ATRASO_1_MED <dbl>, T_ATRASO_2_BASICO <dbl>, T_ATRASO_2_FUND <dbl>, # T_ATRASO_2_MED <dbl>, T_FBBAS <dbl>, T_FBFUND <dbl>, T_FBMED <dbl>, … ``` ] --- count: false ### Selecionar variáveis em sequência .panel1-passo06-auto[ ```r # Selecionar as variáveis de IDHM até IDHM_R c_dic_tbl %>% * select(IDHM : IDHM_R) ``` ] .panel2-passo06-auto[ ``` # A tibble: 16,695 × 4 IDHM IDHM_E IDHM_L IDHM_R <dbl> <dbl> <dbl> <dbl> 1 0.329 0.112 0.617 0.516 2 0.432 0.199 0.684 0.593 3 0.309 0.108 0.636 0.43 4 0.407 0.171 0.667 0.593 5 0.386 0.167 0.629 0.547 6 0.376 0.151 0.658 0.536 7 0.203 0.039 0.572 0.373 8 0.425 0.22 0.629 0.553 9 0.388 0.159 0.653 0.561 10 0.468 0.247 0.662 0.625 # … with 16,685 more rows ``` ] <style> .panel1-passo06-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel2-passo06-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel3-passo06-auto { color: black; width: NA%; hight: 33%; float: left; padding-left: 1%; font-size: 80% } </style> --- class: inverse, middle, center # Operações com as colunas (variáveis) --- count: false ### Mudar a posição das variáveis .panel1-passo07-auto[ ```r # Reposicionar as variáveis na tabela *c_dic_tbl ``` ] .panel2-passo07-auto[ ``` # A tibble: 16,695 × 237 ANO UF Codmun6 Codmun7 Munic…¹ ESPVIDA FECTOT MORT1 MORT5 RAZDEP SOBRE40 <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 1991 11 110001 1100015 ALTA F… 62.0 4.08 45.6 58.0 73.5 83.8 2 1991 11 110002 1100023 ARIQUE… 66.0 3.72 32.4 41.4 70.0 88.1 3 1991 11 110003 1100031 CABIXI 63.2 3.89 41.5 52.9 77.2 85.1 4 1991 11 110004 1100049 CACOAL 65.0 3.81 35.4 45.2 71.1 87.1 5 1991 11 110005 1100056 CEREJE… 62.7 3.55 43 54.8 71.1 84.6 6 1991 11 110006 1100064 COLORA… 64.5 3.38 37.2 47.5 75.8 86.5 7 1991 11 110007 1100072 CORUMB… 59.3 3.95 56.0 71.2 83.0 80.6 8 1991 11 110008 1100080 COSTA … 62.8 4.19 42.9 54.7 86.4 84.6 9 1991 11 110009 1100098 ESPIGÃ… 64.2 3.84 38.1 48.6 74.2 86.2 10 1991 11 110010 1100106 GUAJAR… 64.7 4.19 36.4 46.5 81.0 86.7 # … with 16,685 more rows, 226 more variables: SOBRE60 <dbl>, T_ENV <dbl>, # E_ANOSESTUDO <dbl>, T_ANALF11A14 <dbl>, T_ANALF15A17 <dbl>, # T_ANALF15M <dbl>, T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, T_ANALF25A29 <dbl>, # T_ANALF25M <dbl>, T_ATRASO_0_BASICO <dbl>, T_ATRASO_0_FUND <dbl>, # T_ATRASO_0_MED <dbl>, T_ATRASO_1_BASICO <dbl>, T_ATRASO_1_FUND <dbl>, # T_ATRASO_1_MED <dbl>, T_ATRASO_2_BASICO <dbl>, T_ATRASO_2_FUND <dbl>, # T_ATRASO_2_MED <dbl>, T_FBBAS <dbl>, T_FBFUND <dbl>, T_FBMED <dbl>, … ``` ] --- count: false ### Mudar a posição das variáveis .panel1-passo07-auto[ ```r # Reposicionar as variáveis na tabela c_dic_tbl %>% * relocate(IDHM, IDHM_R) ``` ] .panel2-passo07-auto[ ``` # A tibble: 16,695 × 237 IDHM IDHM_R ANO UF Codmun6 Codmun7 Município ESPVIDA FECTOT MORT1 MORT5 <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> 1 0.329 0.516 1991 11 110001 1100015 ALTA FLO… 62.0 4.08 45.6 58.0 2 0.432 0.593 1991 11 110002 1100023 ARIQUEMES 66.0 3.72 32.4 41.4 3 0.309 0.43 1991 11 110003 1100031 CABIXI 63.2 3.89 41.5 52.9 4 0.407 0.593 1991 11 110004 1100049 CACOAL 65.0 3.81 35.4 45.2 5 0.386 0.547 1991 11 110005 1100056 CEREJEIR… 62.7 3.55 43 54.8 6 0.376 0.536 1991 11 110006 1100064 COLORADO… 64.5 3.38 37.2 47.5 7 0.203 0.373 1991 11 110007 1100072 CORUMBIA… 59.3 3.95 56.0 71.2 8 0.425 0.553 1991 11 110008 1100080 COSTA MA… 62.8 4.19 42.9 54.7 9 0.388 0.561 1991 11 110009 1100098 ESPIGÃO … 64.2 3.84 38.1 48.6 10 0.468 0.625 1991 11 110010 1100106 GUAJARÁ-… 64.7 4.19 36.4 46.5 # … with 16,685 more rows, and 226 more variables: RAZDEP <dbl>, SOBRE40 <dbl>, # SOBRE60 <dbl>, T_ENV <dbl>, E_ANOSESTUDO <dbl>, T_ANALF11A14 <dbl>, # T_ANALF15A17 <dbl>, T_ANALF15M <dbl>, T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, # T_ANALF25A29 <dbl>, T_ANALF25M <dbl>, T_ATRASO_0_BASICO <dbl>, # T_ATRASO_0_FUND <dbl>, T_ATRASO_0_MED <dbl>, T_ATRASO_1_BASICO <dbl>, # T_ATRASO_1_FUND <dbl>, T_ATRASO_1_MED <dbl>, T_ATRASO_2_BASICO <dbl>, # T_ATRASO_2_FUND <dbl>, T_ATRASO_2_MED <dbl>, T_FBBAS <dbl>, … ``` ] <style> .panel1-passo07-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel2-passo07-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel3-passo07-auto { color: black; width: NA%; hight: 33%; float: left; padding-left: 1%; font-size: 80% } </style> --- count: false ### Criar uma nova coluna com mutate() .panel1-passo08-auto[ ```r # Criar uma nova coluna *c_dic_tbl ``` ] .panel2-passo08-auto[ ``` # A tibble: 16,695 × 237 ANO UF Codmun6 Codmun7 Munic…¹ ESPVIDA FECTOT MORT1 MORT5 RAZDEP SOBRE40 <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 1991 11 110001 1100015 ALTA F… 62.0 4.08 45.6 58.0 73.5 83.8 2 1991 11 110002 1100023 ARIQUE… 66.0 3.72 32.4 41.4 70.0 88.1 3 1991 11 110003 1100031 CABIXI 63.2 3.89 41.5 52.9 77.2 85.1 4 1991 11 110004 1100049 CACOAL 65.0 3.81 35.4 45.2 71.1 87.1 5 1991 11 110005 1100056 CEREJE… 62.7 3.55 43 54.8 71.1 84.6 6 1991 11 110006 1100064 COLORA… 64.5 3.38 37.2 47.5 75.8 86.5 7 1991 11 110007 1100072 CORUMB… 59.3 3.95 56.0 71.2 83.0 80.6 8 1991 11 110008 1100080 COSTA … 62.8 4.19 42.9 54.7 86.4 84.6 9 1991 11 110009 1100098 ESPIGÃ… 64.2 3.84 38.1 48.6 74.2 86.2 10 1991 11 110010 1100106 GUAJAR… 64.7 4.19 36.4 46.5 81.0 86.7 # … with 16,685 more rows, 226 more variables: SOBRE60 <dbl>, T_ENV <dbl>, # E_ANOSESTUDO <dbl>, T_ANALF11A14 <dbl>, T_ANALF15A17 <dbl>, # T_ANALF15M <dbl>, T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, T_ANALF25A29 <dbl>, # T_ANALF25M <dbl>, T_ATRASO_0_BASICO <dbl>, T_ATRASO_0_FUND <dbl>, # T_ATRASO_0_MED <dbl>, T_ATRASO_1_BASICO <dbl>, T_ATRASO_1_FUND <dbl>, # T_ATRASO_1_MED <dbl>, T_ATRASO_2_BASICO <dbl>, T_ATRASO_2_FUND <dbl>, # T_ATRASO_2_MED <dbl>, T_FBBAS <dbl>, T_FBFUND <dbl>, T_FBMED <dbl>, … ``` ] --- count: false ### Criar uma nova coluna com mutate() .panel1-passo08-auto[ ```r # Criar uma nova coluna c_dic_tbl %>% * mutate(t_urbanizacao = pesourb / pesotot) ``` ] .panel2-passo08-auto[ ``` # A tibble: 16,695 × 238 ANO UF Codmun6 Codmun7 Munic…¹ ESPVIDA FECTOT MORT1 MORT5 RAZDEP SOBRE40 <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 1991 11 110001 1100015 ALTA F… 62.0 4.08 45.6 58.0 73.5 83.8 2 1991 11 110002 1100023 ARIQUE… 66.0 3.72 32.4 41.4 70.0 88.1 3 1991 11 110003 1100031 CABIXI 63.2 3.89 41.5 52.9 77.2 85.1 4 1991 11 110004 1100049 CACOAL 65.0 3.81 35.4 45.2 71.1 87.1 5 1991 11 110005 1100056 CEREJE… 62.7 3.55 43 54.8 71.1 84.6 6 1991 11 110006 1100064 COLORA… 64.5 3.38 37.2 47.5 75.8 86.5 7 1991 11 110007 1100072 CORUMB… 59.3 3.95 56.0 71.2 83.0 80.6 8 1991 11 110008 1100080 COSTA … 62.8 4.19 42.9 54.7 86.4 84.6 9 1991 11 110009 1100098 ESPIGÃ… 64.2 3.84 38.1 48.6 74.2 86.2 10 1991 11 110010 1100106 GUAJAR… 64.7 4.19 36.4 46.5 81.0 86.7 # … with 16,685 more rows, 227 more variables: SOBRE60 <dbl>, T_ENV <dbl>, # E_ANOSESTUDO <dbl>, T_ANALF11A14 <dbl>, T_ANALF15A17 <dbl>, # T_ANALF15M <dbl>, T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, T_ANALF25A29 <dbl>, # T_ANALF25M <dbl>, T_ATRASO_0_BASICO <dbl>, T_ATRASO_0_FUND <dbl>, # T_ATRASO_0_MED <dbl>, T_ATRASO_1_BASICO <dbl>, T_ATRASO_1_FUND <dbl>, # T_ATRASO_1_MED <dbl>, T_ATRASO_2_BASICO <dbl>, T_ATRASO_2_FUND <dbl>, # T_ATRASO_2_MED <dbl>, T_FBBAS <dbl>, T_FBFUND <dbl>, T_FBMED <dbl>, … ``` ] --- count: false ### Criar uma nova coluna com mutate() .panel1-passo08-auto[ ```r # Criar uma nova coluna c_dic_tbl %>% mutate(t_urbanizacao = pesourb / pesotot) %>% * select(Município, t_urbanizacao) ``` ] .panel2-passo08-auto[ ``` # A tibble: 16,695 × 2 Município t_urbanizacao <chr> <dbl> 1 ALTA FLORESTA D'OESTE 0.398 2 ARIQUEMES 0.797 3 CABIXI 0.250 4 CACOAL 0.612 5 CEREJEIRAS 0.726 6 COLORADO DO OESTE 0.596 7 CORUMBIARA 0 8 COSTA MARQUES 0.847 9 ESPIGÃO D'OESTE 0.483 10 GUAJARÁ-MIRIM 0.841 # … with 16,685 more rows ``` ] <style> .panel1-passo08-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel2-passo08-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel3-passo08-auto { color: black; width: NA%; hight: 33%; float: left; padding-left: 1%; font-size: 80% } </style> --- class: inverse, middle, center # Operações com as linhas (casos) e colunas (variáveis) --- count: false ### Criar uma nova coluna com mutate() .panel1-passo09-auto[ ```r # Criar uma nova coluna *c_dic_tbl ``` ] .panel2-passo09-auto[ ``` # A tibble: 16,695 × 237 ANO UF Codmun6 Codmun7 Munic…¹ ESPVIDA FECTOT MORT1 MORT5 RAZDEP SOBRE40 <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 1991 11 110001 1100015 ALTA F… 62.0 4.08 45.6 58.0 73.5 83.8 2 1991 11 110002 1100023 ARIQUE… 66.0 3.72 32.4 41.4 70.0 88.1 3 1991 11 110003 1100031 CABIXI 63.2 3.89 41.5 52.9 77.2 85.1 4 1991 11 110004 1100049 CACOAL 65.0 3.81 35.4 45.2 71.1 87.1 5 1991 11 110005 1100056 CEREJE… 62.7 3.55 43 54.8 71.1 84.6 6 1991 11 110006 1100064 COLORA… 64.5 3.38 37.2 47.5 75.8 86.5 7 1991 11 110007 1100072 CORUMB… 59.3 3.95 56.0 71.2 83.0 80.6 8 1991 11 110008 1100080 COSTA … 62.8 4.19 42.9 54.7 86.4 84.6 9 1991 11 110009 1100098 ESPIGÃ… 64.2 3.84 38.1 48.6 74.2 86.2 10 1991 11 110010 1100106 GUAJAR… 64.7 4.19 36.4 46.5 81.0 86.7 # … with 16,685 more rows, 226 more variables: SOBRE60 <dbl>, T_ENV <dbl>, # E_ANOSESTUDO <dbl>, T_ANALF11A14 <dbl>, T_ANALF15A17 <dbl>, # T_ANALF15M <dbl>, T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, T_ANALF25A29 <dbl>, # T_ANALF25M <dbl>, T_ATRASO_0_BASICO <dbl>, T_ATRASO_0_FUND <dbl>, # T_ATRASO_0_MED <dbl>, T_ATRASO_1_BASICO <dbl>, T_ATRASO_1_FUND <dbl>, # T_ATRASO_1_MED <dbl>, T_ATRASO_2_BASICO <dbl>, T_ATRASO_2_FUND <dbl>, # T_ATRASO_2_MED <dbl>, T_FBBAS <dbl>, T_FBFUND <dbl>, T_FBMED <dbl>, … ``` ] --- count: false ### Criar uma nova coluna com mutate() .panel1-passo09-auto[ ```r # Criar uma nova coluna c_dic_tbl %>% * mutate(t_urbanizacao = pesourb / pesotot) ``` ] .panel2-passo09-auto[ ``` # A tibble: 16,695 × 238 ANO UF Codmun6 Codmun7 Munic…¹ ESPVIDA FECTOT MORT1 MORT5 RAZDEP SOBRE40 <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 1991 11 110001 1100015 ALTA F… 62.0 4.08 45.6 58.0 73.5 83.8 2 1991 11 110002 1100023 ARIQUE… 66.0 3.72 32.4 41.4 70.0 88.1 3 1991 11 110003 1100031 CABIXI 63.2 3.89 41.5 52.9 77.2 85.1 4 1991 11 110004 1100049 CACOAL 65.0 3.81 35.4 45.2 71.1 87.1 5 1991 11 110005 1100056 CEREJE… 62.7 3.55 43 54.8 71.1 84.6 6 1991 11 110006 1100064 COLORA… 64.5 3.38 37.2 47.5 75.8 86.5 7 1991 11 110007 1100072 CORUMB… 59.3 3.95 56.0 71.2 83.0 80.6 8 1991 11 110008 1100080 COSTA … 62.8 4.19 42.9 54.7 86.4 84.6 9 1991 11 110009 1100098 ESPIGÃ… 64.2 3.84 38.1 48.6 74.2 86.2 10 1991 11 110010 1100106 GUAJAR… 64.7 4.19 36.4 46.5 81.0 86.7 # … with 16,685 more rows, 227 more variables: SOBRE60 <dbl>, T_ENV <dbl>, # E_ANOSESTUDO <dbl>, T_ANALF11A14 <dbl>, T_ANALF15A17 <dbl>, # T_ANALF15M <dbl>, T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, T_ANALF25A29 <dbl>, # T_ANALF25M <dbl>, T_ATRASO_0_BASICO <dbl>, T_ATRASO_0_FUND <dbl>, # T_ATRASO_0_MED <dbl>, T_ATRASO_1_BASICO <dbl>, T_ATRASO_1_FUND <dbl>, # T_ATRASO_1_MED <dbl>, T_ATRASO_2_BASICO <dbl>, T_ATRASO_2_FUND <dbl>, # T_ATRASO_2_MED <dbl>, T_FBBAS <dbl>, T_FBFUND <dbl>, T_FBMED <dbl>, … ``` ] --- count: false ### Criar uma nova coluna com mutate() .panel1-passo09-auto[ ```r # Criar uma nova coluna c_dic_tbl %>% mutate(t_urbanizacao = pesourb / pesotot) %>% * select(Município, t_urbanizacao) ``` ] .panel2-passo09-auto[ ``` # A tibble: 16,695 × 2 Município t_urbanizacao <chr> <dbl> 1 ALTA FLORESTA D'OESTE 0.398 2 ARIQUEMES 0.797 3 CABIXI 0.250 4 CACOAL 0.612 5 CEREJEIRAS 0.726 6 COLORADO DO OESTE 0.596 7 CORUMBIARA 0 8 COSTA MARQUES 0.847 9 ESPIGÃO D'OESTE 0.483 10 GUAJARÁ-MIRIM 0.841 # … with 16,685 more rows ``` ] <style> .panel1-passo09-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel2-passo09-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel3-passo09-auto { color: black; width: NA%; hight: 33%; float: left; padding-left: 1%; font-size: 80% } </style> --- count: false ### Apresentando os dados em ordem com arrange() .panel1-passo10-auto[ ```r # exibindo os 10 municípios com maior IDHM * c_dic_tbl ``` ] .panel2-passo10-auto[ ``` # A tibble: 16,695 × 237 ANO UF Codmun6 Codmun7 Munic…¹ ESPVIDA FECTOT MORT1 MORT5 RAZDEP SOBRE40 <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 1991 11 110001 1100015 ALTA F… 62.0 4.08 45.6 58.0 73.5 83.8 2 1991 11 110002 1100023 ARIQUE… 66.0 3.72 32.4 41.4 70.0 88.1 3 1991 11 110003 1100031 CABIXI 63.2 3.89 41.5 52.9 77.2 85.1 4 1991 11 110004 1100049 CACOAL 65.0 3.81 35.4 45.2 71.1 87.1 5 1991 11 110005 1100056 CEREJE… 62.7 3.55 43 54.8 71.1 84.6 6 1991 11 110006 1100064 COLORA… 64.5 3.38 37.2 47.5 75.8 86.5 7 1991 11 110007 1100072 CORUMB… 59.3 3.95 56.0 71.2 83.0 80.6 8 1991 11 110008 1100080 COSTA … 62.8 4.19 42.9 54.7 86.4 84.6 9 1991 11 110009 1100098 ESPIGÃ… 64.2 3.84 38.1 48.6 74.2 86.2 10 1991 11 110010 1100106 GUAJAR… 64.7 4.19 36.4 46.5 81.0 86.7 # … with 16,685 more rows, 226 more variables: SOBRE60 <dbl>, T_ENV <dbl>, # E_ANOSESTUDO <dbl>, T_ANALF11A14 <dbl>, T_ANALF15A17 <dbl>, # T_ANALF15M <dbl>, T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, T_ANALF25A29 <dbl>, # T_ANALF25M <dbl>, T_ATRASO_0_BASICO <dbl>, T_ATRASO_0_FUND <dbl>, # T_ATRASO_0_MED <dbl>, T_ATRASO_1_BASICO <dbl>, T_ATRASO_1_FUND <dbl>, # T_ATRASO_1_MED <dbl>, T_ATRASO_2_BASICO <dbl>, T_ATRASO_2_FUND <dbl>, # T_ATRASO_2_MED <dbl>, T_FBBAS <dbl>, T_FBFUND <dbl>, T_FBMED <dbl>, … ``` ] --- count: false ### Apresentando os dados em ordem com arrange() .panel1-passo10-auto[ ```r # exibindo os 10 municípios com maior IDHM c_dic_tbl %>% * filter(ANO == 2010) ``` ] .panel2-passo10-auto[ ``` # A tibble: 5,565 × 237 ANO UF Codmun6 Codmun7 Munic…¹ ESPVIDA FECTOT MORT1 MORT5 RAZDEP SOBRE40 <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 2010 11 110001 1100015 ALTA F… 70.8 2.24 23.8 25.5 47.4 94.5 2 2010 11 110002 1100023 ARIQUE… 73.4 1.91 19.2 20.5 46.7 96.1 3 2010 11 110003 1100031 CABIXI 70.4 2.15 24.8 26.6 48.1 94.3 4 2010 11 110004 1100049 CACOAL 74.3 1.9 14.3 15.4 43.8 96.4 5 2010 11 110005 1100056 CEREJE… 72.9 2.12 18.1 19.4 45.7 95.8 6 2010 11 110006 1100064 COLORA… 73.8 1.89 16.1 17.3 45.8 96.2 7 2010 11 110007 1100072 CORUMB… 71.4 2.29 21.9 23.4 46.3 94.9 8 2010 11 110008 1100080 COSTA … 70.0 2.72 25.8 27.7 60.1 94.0 9 2010 11 110009 1100098 ESPIGÃ… 74.2 2.22 15.4 16.5 46.8 96.4 10 2010 11 110010 1100106 GUAJAR… 74.4 2.61 14.8 15.9 56.7 96.5 # … with 5,555 more rows, 226 more variables: SOBRE60 <dbl>, T_ENV <dbl>, # E_ANOSESTUDO <dbl>, T_ANALF11A14 <dbl>, T_ANALF15A17 <dbl>, # T_ANALF15M <dbl>, T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, T_ANALF25A29 <dbl>, # T_ANALF25M <dbl>, T_ATRASO_0_BASICO <dbl>, T_ATRASO_0_FUND <dbl>, # T_ATRASO_0_MED <dbl>, T_ATRASO_1_BASICO <dbl>, T_ATRASO_1_FUND <dbl>, # T_ATRASO_1_MED <dbl>, T_ATRASO_2_BASICO <dbl>, T_ATRASO_2_FUND <dbl>, # T_ATRASO_2_MED <dbl>, T_FBBAS <dbl>, T_FBFUND <dbl>, T_FBMED <dbl>, … ``` ] --- count: false ### Apresentando os dados em ordem com arrange() .panel1-passo10-auto[ ```r # exibindo os 10 municípios com maior IDHM c_dic_tbl %>% filter(ANO == 2010) %>% * arrange(desc(IDHM)) ``` ] .panel2-passo10-auto[ ``` # A tibble: 5,565 × 237 ANO UF Codmun6 Codmun7 Munic…¹ ESPVIDA FECTOT MORT1 MORT5 RAZDEP SOBRE40 <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 2010 35 354880 3548807 SÃO CA… 78.2 1.3 9.5 11.0 41.1 95.8 2 2010 35 350060 3500600 ÁGUAS … 78.4 1.32 9.3 10.8 52.8 95.9 3 2010 42 420540 4205407 FLORIA… 77.4 1.23 10.8 12.1 34.1 95.4 4 2010 32 320530 3205309 VITÓRIA 76.3 1.38 11.4 13.3 37.9 93.1 5 2010 42 420200 4202008 BALNEÁ… 78.6 1.31 8.7 10.2 34.7 95.9 6 2010 35 354850 3548500 SANTOS 76.1 1.25 13.7 15.4 44.5 95.1 7 2010 33 330330 3303302 NITERÓI 76.2 1.41 12.9 14.5 40.5 93.4 8 2010 42 420900 4209003 JOAÇABA 78.4 1.65 9.2 10.8 38.8 95.9 9 2010 53 530010 5300108 BRASÍL… 77.4 1.75 14.0 15.8 40.1 94.6 10 2010 41 410690 4106902 CURITI… 76.3 1.58 11.9 13.6 38.0 94.7 # … with 5,555 more rows, 226 more variables: SOBRE60 <dbl>, T_ENV <dbl>, # E_ANOSESTUDO <dbl>, T_ANALF11A14 <dbl>, T_ANALF15A17 <dbl>, # T_ANALF15M <dbl>, T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, T_ANALF25A29 <dbl>, # T_ANALF25M <dbl>, T_ATRASO_0_BASICO <dbl>, T_ATRASO_0_FUND <dbl>, # T_ATRASO_0_MED <dbl>, T_ATRASO_1_BASICO <dbl>, T_ATRASO_1_FUND <dbl>, # T_ATRASO_1_MED <dbl>, T_ATRASO_2_BASICO <dbl>, T_ATRASO_2_FUND <dbl>, # T_ATRASO_2_MED <dbl>, T_FBBAS <dbl>, T_FBFUND <dbl>, T_FBMED <dbl>, … ``` ] --- count: false ### Apresentando os dados em ordem com arrange() .panel1-passo10-auto[ ```r # exibindo os 10 municípios com maior IDHM c_dic_tbl %>% filter(ANO == 2010) %>% arrange(desc(IDHM)) %>% * select(Município, IDHM) ``` ] .panel2-passo10-auto[ ``` # A tibble: 5,565 × 2 Município IDHM <chr> <dbl> 1 SÃO CAETANO DO SUL 0.862 2 ÁGUAS DE SÃO PEDRO 0.854 3 FLORIANÓPOLIS 0.847 4 VITÓRIA 0.845 5 BALNEÁRIO CAMBORIÚ 0.845 6 SANTOS 0.84 7 NITERÓI 0.837 8 JOAÇABA 0.827 9 BRASÍLIA 0.824 10 CURITIBA 0.823 # … with 5,555 more rows ``` ] --- count: false ### Apresentando os dados em ordem com arrange() .panel1-passo10-auto[ ```r # exibindo os 10 municípios com maior IDHM c_dic_tbl %>% filter(ANO == 2010) %>% arrange(desc(IDHM)) %>% select(Município, IDHM) %>% * head(10) ``` ] .panel2-passo10-auto[ ``` # A tibble: 10 × 2 Município IDHM <chr> <dbl> 1 SÃO CAETANO DO SUL 0.862 2 ÁGUAS DE SÃO PEDRO 0.854 3 FLORIANÓPOLIS 0.847 4 VITÓRIA 0.845 5 BALNEÁRIO CAMBORIÚ 0.845 6 SANTOS 0.84 7 NITERÓI 0.837 8 JOAÇABA 0.827 9 BRASÍLIA 0.824 10 CURITIBA 0.823 ``` ] <style> .panel1-passo10-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel2-passo10-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel3-passo10-auto { color: black; width: NA%; hight: 33%; float: left; padding-left: 1%; font-size: 80% } </style> --- count: false ### Apresentando os dados em ordem com arrange() .panel1-passo10b-auto[ ```r # exibindo os 10 municípios com menor IDHM * c_dic_tbl ``` ] .panel2-passo10b-auto[ ``` # A tibble: 16,695 × 237 ANO UF Codmun6 Codmun7 Munic…¹ ESPVIDA FECTOT MORT1 MORT5 RAZDEP SOBRE40 <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 1991 11 110001 1100015 ALTA F… 62.0 4.08 45.6 58.0 73.5 83.8 2 1991 11 110002 1100023 ARIQUE… 66.0 3.72 32.4 41.4 70.0 88.1 3 1991 11 110003 1100031 CABIXI 63.2 3.89 41.5 52.9 77.2 85.1 4 1991 11 110004 1100049 CACOAL 65.0 3.81 35.4 45.2 71.1 87.1 5 1991 11 110005 1100056 CEREJE… 62.7 3.55 43 54.8 71.1 84.6 6 1991 11 110006 1100064 COLORA… 64.5 3.38 37.2 47.5 75.8 86.5 7 1991 11 110007 1100072 CORUMB… 59.3 3.95 56.0 71.2 83.0 80.6 8 1991 11 110008 1100080 COSTA … 62.8 4.19 42.9 54.7 86.4 84.6 9 1991 11 110009 1100098 ESPIGÃ… 64.2 3.84 38.1 48.6 74.2 86.2 10 1991 11 110010 1100106 GUAJAR… 64.7 4.19 36.4 46.5 81.0 86.7 # … with 16,685 more rows, 226 more variables: SOBRE60 <dbl>, T_ENV <dbl>, # E_ANOSESTUDO <dbl>, T_ANALF11A14 <dbl>, T_ANALF15A17 <dbl>, # T_ANALF15M <dbl>, T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, T_ANALF25A29 <dbl>, # T_ANALF25M <dbl>, T_ATRASO_0_BASICO <dbl>, T_ATRASO_0_FUND <dbl>, # T_ATRASO_0_MED <dbl>, T_ATRASO_1_BASICO <dbl>, T_ATRASO_1_FUND <dbl>, # T_ATRASO_1_MED <dbl>, T_ATRASO_2_BASICO <dbl>, T_ATRASO_2_FUND <dbl>, # T_ATRASO_2_MED <dbl>, T_FBBAS <dbl>, T_FBFUND <dbl>, T_FBMED <dbl>, … ``` ] --- count: false ### Apresentando os dados em ordem com arrange() .panel1-passo10b-auto[ ```r # exibindo os 10 municípios com menor IDHM c_dic_tbl %>% * filter(ANO == 2010) ``` ] .panel2-passo10b-auto[ ``` # A tibble: 5,565 × 237 ANO UF Codmun6 Codmun7 Munic…¹ ESPVIDA FECTOT MORT1 MORT5 RAZDEP SOBRE40 <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 2010 11 110001 1100015 ALTA F… 70.8 2.24 23.8 25.5 47.4 94.5 2 2010 11 110002 1100023 ARIQUE… 73.4 1.91 19.2 20.5 46.7 96.1 3 2010 11 110003 1100031 CABIXI 70.4 2.15 24.8 26.6 48.1 94.3 4 2010 11 110004 1100049 CACOAL 74.3 1.9 14.3 15.4 43.8 96.4 5 2010 11 110005 1100056 CEREJE… 72.9 2.12 18.1 19.4 45.7 95.8 6 2010 11 110006 1100064 COLORA… 73.8 1.89 16.1 17.3 45.8 96.2 7 2010 11 110007 1100072 CORUMB… 71.4 2.29 21.9 23.4 46.3 94.9 8 2010 11 110008 1100080 COSTA … 70.0 2.72 25.8 27.7 60.1 94.0 9 2010 11 110009 1100098 ESPIGÃ… 74.2 2.22 15.4 16.5 46.8 96.4 10 2010 11 110010 1100106 GUAJAR… 74.4 2.61 14.8 15.9 56.7 96.5 # … with 5,555 more rows, 226 more variables: SOBRE60 <dbl>, T_ENV <dbl>, # E_ANOSESTUDO <dbl>, T_ANALF11A14 <dbl>, T_ANALF15A17 <dbl>, # T_ANALF15M <dbl>, T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, T_ANALF25A29 <dbl>, # T_ANALF25M <dbl>, T_ATRASO_0_BASICO <dbl>, T_ATRASO_0_FUND <dbl>, # T_ATRASO_0_MED <dbl>, T_ATRASO_1_BASICO <dbl>, T_ATRASO_1_FUND <dbl>, # T_ATRASO_1_MED <dbl>, T_ATRASO_2_BASICO <dbl>, T_ATRASO_2_FUND <dbl>, # T_ATRASO_2_MED <dbl>, T_FBBAS <dbl>, T_FBFUND <dbl>, T_FBMED <dbl>, … ``` ] --- count: false ### Apresentando os dados em ordem com arrange() .panel1-passo10b-auto[ ```r # exibindo os 10 municípios com menor IDHM c_dic_tbl %>% filter(ANO == 2010) %>% * arrange(IDHM) ``` ] .panel2-passo10b-auto[ ``` # A tibble: 5,565 × 237 ANO UF Codmun6 Codmun7 Munic…¹ ESPVIDA FECTOT MORT1 MORT5 RAZDEP SOBRE40 <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 2010 15 150450 1504505 MELGAÇO 71.6 3.87 22.4 24.1 88.0 94.8 2 2010 21 210408 2104081 FERNAN… 68.7 3.32 33.8 36.8 75.9 92.2 3 2010 13 130020 1300201 ATALAI… 69.0 3.62 28.6 30.6 72.9 93.4 4 2010 21 210635 2106359 MARAJÁ… 71.4 4.1 25 27.2 72.6 94.2 5 2010 14 140070 1400704 UIRAMU… 71.0 3.45 22.4 23.9 118. 94.8 6 2010 15 150250 1502509 CHAVES 71.2 2.53 23.5 25.3 78.6 94.5 7 2010 12 120032 1200328 JORDÃO 68.8 3.84 31.6 34.2 105. 92.7 8 2010 15 150110 1501105 BAGRE 71.6 3.76 22.3 24.0 85.2 94.8 9 2010 15 150195 1501956 CACHOE… 71.7 3.52 22 23.6 74.6 94.9 10 2010 13 130195 1301951 ITAMAR… 71.3 3.9 21.8 23.3 81.2 95.0 # … with 5,555 more rows, 226 more variables: SOBRE60 <dbl>, T_ENV <dbl>, # E_ANOSESTUDO <dbl>, T_ANALF11A14 <dbl>, T_ANALF15A17 <dbl>, # T_ANALF15M <dbl>, T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, T_ANALF25A29 <dbl>, # T_ANALF25M <dbl>, T_ATRASO_0_BASICO <dbl>, T_ATRASO_0_FUND <dbl>, # T_ATRASO_0_MED <dbl>, T_ATRASO_1_BASICO <dbl>, T_ATRASO_1_FUND <dbl>, # T_ATRASO_1_MED <dbl>, T_ATRASO_2_BASICO <dbl>, T_ATRASO_2_FUND <dbl>, # T_ATRASO_2_MED <dbl>, T_FBBAS <dbl>, T_FBFUND <dbl>, T_FBMED <dbl>, … ``` ] --- count: false ### Apresentando os dados em ordem com arrange() .panel1-passo10b-auto[ ```r # exibindo os 10 municípios com menor IDHM c_dic_tbl %>% filter(ANO == 2010) %>% arrange(IDHM) %>% * select(Município, IDHM) ``` ] .panel2-passo10b-auto[ ``` # A tibble: 5,565 × 2 Município IDHM <chr> <dbl> 1 MELGAÇO 0.418 2 FERNANDO FALCÃO 0.443 3 ATALAIA DO NORTE 0.45 4 MARAJÁ DO SENA 0.452 5 UIRAMUTÃ 0.453 6 CHAVES 0.453 7 JORDÃO 0.469 8 BAGRE 0.471 9 CACHOEIRA DO PIRIÁ 0.473 10 ITAMARATI 0.477 # … with 5,555 more rows ``` ] --- count: false ### Apresentando os dados em ordem com arrange() .panel1-passo10b-auto[ ```r # exibindo os 10 municípios com menor IDHM c_dic_tbl %>% filter(ANO == 2010) %>% arrange(IDHM) %>% select(Município, IDHM) %>% * head(10) ``` ] .panel2-passo10b-auto[ ``` # A tibble: 10 × 2 Município IDHM <chr> <dbl> 1 MELGAÇO 0.418 2 FERNANDO FALCÃO 0.443 3 ATALAIA DO NORTE 0.45 4 MARAJÁ DO SENA 0.452 5 UIRAMUTÃ 0.453 6 CHAVES 0.453 7 JORDÃO 0.469 8 BAGRE 0.471 9 CACHOEIRA DO PIRIÁ 0.473 10 ITAMARATI 0.477 ``` ] --- count: false ### Apresentando os dados em ordem com arrange() .panel1-passo10b-auto[ ```r # exibindo os 10 municípios com menor IDHM c_dic_tbl %>% filter(ANO == 2010) %>% arrange(IDHM) %>% select(Município, IDHM) %>% head(10) ``` ] .panel2-passo10b-auto[ ``` # A tibble: 10 × 2 Município IDHM <chr> <dbl> 1 MELGAÇO 0.418 2 FERNANDO FALCÃO 0.443 3 ATALAIA DO NORTE 0.45 4 MARAJÁ DO SENA 0.452 5 UIRAMUTÃ 0.453 6 CHAVES 0.453 7 JORDÃO 0.469 8 BAGRE 0.471 9 CACHOEIRA DO PIRIÁ 0.473 10 ITAMARATI 0.477 ``` ] <style> .panel1-passo10b-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel2-passo10b-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel3-passo10b-auto { color: black; width: NA%; hight: 33%; float: left; padding-left: 1%; font-size: 80% } </style> --- count: false ### Selecionando os casos que representam valores extremos .panel1-passo13-auto[ ```r # Lista dos valores extremos para IDHM * c_dic_tbl ``` ] .panel2-passo13-auto[ ``` # A tibble: 16,695 × 237 ANO UF Codmun6 Codmun7 Munic…¹ ESPVIDA FECTOT MORT1 MORT5 RAZDEP SOBRE40 <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 1991 11 110001 1100015 ALTA F… 62.0 4.08 45.6 58.0 73.5 83.8 2 1991 11 110002 1100023 ARIQUE… 66.0 3.72 32.4 41.4 70.0 88.1 3 1991 11 110003 1100031 CABIXI 63.2 3.89 41.5 52.9 77.2 85.1 4 1991 11 110004 1100049 CACOAL 65.0 3.81 35.4 45.2 71.1 87.1 5 1991 11 110005 1100056 CEREJE… 62.7 3.55 43 54.8 71.1 84.6 6 1991 11 110006 1100064 COLORA… 64.5 3.38 37.2 47.5 75.8 86.5 7 1991 11 110007 1100072 CORUMB… 59.3 3.95 56.0 71.2 83.0 80.6 8 1991 11 110008 1100080 COSTA … 62.8 4.19 42.9 54.7 86.4 84.6 9 1991 11 110009 1100098 ESPIGÃ… 64.2 3.84 38.1 48.6 74.2 86.2 10 1991 11 110010 1100106 GUAJAR… 64.7 4.19 36.4 46.5 81.0 86.7 # … with 16,685 more rows, 226 more variables: SOBRE60 <dbl>, T_ENV <dbl>, # E_ANOSESTUDO <dbl>, T_ANALF11A14 <dbl>, T_ANALF15A17 <dbl>, # T_ANALF15M <dbl>, T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, T_ANALF25A29 <dbl>, # T_ANALF25M <dbl>, T_ATRASO_0_BASICO <dbl>, T_ATRASO_0_FUND <dbl>, # T_ATRASO_0_MED <dbl>, T_ATRASO_1_BASICO <dbl>, T_ATRASO_1_FUND <dbl>, # T_ATRASO_1_MED <dbl>, T_ATRASO_2_BASICO <dbl>, T_ATRASO_2_FUND <dbl>, # T_ATRASO_2_MED <dbl>, T_FBBAS <dbl>, T_FBFUND <dbl>, T_FBMED <dbl>, … ``` ] --- count: false ### Selecionando os casos que representam valores extremos .panel1-passo13-auto[ ```r # Lista dos valores extremos para IDHM c_dic_tbl %>% * filter(ANO == 2010) ``` ] .panel2-passo13-auto[ ``` # A tibble: 5,565 × 237 ANO UF Codmun6 Codmun7 Munic…¹ ESPVIDA FECTOT MORT1 MORT5 RAZDEP SOBRE40 <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 2010 11 110001 1100015 ALTA F… 70.8 2.24 23.8 25.5 47.4 94.5 2 2010 11 110002 1100023 ARIQUE… 73.4 1.91 19.2 20.5 46.7 96.1 3 2010 11 110003 1100031 CABIXI 70.4 2.15 24.8 26.6 48.1 94.3 4 2010 11 110004 1100049 CACOAL 74.3 1.9 14.3 15.4 43.8 96.4 5 2010 11 110005 1100056 CEREJE… 72.9 2.12 18.1 19.4 45.7 95.8 6 2010 11 110006 1100064 COLORA… 73.8 1.89 16.1 17.3 45.8 96.2 7 2010 11 110007 1100072 CORUMB… 71.4 2.29 21.9 23.4 46.3 94.9 8 2010 11 110008 1100080 COSTA … 70.0 2.72 25.8 27.7 60.1 94.0 9 2010 11 110009 1100098 ESPIGÃ… 74.2 2.22 15.4 16.5 46.8 96.4 10 2010 11 110010 1100106 GUAJAR… 74.4 2.61 14.8 15.9 56.7 96.5 # … with 5,555 more rows, 226 more variables: SOBRE60 <dbl>, T_ENV <dbl>, # E_ANOSESTUDO <dbl>, T_ANALF11A14 <dbl>, T_ANALF15A17 <dbl>, # T_ANALF15M <dbl>, T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, T_ANALF25A29 <dbl>, # T_ANALF25M <dbl>, T_ATRASO_0_BASICO <dbl>, T_ATRASO_0_FUND <dbl>, # T_ATRASO_0_MED <dbl>, T_ATRASO_1_BASICO <dbl>, T_ATRASO_1_FUND <dbl>, # T_ATRASO_1_MED <dbl>, T_ATRASO_2_BASICO <dbl>, T_ATRASO_2_FUND <dbl>, # T_ATRASO_2_MED <dbl>, T_FBBAS <dbl>, T_FBFUND <dbl>, T_FBMED <dbl>, … ``` ] --- count: false ### Selecionando os casos que representam valores extremos .panel1-passo13-auto[ ```r # Lista dos valores extremos para IDHM c_dic_tbl %>% filter(ANO == 2010) %>% * mutate(iqr_idhm = IQR(IDHM), * q1_idhm = quantile(IDHM, 0.25), * q3_idhm = quantile(IDHM, 0.75), * limite_inferior_idhm = q1_idhm - (1.1 * iqr_idhm), * limite_superior_idhm = q3_idhm + (1.1 * iqr_idhm) * ) ``` ] .panel2-passo13-auto[ ``` # A tibble: 5,565 × 242 ANO UF Codmun6 Codmun7 Munic…¹ ESPVIDA FECTOT MORT1 MORT5 RAZDEP SOBRE40 <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 2010 11 110001 1100015 ALTA F… 70.8 2.24 23.8 25.5 47.4 94.5 2 2010 11 110002 1100023 ARIQUE… 73.4 1.91 19.2 20.5 46.7 96.1 3 2010 11 110003 1100031 CABIXI 70.4 2.15 24.8 26.6 48.1 94.3 4 2010 11 110004 1100049 CACOAL 74.3 1.9 14.3 15.4 43.8 96.4 5 2010 11 110005 1100056 CEREJE… 72.9 2.12 18.1 19.4 45.7 95.8 6 2010 11 110006 1100064 COLORA… 73.8 1.89 16.1 17.3 45.8 96.2 7 2010 11 110007 1100072 CORUMB… 71.4 2.29 21.9 23.4 46.3 94.9 8 2010 11 110008 1100080 COSTA … 70.0 2.72 25.8 27.7 60.1 94.0 9 2010 11 110009 1100098 ESPIGÃ… 74.2 2.22 15.4 16.5 46.8 96.4 10 2010 11 110010 1100106 GUAJAR… 74.4 2.61 14.8 15.9 56.7 96.5 # … with 5,555 more rows, 231 more variables: SOBRE60 <dbl>, T_ENV <dbl>, # E_ANOSESTUDO <dbl>, T_ANALF11A14 <dbl>, T_ANALF15A17 <dbl>, # T_ANALF15M <dbl>, T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, T_ANALF25A29 <dbl>, # T_ANALF25M <dbl>, T_ATRASO_0_BASICO <dbl>, T_ATRASO_0_FUND <dbl>, # T_ATRASO_0_MED <dbl>, T_ATRASO_1_BASICO <dbl>, T_ATRASO_1_FUND <dbl>, # T_ATRASO_1_MED <dbl>, T_ATRASO_2_BASICO <dbl>, T_ATRASO_2_FUND <dbl>, # T_ATRASO_2_MED <dbl>, T_FBBAS <dbl>, T_FBFUND <dbl>, T_FBMED <dbl>, … ``` ] --- count: false ### Selecionando os casos que representam valores extremos .panel1-passo13-auto[ ```r # Lista dos valores extremos para IDHM c_dic_tbl %>% filter(ANO == 2010) %>% mutate(iqr_idhm = IQR(IDHM), q1_idhm = quantile(IDHM, 0.25), q3_idhm = quantile(IDHM, 0.75), limite_inferior_idhm = q1_idhm - (1.1 * iqr_idhm), limite_superior_idhm = q3_idhm + (1.1 * iqr_idhm) ) %>% * filter(IDHM < limite_inferior_idhm | * IDHM > limite_superior_idhm) ``` ] .panel2-passo13-auto[ ``` # A tibble: 8 × 242 ANO UF Codmun6 Codmun7 Municí…¹ ESPVIDA FECTOT MORT1 MORT5 RAZDEP SOBRE40 <dbl> <dbl> <dbl> <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 2010 13 130020 1300201 ATALAIA… 69.0 3.62 28.6 30.6 72.9 93.4 2 2010 14 140070 1400704 UIRAMUTÃ 71.0 3.45 22.4 23.9 118. 94.8 3 2010 15 150250 1502509 CHAVES 71.2 2.53 23.5 25.3 78.6 94.5 4 2010 15 150450 1504505 MELGAÇO 71.6 3.87 22.4 24.1 88.0 94.8 5 2010 21 210408 2104081 FERNAND… 68.7 3.32 33.8 36.8 75.9 92.2 6 2010 21 210635 2106359 MARAJÁ … 71.4 4.1 25 27.2 72.6 94.2 7 2010 35 350060 3500600 ÁGUAS D… 78.4 1.32 9.3 10.8 52.8 95.9 8 2010 35 354880 3548807 SÃO CAE… 78.2 1.3 9.5 11.0 41.1 95.8 # … with 231 more variables: SOBRE60 <dbl>, T_ENV <dbl>, E_ANOSESTUDO <dbl>, # T_ANALF11A14 <dbl>, T_ANALF15A17 <dbl>, T_ANALF15M <dbl>, # T_ANALF18A24 <dbl>, T_ANALF18M <dbl>, T_ANALF25A29 <dbl>, T_ANALF25M <dbl>, # T_ATRASO_0_BASICO <dbl>, T_ATRASO_0_FUND <dbl>, T_ATRASO_0_MED <dbl>, # T_ATRASO_1_BASICO <dbl>, T_ATRASO_1_FUND <dbl>, T_ATRASO_1_MED <dbl>, # T_ATRASO_2_BASICO <dbl>, T_ATRASO_2_FUND <dbl>, T_ATRASO_2_MED <dbl>, # T_FBBAS <dbl>, T_FBFUND <dbl>, T_FBMED <dbl>, T_FBPRE <dbl>, … ``` ] --- count: false ### Selecionando os casos que representam valores extremos .panel1-passo13-auto[ ```r # Lista dos valores extremos para IDHM c_dic_tbl %>% filter(ANO == 2010) %>% mutate(iqr_idhm = IQR(IDHM), q1_idhm = quantile(IDHM, 0.25), q3_idhm = quantile(IDHM, 0.75), limite_inferior_idhm = q1_idhm - (1.1 * iqr_idhm), limite_superior_idhm = q3_idhm + (1.1 * iqr_idhm) ) %>% filter(IDHM < limite_inferior_idhm | IDHM > limite_superior_idhm) %>% * select(Município, UF, IDHM) ``` ] .panel2-passo13-auto[ ``` # A tibble: 8 × 3 Município UF IDHM <chr> <dbl> <dbl> 1 ATALAIA DO NORTE 13 0.45 2 UIRAMUTÃ 14 0.453 3 CHAVES 15 0.453 4 MELGAÇO 15 0.418 5 FERNANDO FALCÃO 21 0.443 6 MARAJÁ DO SENA 21 0.452 7 ÁGUAS DE SÃO PEDRO 35 0.854 8 SÃO CAETANO DO SUL 35 0.862 ``` ] --- count: false ### Selecionando os casos que representam valores extremos .panel1-passo13-auto[ ```r # Lista dos valores extremos para IDHM c_dic_tbl %>% filter(ANO == 2010) %>% mutate(iqr_idhm = IQR(IDHM), q1_idhm = quantile(IDHM, 0.25), q3_idhm = quantile(IDHM, 0.75), limite_inferior_idhm = q1_idhm - (1.1 * iqr_idhm), limite_superior_idhm = q3_idhm + (1.1 * iqr_idhm) ) %>% filter(IDHM < limite_inferior_idhm | IDHM > limite_superior_idhm) %>% select(Município, UF, IDHM) ``` ] .panel2-passo13-auto[ ``` # A tibble: 8 × 3 Município UF IDHM <chr> <dbl> <dbl> 1 ATALAIA DO NORTE 13 0.45 2 UIRAMUTÃ 14 0.453 3 CHAVES 15 0.453 4 MELGAÇO 15 0.418 5 FERNANDO FALCÃO 21 0.443 6 MARAJÁ DO SENA 21 0.452 7 ÁGUAS DE SÃO PEDRO 35 0.854 8 SÃO CAETANO DO SUL 35 0.862 ``` ] <style> .panel1-passo13-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel2-passo13-auto { color: black; width: 49%; hight: 32%; float: left; padding-left: 1%; font-size: 80% } .panel3-passo13-auto { color: black; width: NA%; hight: 33%; float: left; padding-left: 1%; font-size: 80% } </style>