Este curso pretende apresentar uma introdução a uma das ferramentas de análise de dados mais versáteis e completas em uso atualmente: a linguagem e ambiente de programação R. Iremos, ao longo de cinco encontros, aprender como utilizar suas funcionalidades básicas de forma rápida e reprodutível com a intenção de utilizá-las e aplicá-las na pesquisa científica. Para tanto, após a compreensão das ferramentas básicas da linguagem, iniciaremos uma introdução a análise de dados, construção de gráficos e a exportação deste material.
Cabe ressaltar que a intenção deste curso não é de esgotar as possibilidades do ambiente R, mas sim introduzir a linguagem e capacitar os/as alunos/as a adaptar o conhecimento adquirido aos seus problemas e finalidades de pesquisa. Ao final do curso, espera-se que os/as participantes estejam familiarizados com a sintaxe do R e estejam capacitados para entender qualquer código escrito em R e saber como procurar novas funcionalidades da linguagem na documentação disponibilizada em websites, blogs, livros e etc.
Local de realização do curso: Laboratório do ILEA
Dias: 30/10 06/11 13/11 20/11 04/12 (quarta-feira)
Horário: 14h-18h
Carga Horária Total: 20h
Repositório: Gitlab
Não é necessário nenhum conhecimento prévio de programação para a realização desse curso. Conhecimentos básicos de estatística descritiva são desejáveis.
É necessária a instalação prévia do R e RStudio. As instruções de instalação serão enviadas por email antes do início da primeira aula. Caso haja algum problema na instalação, chegar mais cedo no primeiro dia para resolução do problema.
O curso será realizado em laboratório de informática. Recomenda-se a utilização de computador próprio para que os/as participantes comecem a se adaptar ao R para uso posterior mas, caso seja necessário, é possível a utilização dos computadores do laboratório, que já possuem o R e o RStudio devidamente instalados. As aulas serão práticas. O desenvolvimento das atividades será projetado em equipamento de projeção de formaque os/as participantes possam acompanhar a execução e as reproduzir em seus próprios equipamentos. Em algumas situações poderão ser utilizados slides. Há também a possibilidade de recomendação de leitura de material prévio para as aulas. Além do envio de lista de exercícios para fixação dos conceitos trabalhados em aula. O estudo deste material não é obrigatório, mas é altamente recomendado para melhor desenvolvimento do curso.
Todo o material do curso (scripts, slides, programa etc) será disponibilizado em repositório do GitLab. Para melhor funcionamento das aulas, os scripts e exercícios da aula correspondente serão disponibilizados após a finalização da mesma.
Caso seja necessário, auxílio e elucidação de dúvidas entre uma aula e outra podem ser feitos por e-mail.
Além do material do curso, que será disponibilizado, são recomendados os seguintes materiais:
R for Data Science de Garrett Grolemund & Hadley Wickham
Hands-On Programming with R de Garrett Grolemund
ggplot2: Elegant Graphics for Data Analysis de Hadley Wickham
Stack Overflow
RStudio Cheatsheets
RStudio Primers
R Bloggers
Bookdown
A realização dos exercícios e trabalho final para esse curso não são obrigatórios, mas é fundamental para melhor fixação das atividades, sobretudo pelo fato das dúvidas que tendem a surgir justamente durante a realização dos exercícios. Os exercícios serão disponibilizados no repositório após a finalização de cada aula em arquivo formato .R. Caso tenham dúvidas, o/a participante deve encaminhar a lista dos exercícios no mesmo arquivo (script) por email e escrever no próprio script em forma de comentário no exercício correspondente. Alguns exercícios podem ser discutidos na aula subsequente, caso haja demanda.
O trabalho final utilzará os conceitos e pacotes trabalhados em aula, visando a análise dos dados e a confecção de relatórios para apresentação dos mesmos. Mais uma vez, é altamente recomendado a realização desta, que pode ser enviada por email até o final do ano corrente.
1. Ninguém fica para trás
Para que isso seja possível, é muito importante que perguntas sejam feitas durante a aula. Também conto com a colaboração dos/as participantes que tenham mais facilidade ou que já tenham compreendido o tópico em questão para que ajudem os/as colegas que estejam com dificuldade em algum tópico.
2. Atenção e concentração
O curso segue uma sequência de conceitos e ferramentas que dependem do tópico anterior. Por isso, é necessário muita atenção ao longo de todas as aulas, principalmente durante a explicação.
3. Pontualidade
Para melhor funcionamento das atividades as aulas irão começar rigorosamente às 14h. Assim, recomenda-se fortemente a chegada no local de 5 a 10 minutos antes do início das atividades para que liguem os computadores e inicializem os programas necessários.
4. Ética
A reprodução integral de qualquer script e código de terceiros sem a devida referência é considerado plágio, em qualquer local de reprodução. Ainda que não estejam sendo avaliados para nota e afins é importante salientar essa questão ética.
Aula 1 Introdução
Data: 30/10
1. Apresentação
2. Conhecendo o ambiente
3. Pacotes e ajuda
4. Primeiros passos
5. Objetos e classes de objetos
6. Vetores
Aula 2 Objetos avançados
Data: 06/11
1. Factors
2. Matrizes
3. Dataframes
4. Listas
Aula 3 Manipulando dados
Data: 13/11
1. Importando bancos de dados
2. Tratamento inicial dos dados
3. Estatísticas descritivas
5. Tidyverse e o pacote dplyr
6. Exportando bancos de dados
Aula 4 Visualização dos dados
Data: 20/11
1. Gráficos básicos no R
2. O pacote ggplot2
3. Exportando gráficos
Aula 5 Apresentação dos dados e relatórios dinâmicos
Data: 04/12
1. O Markdown e o pacote RMarkdown
2. Confecção de relatórios