material-introR

Introdução ao R

Plano do curso - 2019

Este curso pretende apresentar uma introdução a uma das ferramentas de análise de dados mais versáteis e completas em uso atualmente: a linguagem e ambiente de programação R. Iremos, ao longo de cinco encontros, aprender como utilizar suas funcionalidades básicas de forma rápida e reprodutível com a intenção de utilizá-las e aplicá-las na pesquisa científica. Para tanto, após a compreensão das ferramentas básicas da linguagem, iniciaremos uma introdução a análise de dados, construção de gráficos e a exportação deste material.

Cabe ressaltar que a intenção deste curso não é de esgotar as possibilidades do ambiente R, mas sim introduzir a linguagem e capacitar os/as alunos/as a adaptar o conhecimento adquirido aos seus problemas e finalidades de pesquisa. Ao final do curso, espera-se que os/as participantes estejam familiarizados com a sintaxe do R e estejam capacitados para entender qualquer código escrito em R e saber como procurar novas funcionalidades da linguagem na documentação disponibilizada em websites, blogs, livros e etc.

Local de realização do curso: Laboratório do ILEA
Dias: 30/10 06/11 13/11 20/11 04/12 (quarta-feira)
Horário: 14h-18h
Carga Horária Total: 20h

Repositório: Gitlab

Pré-requisitos

Não é necessário nenhum conhecimento prévio de programação para a realização desse curso. Conhecimentos básicos de estatística descritiva são desejáveis.

É necessária a instalação prévia do R e RStudio. As instruções de instalação serão enviadas por email antes do início da primeira aula. Caso haja algum problema na instalação, chegar mais cedo no primeiro dia para resolução do problema.

Funcionamento do curso

O curso será realizado em laboratório de informática. Recomenda-se a utilização de computador próprio para que os/as participantes comecem a se adaptar ao R para uso posterior mas, caso seja necessário, é possível a utilização dos computadores do laboratório, que já possuem o R e o RStudio devidamente instalados. As aulas serão práticas. O desenvolvimento das atividades será projetado em equipamento de projeção de formaque os/as participantes possam acompanhar a execução e as reproduzir em seus próprios equipamentos. Em algumas situações poderão ser utilizados slides. Há também a possibilidade de recomendação de leitura de material prévio para as aulas. Além do envio de lista de exercícios para fixação dos conceitos trabalhados em aula. O estudo deste material não é obrigatório, mas é altamente recomendado para melhor desenvolvimento do curso.

Todo o material do curso (scripts, slides, programa etc) será disponibilizado em repositório do GitLab. Para melhor funcionamento das aulas, os scripts e exercícios da aula correspondente serão disponibilizados após a finalização da mesma.

Caso seja necessário, auxílio e elucidação de dúvidas entre uma aula e outra podem ser feitos por e-mail.

Material de apoio

Além do material do curso, que será disponibilizado, são recomendados os seguintes materiais:

Livros

R for Data Science de Garrett Grolemund & Hadley Wickham
Hands-On Programming with R de Garrett Grolemund
ggplot2: Elegant Graphics for Data Analysis de Hadley Wickham

Dúvidas em geral

Stack Overflow
RStudio Cheatsheets
RStudio Primers
R Bloggers
Bookdown

Exercícios e projeto final

A realização dos exercícios e trabalho final para esse curso não são obrigatórios, mas é fundamental para melhor fixação das atividades, sobretudo pelo fato das dúvidas que tendem a surgir justamente durante a realização dos exercícios. Os exercícios serão disponibilizados no repositório após a finalização de cada aula em arquivo formato .R. Caso tenham dúvidas, o/a participante deve encaminhar a lista dos exercícios no mesmo arquivo (script) por email e escrever no próprio script em forma de comentário no exercício correspondente. Alguns exercícios podem ser discutidos na aula subsequente, caso haja demanda.

O trabalho final utilzará os conceitos e pacotes trabalhados em aula, visando a análise dos dados e a confecção de relatórios para apresentação dos mesmos. Mais uma vez, é altamente recomendado a realização desta, que pode ser enviada por email até o final do ano corrente.

Regras básicas

1. Ninguém fica para trás
Para que isso seja possível, é muito importante que perguntas sejam feitas durante a aula. Também conto com a colaboração dos/as participantes que tenham mais facilidade ou que já tenham compreendido o tópico em questão para que ajudem os/as colegas que estejam com dificuldade em algum tópico.

2. Atenção e concentração
O curso segue uma sequência de conceitos e ferramentas que dependem do tópico anterior. Por isso, é necessário muita atenção ao longo de todas as aulas, principalmente durante a explicação.

3. Pontualidade
Para melhor funcionamento das atividades as aulas irão começar rigorosamente às 14h. Assim, recomenda-se fortemente a chegada no local de 5 a 10 minutos antes do início das atividades para que liguem os computadores e inicializem os programas necessários.

4. Ética
A reprodução integral de qualquer script e código de terceiros sem a devida referência é considerado plágio, em qualquer local de reprodução. Ainda que não estejam sendo avaliados para nota e afins é importante salientar essa questão ética.

Plano das aulas

Aula 1 Introdução
Data: 30/10
          1. Apresentação
          2. Conhecendo o ambiente
          3. Pacotes e ajuda
          4. Primeiros passos
          5. Objetos e classes de objetos
          6. Vetores

Aula 2 Objetos avançados
Data: 06/11
          1. Factors
          2. Matrizes
          3. Dataframes
          4. Listas

Aula 3 Manipulando dados
Data: 13/11
          1. Importando bancos de dados
          2. Tratamento inicial dos dados
          3. Estatísticas descritivas
          5. Tidyverse e o pacote dplyr
          6. Exportando bancos de dados

Aula 4 Visualização dos dados
Data: 20/11
          1. Gráficos básicos no R
          2. O pacote ggplot2
          3. Exportando gráficos

Aula 5 Apresentação dos dados e relatórios dinâmicos
Data: 04/12
          1. O Markdown e o pacote RMarkdown
          2. Confecção de relatórios