Importante: eu estou desenovolvendo aos poucos este guia de estudos conforme evoluo meu aprendizado. Quando escrever os artigos de cada sessão abaixo, disponiobilizarei o link.
O git é uma ferramenta fundamental para controle de versão de códigos, especialmente quando há mais de uma pessoa trabalhando simultaneamente no desenvolvimento de um projeto.
Este artigo é um índice para os principais tópicos sobre GIT aqui no DATANimia, organizados em formato de roteiro de estudos ou apostila, para os mais antigos.
A. Relevância do GIT na área de Dados
O Git é uma ferramenta fundamental para cientistas e analistas de dados, permitindo que eles trabalhem de forma mais eficiente, colaborativa e organizada, garantindo a reprodutibilidade das análises e a qualidade do código.
Cientistas e analistas de dados usam o Git para:
- Gerenciar código-fonte: Scripts de análise, código de pré-processamento de dados, modelos de machine learning.
- Controlar versões de notebooks: Plataformas como o GitHub e o GitLab permitem renderizar notebooks Jupyter, facilitando o compartilhamento e a revisão do trabalho.
- Documentar projetos: O Git facilita a documentação do projeto, incluindo o README com informações sobre o projeto, os dados e as análises realizadas.
- Compartilhar código e colaborar: Plataformas como GitHub, GitLab e Bitbucket facilitam o compartilhamento de código, a colaboração em projetos e a revisão por pares.
B. Conteúdo do roteiro de estudos
1. Introdução ao GIT
1.1. O que é Git?
1.2. GIT: Vantagens do versionamento em projetos de dados
2. Conceitos Básicos do GIT
2.1. Repositórios Locais e Remotos
2.2. Commits e histórico
2.3. Branches e merges
3. Comandos Fundamentais do GIT
3.1. git init, git clone
3.2. git add, git commit
3.3. git push, git pull
4. Colaboração com GIT
4.1. Pull requests
4.2. Branching strategies
4.3. Resolução de conflitos
5. Recursos Avançados do GIT
5.1. Git hooks
5.2. Stashing
5.3. Rebase e cherry-pick
C. Referências
- [Pro Git Book](https://git-scm.com/book/en/v2)
- [Git Documentation](https://git-scm.com/doc)
- [Atlassian Git Tutorials](https://www.atlassian.com/git/tutorials)
- [GitHub Guides](https://guides.github.com/)
- [Livro: “Version Control with Git” – Jonathon Reinhart]
D. Dica: Sistema de Repetição Espaçada
- 24 horas após aprender: Rever os principais comandos e conceitos.
- 7 dias após: Repetir exercícios práticos e ler artigos complementares.
- 30 dias após: Revisar conceitos e fazer uma apresentação para resumir o aprendizado.