Dissertação apresentada ao Programa de Educação Tutorial(PET) da Faculdade de Sistemas de Informação da Universidade Federal de Uberlândia como parte dos requisitos para a participação do programa PET.
Área de concentração: Sistemas de Informação
Orientador: Flávio de Oliveira Silva
Coorientador: Wendel Alexandre Xavier de Melo
O presente trabalho tem como objetivo introduzir o leitor ao tema Ciência de Dados, do que se trata, qual o cenário atual e as expectativas para o futuro. Também são apresentados exemplos práticos em R a fim de consolidar o conhecimento obtido.
Com esse intuito foram usadas diversas fontes durante a pesquisa, dentre elas as principais foram, Introdução à Ciência de Dados por Fernando Amaral e os materiais disponibilizados pela empresa IBM no site Coursera.A exemplo da primeira este texto começa fornecendo alguns conceitos da área ao leitor para em seguida mergulhar no ciclo de vida do objeto de estudo da Ciência de Dados, o próprio dado.
Uma vez compreendidos os procedimentos para produção, armazenamento, transformação, análise e descarte parte-se para a parte prática com alguns exemplos de algoritmos e códigos em R. São usadas plataformas como JupyterLab e ferramentas como Weka Open Source R.
Conclui-se reforçando ao leitor os benefícios deste texto à comunidade científica e oferecendo recomendações para aqueles que desejarem se aprofundar no tema.