Métodos estatísticos são uma parte crucial da ciência de dados; ainda assim, poucos cientistas de dados têm formação estatística.Os cursos e livros sobre estatística básica raramente abordam os tópicos sob a perspectiva da ciência de dados.Este guia prático explica como aplicar diversos métodos estatísticos em ciência de dados, ensina a evitar seu mau uso e aconselha sobre o que é importante e o que não é.Muitos recursos da ciência de dados incorporam métodos estatísticos, mas carecem de uma perspectiva estatística aprofundada.Se você está familiarizado com a linguagem de programação R e tem algum conhecimento estatístico, este guia fará a ponte de forma fácil e acessível. Com este livro, você aprenderá: - Por que a análise exploratória de dados é um passo prévio importante na ciência de dados- Como a amostragem aleatória pode reduzir o viés e resultar um conjunto de dados de maior qualidade, mesmo em big data- Como os princípios do design experimental resultam respostas definitivas- Como usar regressão para estimar resultados e detectar anomalias- Principais técnicas de classificação para prever a quais categorias um registro pertence- Métodos de aprendizado de máquina estatístico que "aprendem" com os dados- Métodos de aprendizado não supervisionado para extração de significado de dados não rotulados.