Edição das 15h10min de 17 de junho de 2024

1 Preparação do Ambiente de Análise de Dados

DESTAQUE: Ao final deste módulo, você deverá ser capaz de classificar alguns algoritmos de regressão, classificação e clusterização relacionados à machine learning. Além disso, você também desenvolverá aptidão para classificar as técnicas e etapas de construção do modelo preditivo de machine learning e seus principais conceitos.

Machine learning ou aprendizagem de máquina é uma representação que tem como objetivo criar um modelo a partir de dados históricos para generalizar decisões.

PERGUNTA: Mas o que vem a ser um modelo nesse contexto?

RESPOSTA: Modelo é uma representação dos relacionamentos existentes nos dados por meio de uma fórmula matemática.

Antes de estudarmos os algoritmos, vamos aprender alguns termos utilizados para se referir a partes específicas de um conjunto de dados.

Instâncias ou observações: São as linhas do dataset.

Variável resposta/dependente, classe, label ou target: É a variável/coluna que se quer prever.

Features, atributos, dimensões ou variáveis independentes/explicativas: São colunas do dataset que podem ser utilizadas para prever a variável target.

A imagem a seguir ilustra alguns conceitos fundamentais para darmos continuidade ao nosso estudo.

Fonte: Raschka (2015).

@@ Linha 20: / Linha 20: @@
 <center>
-[[Imagem:fig06_LINGUAGEM_R.png|700px|border]]
+[[Imagem:fig07_LINGUAGEM_R.png|700px|border]]
 '''Fonte''': Raschka (2015).

LINGUAGEM R MOD3: mudanças entre as edições

Edição das 15h10min de 17 de junho de 2024

1 Preparação do Ambiente de Análise de Dados

2 Referências

Menu de navegação

LINGUAGEM R MOD3: mudanças entre as edições

Edição das 15h10min de 17 de junho de 2024

1 Preparação do Ambiente de Análise de Dados

2 Referências

Menu de navegação

Pesquisa