LINGUAGEM R MOD3

De MediaWiki do Campus São José
Ir para navegação Ir para pesquisar

1 Preparação do Ambiente de Análise de Dados

DESTAQUE
Ao final deste módulo, você deverá ser capaz de classificar alguns algoritmos de regressão, classificação e clusterização relacionados à machine learning. Além disso, você também desenvolverá aptidão para classificar as técnicas e etapas de construção do modelo preditivo de machine learning e seus principais conceitos.
Machine learning ou aprendizagem de máquina é uma representação que tem como objetivo criar um modelo a partir de dados históricos para generalizar decisões.
Pergunta
Mas o que vem a ser um modelo nesse contexto?
Resposta
Modelo é uma representação dos relacionamentos existentes nos dados por meio de uma fórmula matemática.

Antes de estudarmos os algoritmos, vamos aprender alguns termos utilizados para se referir a partes específicas de um conjunto de dados.

Instâncias ou observações
São as linhas do dataset.
Variável resposta/dependente, classe, label ou target
É a variável/coluna que se quer prever.
Features, atributos, dimensões ou variáveis independentes/explicativas
São colunas do dataset que podem ser utilizadas para prever a variável target.


==

2 Referências