Mudanças entre as edições de "LINGUAGEM R MOD3"
Ir para navegação
Ir para pesquisar
Linha 11: | Linha 11: | ||
Antes de estudarmos os algoritmos, vamos aprender alguns termos utilizados para se referir a partes específicas de um conjunto de dados. | Antes de estudarmos os algoritmos, vamos aprender alguns termos utilizados para se referir a partes específicas de um conjunto de dados. | ||
− | ;Instâncias ou observações: São as linhas do dataset. | + | ;Instâncias ou observações: São as linhas do ''dataset''. |
;Variável resposta/dependente, classe, label ou target: É a variável/coluna que se quer prever. | ;Variável resposta/dependente, classe, label ou target: É a variável/coluna que se quer prever. | ||
− | ;Features, atributos, dimensões ou variáveis independentes/explicativas: São colunas do dataset que podem ser utilizadas para prever a variável target. | + | ;Features, atributos, dimensões ou variáveis independentes/explicativas: São colunas do ''dataset'' que podem ser utilizadas para prever a variável ''target''. |
A imagem a seguir ilustra alguns conceitos fundamentais para darmos continuidade ao nosso estudo. | A imagem a seguir ilustra alguns conceitos fundamentais para darmos continuidade ao nosso estudo. |
Edição das 14h52min de 17 de junho de 2024
Preparação do Ambiente de Análise de Dados
- DESTAQUE
- Ao final deste módulo, você deverá ser capaz de classificar alguns algoritmos de regressão, classificação e clusterização relacionados à machine learning. Além disso, você também desenvolverá aptidão para classificar as técnicas e etapas de construção do modelo preditivo de machine learning e seus principais conceitos.
- Machine learning ou aprendizagem de máquina é uma representação que tem como objetivo criar um modelo a partir de dados históricos para generalizar decisões.
- PERGUNTA
- Mas o que vem a ser um modelo nesse contexto?
- RESPOSTA
- Modelo é uma representação dos relacionamentos existentes nos dados por meio de uma fórmula matemática.
Antes de estudarmos os algoritmos, vamos aprender alguns termos utilizados para se referir a partes específicas de um conjunto de dados.
- Instâncias ou observações
- São as linhas do dataset.
- Variável resposta/dependente, classe, label ou target
- É a variável/coluna que se quer prever.
- Features, atributos, dimensões ou variáveis independentes/explicativas
- São colunas do dataset que podem ser utilizadas para prever a variável target.
A imagem a seguir ilustra alguns conceitos fundamentais para darmos continuidade ao nosso estudo.
==