Ferramentas SAS on-line e treinamento em Excel: técnicas de modelagem preditiva

893 Views

Neste slide, veremos um gráfico que ilustra o conceito de regressão linear. Neste gráfico, a variável dependente Y é plotada no eixo Y e a variável independente é plotada no eixo X. Os pontos em laranja são os valores observados da variável dependente. A linha de regressão linear ajustada é desenhada em azul. Vamos agora olhar para o gráfico em detalhe.
Para os dados do gráfico de dispersão, uma linha de regressão foi ajustada. A linha de regressão é a linha com o menor conjunto possível de distâncias entre ela e cada ponto de dados. Como você pode ver, a linha de regressão toca em alguns pontos de dados, mas não em outros.
A inclinação da linha, como dada pelo coeficiente beta, é mostrada aqui como uma linha pontilhada azul.
O intercepto alfa é a distância entre a origem e a linha de regressão, como mostrado na figura.
A linha é ajustada usando a equação mencionada no slide anterior, ou seja, y é igual a alfa mais tempo beta x mais épsilon.
Para uma entrada xi, o valor previsto é mostrado aqui, a partir da linha. O valor observado para xi pode ser visto a partir do ponto laranja. A diferença entre o valor observado e o previsto é denotada por épsilon ou erro aleatório.
No próximo slide, veremos o coeficiente de determinação da regressão linear.

O coeficiente de determinação, denotado por R ao quadrado, é uma medida da qualidade do ajuste, ou seja, quão bem um modelo estatístico, como uma linha ou curva, se ajusta aos dados. R ao quadrado é calculado de diferentes maneiras para diferentes modelos. Para uma regressão linear simples, R quadrado é calculado como o quadrado do coeficiente de correlação entre os valores observados e previstos.
Vamos agora ver como diferentes valores de R ao quadrado são interpretados. Na primeira figura, a linha é perfeitamente horizontal e o R ao quadrado é zero, o que não implica em nenhum relacionamento linear.
Na segunda figura, o valor de R ao quadrado é -1, implicando um valor linear negativo relação.
A última figura denota um valor de R ao quadrado de +1, denotando um relacionamento linear positivo.
No próximo slide, veremos maneiras de determinar a qualidade de um modelo.