Como calcular a covariância

2 partes:

Usando a fórmula de covariância padrãoUsando valores de variáveis ​​independentes

Covariância é um tipo de valor utilizado em estatística para descrever a relação linear entre duas variáveis. Quanto maior for a covariância entre duas variáveis, os valores de seguir mais de perto as mesmas tendências dentro de uma gama de pontos de dados (por outras palavras, as duas curvas de variáveis ​​desviar menos um do outro). De um modo geral, é possível encontrar a covariância para dois conjuntos de valores de "x" e "y" para a seguinte fórmula: (1 / n -1) (Σ (xEu - Xavg) (YEu - eavg), em que "n" é igual ao tamanho da amostra ", XEu"Equilvale o valor de cada ponto," Xavg"É igual à média dos valores dos pontos de" x "e assim por diante a" e "Eu e "y"avg.

parte 1Usando a fórmula de covariância padrão

1

Organiza os dados em uma gama de pontos (x, y). Enquanto fórmula covariância dada acima é muito intimidante à primeira vista, não é realmente tão difícil de resolver. Tudo que você precisa é um conjunto de pontos de dados para duas variáveis ​​"x" e "y", a fim de resolver a fórmula para a covariância. Se você trabalha com dados em um gráfico, estes vêm de as coordenadas dos pontos (x, y) neste gráfico, caso contrário vêm de encontrar valores correspondentes para as variáveis ​​matemáticas.

  • Grave o número de pares correspondentes x / y. Este número é "N", o tamanho da amostra, o que é necessário para resolver a fórmula covariância.
  • Por exemplo, suponha que você gerenciar uma deli e queremos determinar se a quantidade de cupons ou concessão não tem um efeito sobre as vendas. Poderíamos definir "x" como o número de cupons dadas em um determinado dia e "e" o número de vendas nesse dia, então vamos organizar esta informação em uma tabela de fácil interpretação. Para o propósito de nosso exemplo, suponha que a tabela contém a imagem acima pares x / e vamos usar.
  • Por conveniência, vamos usar a tabela na imagem anterior como referência. Em outras palavras, o primeiro dia deu x = 1 cupão = 8 vendas- e tinha o segundo dia, deram x = 3 cupões e vendas tinha y = 6, e assim por diante.

2

Encontre a média aponta "x". Depois de ter uma gama de pontos de x / y, resolver a covariância equação realmente não exigem muito trabalho. Para começar, encontrar a média dos valores de "x". Para fazer isso, adicionar os valores de "x" e dividir pelo número de valores lá.

  • No nosso exemplo, podemos encontrar a média dos valores de "x" para adicionar os números na coluna "X" da tabela apresentada acima, e, em seguida, dividindo-se pelo número de valores em que a coluna. Se somarmos 1 + 3 + 2 + 5 ..., temos um total de 44. Ao dividir esse valor por 9 (o número de valores de "x"), obtemos 44/9 = 4,89 como a média de x. Veja abaixo:

3 + 1 + 2 + 5 + 8 + 7 + 12 + 4 + 2 = 44
44/9 = 4,89

3

Halla pontos médios "e". Em seguida, encontrar a média de todos os pontos "e". Você pode fazer exatamente da mesma maneira como você fez com os pontos "X" significa a soma de todos os valores e, em seguida, dividida pelo número de valores lá.

  • Em nosso exemplo, acrescentaria 8 + 6 + 9 + 4 ... para um total de 49. Ao dividir este número pelo número de valores (que é o mesmo que para o "X"), obtemos 49/9 = 5,44 como a média de "e". Veja abaixo:

6 + 8 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49
49/9 = 5,44



4

Coloque as variáveis ​​na fórmula (1 / n -1) (Σ (xEu - Xavg) (YEu - eavg.) Nota o símbolo Sigma (Σ) na fórmula. Este símbolo significa que você precisa subtrair a média de "x" cada valor individual "X" e, em seguida, adicioná-los todos (fazer o mesmo com a média de "e" e cada valor individual de "y"). Isso pode resultar em longas cadeias de problemas de subtração, por isso regista os valores cuidado para não cometer erros.

  • No caso do nosso exemplo, iremos resolver como segue:

1 / (n-1) Σ (xEu - Xavg) (YEu - eavg)

(1/8) (((1-4,89) + (3-4,89) + (2-4,89) + (5-4,89) + (8-4,89) + (7 - 4,89) + (12-4,89) + (2-4,89) + (4-4,89)) ((8-5,44) + (6-5,44) + (5/9 , 44) + (4-5,44) + (3-5,44) + (3-5,44) + (2-5,44) + (7-5,44) + (7-5,44 ))

(1/8) ((- 0,01) ((8 - 05:44) + (6 - 05:44) + (9 - 05:44) + (4 - 05:44) + (3-5, 44) + (3-5,44) + (2-5,44) + (7-5,44) + (7-5,44))

(1/8) (- 0,01) (0,04) = 0.00005

  • Como sabemos depois, nosso resultado 0.00005 É muito próximo de zero, o que significa que a quantidade de cupons que tem basicamente entregar nenhum efeito no número de vendas que fazemos no deli.
  • parte 2Usando valores de variáveis ​​independentes

    1

    Note-se que covariância de 1 indica uma correlação positiva perfeita. No que diz respeito ao covariâncias, respostas será sempre entre 1 e -1. Qualquer resposta que está fora desta gama sugere que houve algum tipo de erro no cálculo. Com base em quão perto a covariância é 1 ou -1, pode chegar a algumas conclusões sobre as variáveis. Por exemplo, se a covariância é exactamente 1 significa que as variáveis ​​são perfeita correlação positiva. Em outras palavras, quando uma variável é incrementado, o segundo poço, e quando se diminui, também a outra. Esta relação é perfeitamente linear para as variáveis ​​com uma relação positiva perfeita. Não importa quão alto ou baixo que eles atinjam as variáveis ​​têm a mesma relação.

    • Como um exemplo deste tipo de covariância, considerar o modelo de negócio simples de uma limonada. Se "x" representa o número de limonadas que você vende e "y" representa o dinheiro que você ganha, então "e" sempre aumentar a par com "x". Veja abaixo:

    Dez limonadas vendidos: x = 10, y = $ 30
    Cem limonadas vendidos: x = 100, y = $ 300
    Um milhão de limonadas vendidos: x = 1.000.000 e US $ 3.000.000 =
    Para mais elevada do que é o nosso valor "X" ver sempre a mesma relação, "e" é igual a 3 (x). Portanto, podemos dizer que "x" e "y" tem um perfeita correlação positiva, em outras palavras, uma correlação de um.

    2

    Note-se que covariância de -1 indica uma correlação negativa perfeita. Por outro lado, se a covariância é -1, isso significa que as variáveis ​​são perfeitamente correlacionados negativamente. Em outras palavras, um aumento irá causar uma diminuição do outro e vice-versa. Como mencionado acima, esta relação é linear. A gama em que as duas variáveis ​​são separados um do outro, não diminui com o tempo.

    • Como exemplo deste tipo de correlação, considere um cenário básico de oferta e demanda. Em termos extremamente simplificados, se "x" é igual à quantidade de produtos fabricados por uma empresa e "y" é igual ao preço cobrado para esses produtos como "X" aumenta "e" diminui. Em outras palavras, o produto torna-se mais comum, o seu preço mais baixo. Veja abaixo:

    Um barril extraído: x = 1, y = 9.999.
    Dois mil barris extraídos: x = 2.000, y = 8.000.
    Dez mil barris extraídos: x = 10000, y = 0.
    Como o nosso valor "x" cresce, o nosso valor "e" diminuir a um ritmo constante. A relação é linear: cada barril extraído adicional sempre igual a um barril menos na terra. Portanto, podemos dizer que "x" e "y" tem um relação negativa perfeita, em outras palavras, uma correlação de -1.

    3

    Note-se que covariância de 0 indica que não há correlação. Se a covariância é igual a 0, isso significa que não há nenhuma correlação entre as variáveis. Em outras palavras, um aumento ou diminuição não necessariamente um aumento ou diminuição na outra com um pouco de previsibilidade. Neste caso, a relação entre as duas variáveis ​​é completamente aleatória.

    • Como um exemplo deste tipo de correlação, considere o caso de alguém tendo um remédio homeopático para uma doença virai. Se "X" representa a dose consumida e remédio "e" representa a carga viral no sangue da pessoa, não necessariamente de esperar que "e" aumento ou diminuição medida que aumenta a "x". Em vez disso, qualquer flutuação "e" seria completamente independente de "x". Veja abaixo:

    Uma colher de chá tomadas: x = 1, y = 615.
    Dez colheres de chá tomadas: x = 10 y = 700.
    Vinte colheres de chá tomadas: x = 20, y = 455.
    Como o nosso valor "x" cresce, não podemos realmente prever se "e" vai aumentar ou diminuir como resultado. A relação não é clara: às vezes, tomar mais medicamentos provoca uma diminuição da carga viral, mas às vezes produz um aumento. Portanto, "x" e "y" teria uma perto de correlação de zero.

    4

    Note-se que qualquer valor entre -1 e 1 indica uma correlação imperfeita. A maioria dos valores de variáveis ​​independentes não são exatamente 1, -1 ou 0. geralmente estão em uma faixa intermediária. Com base em quão perto um valor covariável é em um desses pontos de referência, você pode determinar se você tem uma correlação positiva ou negativa.

    • Por exemplo, uma covariância de 0,8 indica um elevado grau de correlação positiva entre duas variáveis, embora não perfeita. Em outras palavras, se aumenta "x", "e" geralmente ele irá também, enquanto se "X" diminui, "e" Geralmente vai também, embora isso não pôde ser cumprido o tempo todo.

    dicas

    • Leia nossos artigos scatterplots e coeficientes de correlação Para mais informações relacionadas.
    • equações de covariância são muitas vezes utilizados para comparar os estoques: os investidores gostaria de saber se duas acções são susceptíveis de variar com o outro ou não. Para descobrir isso, tudo que você precisa é uma tabela comparando duas rotinas ações diárias por um período de datas. Veja abaixo:

    Empresa A (x): (1,6 + 1,9 + 2,1 + 3,2 + 0,5 + 0,4 + 0,6) / 7 = 1,47
    Empresa B (y): (2,0 + 2,4 + 2,6 + 3,6 + 0,9 + 0,8 + 1,0) / 7 = 1,9

    (1 / n -1) (Σ (xEu - Xavg) (YEu - eavg)

    (1/6) (((1,6-1,47) + (1,9-1,47) + (2,1-1,47) + (3,2-1,47) + (0, 5-1,47) + (0,4-1,47) + (0,6-1,47)) ((2,0-1,78) + (2,4-1,78) + (2 , 6-1,78) + (3,6-1,78) + (0,9-1,78) + (0,8-1,78) + (1,0-1,78))

    (1/6) ((0,01) (0,84))

    (1/6) (0,084) = 0,14.

    RELACIONADOS

    Artigos Relacionados