15:31
выборочный коэффициент корреляции


Как найти выборочный коэффициент корреляции?

 

Выборочный коэффициент корреляции находится по формуле

 

 

$$r(X,Y)=\frac{k(X,Y)}{\sigma _x^*\cdot \sigma _x^*}=\frac{\sum n_{xy}xy-x^*y^*}{n\sigma _x^*\cdot \sigma _y^*},$$

 

где   $\sigma _x^*,\sigma _x^*$  - выборочные средние квадратические отклонения величин $X$  и $Y$ .

Выборочная ковариация $k(X,Y)$  величин $X$ и $Y$  определяется формулой

 

$$k(X,Y)=\frac{1}{n}\sum (x_i-x^*)(y_i-y^*)n_{xy},$$
 

где$n=\sum n_{xy}$ , а $ x^*$,$y^*$ - выборочные средние величин $X$  и $Y$

Выборочный коэффициент корреляции $r(X,Y)$ показывает тесноту линейной связи между $X$  и $Y$ : чем ближе $r(X,Y)$ к единице, тем сильнее линейная связь между $X$  и $Y$
 

Пример 1. Среднемесячная заработная плата (тыс. руб.) в Ярославской области в 2001-2002 годах составила по отраслям:

 

отрасль ЖКХ здравоохранение наука образование транспорт промышленность
2001 год 2 1,5 2,7 1,3 3,2 3,2
2002 год 3 2,8 3,6 2,4 4,9 4,5

Найдите выборочный коэффициент корреляции для заработной платы в указанные годы.

Решение. 1). Найдем выборочные средние

$x^*=\frac{1}{6}(2+1,5+2,7+1,3+3,2+3,2)\approx 2,3;\; \; \; y^*\approx 3,5.$

2). Вычислим выборочную ковариацию

$k(X,Y)=\frac{1}{6}[ (2-3,5)\cdot (3-3,5)+(1,5-2,3)\cdot (2,8-3,5)+(2,7-2,3)\cdot (3,6-3,5)+$
$(1,3-2,3)\cdot (2,4-3,5)+(3,2-2,3)\cdot (4,9-3,5)+(3,2-2,3)\cdot (4,5-3,5)  ]=0,668$

3). Найдем выборочные средние квадратические отклонения:

$D_{x}^{*}= \frac{1}{6}\left [ (-0,3)^2+(0,8)^2+0,4^2+1^2+0,9^2\cdot2 \right]=0,585\sigma_x^*=\sqrt{D_x^*}=0,765;$

$D_{y}^{*}=0,82;\; \; \sigma _y^*=0,91$

4). Вычислим теперь выборочный коэффициент корреляции

$$r(X,Y)=\frac{k(X,Y)}{\sigma _x^*\cdot \sigma _x^*}=\frac{0,668}{0,765\cdot 0,91}\approx 0,96$$

Поскольку $r(X,Y)$ достаточно близко к $1$, то между заработной платой по отраслям в 2001 и 2002 годах существовала почти линейная зависимость (зарплата в 2002 году по каждой отрасли увеличилась примерно в 1,5 раза).

 

 

Понятие корреляции является одним из основных понятий теории вероятностей и математической статистики, оно было введено Гальтоном и Пирсоном.

 

Закон природы или общественного развития может быть представлен описанием совокупности взаимосвязей. Если эти зависимости стохастичны, а анализ осуществляется по выборке из генеральной совокупности, то данная область исследования относится к задачам стохастического исследования зависимостей, которые включают в себя корреляционный, регрессионный, дисперсионный и ковариационный анализы. В данном разделе рассмотрена теснота статистической связи между анализируемыми переменными, т.е. задачи корреляционного анализа.

В качестве измерителей степени тесноты парных связей между количественными переменными используются коэффициент корреляции (или то же самое "коэффициент корреляции Пирсона") и корреляционное отношение.

 

Категория: Математическая статистика | Просмотров: 9901 | Добавил: Admin | Теги: выборочная ковариация, выборочный коэффициент корреляции | Рейтинг: 0.0/0
Всего комментариев: 0
avatar
close