15:31
выборочный коэффициент корреляции
|
|||||||||||||||||||||
Выборочный коэффициент корреляции находится по формуле
$$r(X,Y)=\frac{k(X,Y)}{\sigma _x^*\cdot \sigma _x^*}=\frac{\sum n_{xy}xy-x^*y^*}{n\sigma _x^*\cdot \sigma _y^*},$$ где $\sigma _x^*,\sigma _x^*$ - выборочные средние квадратические отклонения величин $X$ и $Y$ . Выборочная ковариация $k(X,Y)$ величин $X$ и $Y$ определяется формулой
$$k(X,Y)=\frac{1}{n}\sum (x_i-x^*)(y_i-y^*)n_{xy},$$
где$n=\sum n_{xy}$ , а $ x^*$,$y^*$ - выборочные средние величин $X$ и $Y$ Выборочный коэффициент корреляции $r(X,Y)$ показывает тесноту линейной связи между $X$ и $Y$ : чем ближе $r(X,Y)$ к единице, тем сильнее линейная связь между $X$ и $Y$ Пример 1. Среднемесячная заработная плата (тыс. руб.) в Ярославской области в 2001-2002 годах составила по отраслям:
Найдите выборочный коэффициент корреляции для заработной платы в указанные годы. Решение. 1). Найдем выборочные средние $x^*=\frac{1}{6}(2+1,5+2,7+1,3+3,2+3,2)\approx 2,3;\; \; \; y^*\approx 3,5.$ 2). Вычислим выборочную ковариацию $k(X,Y)=\frac{1}{6}[ (2-3,5)\cdot (3-3,5)+(1,5-2,3)\cdot (2,8-3,5)+(2,7-2,3)\cdot (3,6-3,5)+$ 3). Найдем выборочные средние квадратические отклонения: $D_{x}^{*}= \frac{1}{6}\left [ (-0,3)^2+(0,8)^2+0,4^2+1^2+0,9^2\cdot2 \right]=0,585\sigma_x^*=\sqrt{D_x^*}=0,765;$ $D_{y}^{*}=0,82;\; \; \sigma _y^*=0,91$ 4). Вычислим теперь выборочный коэффициент корреляции $$r(X,Y)=\frac{k(X,Y)}{\sigma _x^*\cdot \sigma _x^*}=\frac{0,668}{0,765\cdot 0,91}\approx 0,96$$ Поскольку $r(X,Y)$ достаточно близко к $1$, то между заработной платой по отраслям в 2001 и 2002 годах существовала почти линейная зависимость (зарплата в 2002 году по каждой отрасли увеличилась примерно в 1,5 раза).
Понятие корреляции является одним из основных понятий теории вероятностей и математической статистики, оно было введено Гальтоном и Пирсоном.
Закон природы или общественного развития может быть представлен описанием совокупности взаимосвязей. Если эти зависимости стохастичны, а анализ осуществляется по выборке из генеральной совокупности, то данная область исследования относится к задачам стохастического исследования зависимостей, которые включают в себя корреляционный, регрессионный, дисперсионный и ковариационный анализы. В данном разделе рассмотрена теснота статистической связи между анализируемыми переменными, т.е. задачи корреляционного анализа. В качестве измерителей степени тесноты парных связей между количественными переменными используются коэффициент корреляции (или то же самое "коэффициент корреляции Пирсона") и корреляционное отношение.
|
|||||||||||||||||||||
|
Всего комментариев: 0 | |