Нелинейная регрессия. Парная регрессия и корреляция


Многомерный регрессионный анализ позволяет разграничить влияние факторных признаков. Параметр регрессии при каждом факторном признакедает оценку его влияния на величину результативного признака
в случае изменения на единицу при постоянстве всех остальных факторов.

Прогнозирование на основе полученной модели выполняется аналогично прогнозам парной линейной регрессии.

Точечный прогноз получается при подстановке прогнозных значений факторных признаковв уравнение регрессии. Полученное значение является точечным прогнозом результативного признака
.

Интервальный прогноз указывает нижнюю и верхнюю границу промежутка, в котором находится истинное значение прогнозируемого показателя
. Доверительный интервал определяется выражением

т.е. истинное значение прогнозируемого показателя
с вероятностью 1 -принадлежит доверительному интервалу.

Пример 3.9. По данным таблицы 3.17 записать уравнение регрессии и выполнить анализ полученной модели.

Решение. Так как инструмент «Регрессия» может выполнять только линейный регрессионный анализ, то в итоге имеем следующее уравнение многомерной линейной регрессии

Таблица 3.17. Результаты работы инструментаРегрессия

Выполним анализ полученной модели регрессии:


Следовательно, модель регрессии пригодна для принятия некоторых решений, но не для прогнозирования.

Проанализируем наличие парной корреляционной связи между факторными признаками, входящими в модель регрессии, по корреляционной матрице (рис.3.8):



Рис.3.8. Корреляционная матрица

Обозначения к корреляционной матрице: - производительность труда (среднегодовая выработка продукции на одного работника), тыс. грн.;
- трудоемкость единицы продукции;
- удельный вес рабочих в составе промышленно-производственного персонала;
-коэффициент сменности оборудования;- премии и вознаграждения на одного работника, %;
- непроизводственные расходы, %.

Следовательно, на основе исследуемой многомерной выборки можно сделать вывод, что из рассматриваемых факторных признаков на производительность труда оказывают влияние трудоемкость единицы продукции и премии. Эти факторные признаки следует включить в модель многомерной нелинейной регрессии.

Так как коэффициент детерминации сравнительно мал, то при разработке модели регрессии следует рассмотреть дополнительные неучтенные факторные признаки.

В таблице 3.18 приведены результаты работы инструмента «Регрессия» для модели регрессии без факторного признака
Выполните анализ этой модели регрессии.

Уравнение регрессии

Уравнение регрессии - это математическая формула, определяющая, каким будет среднее значение у при том или ином значении х, если все остальные факторы, влияющие на у, не учитывать, т.е. абстрагироваться от них.

Найти в каждом конкретном случае тип функции, с помощью которой можно наиболее точно отразить зависимость между х и у, - первая задача регрессионного анализа. Виды уравнений:

1) линейная зависимость ;

2) парабола ;

3) гипербола ;

4) показательная функция ;

5) степенная функция и т.д.

Главным основанием для выбора типа функции должен быть содержательный анализ природы изучаемого явления. Полезно отразить зависимость графически.

Метод наименьших квадратов

Далее необходимо определить параметры уравнения регрессии а 0 и а 1 , (для параболы еще и а 2 ). Для этого используют метод наименьших квадратов. В его основу положена идея минимизации суммы квадратов отклонений фактических значений у от их выравненных (теоретических) значений, т.е.

где у i - фактические значения результативного признака;

y i (x i) - значения у, найденные по уравнению регрессии.

Если регрессия линейная , то

Рассматривая сумму в качестве функции параметров а 0 и а 1 , определяют частные производные по а 0 и а 1 и приравнивают их к нулю, поскольку в точке экстремума производная функции равна нулю:

Система уравнений для разных типов зависимости между признаками

Если связь между признаками линейная, то система уравнений для нахождения параметров уравнения регрессии примет вид:

После решения системы относительно а 1 и а 1 составляют уравнение регрессии .

Если связь между признаками у их описывается уравнением параболы , то система нормальных уравнений примет вид:


Экономический смысл параметров уравнения линейной регрессии

В уравнении линейной регрессии параметр а 0 определяет среднее значение y которое складывается под влиянием всех факторов, кроме х .



Параметр а 1 называется коэффициентом регрессии, он определяет, на сколько в среднем изменится у при изменении факторного признака на единицу. Чем больше величина а 1 , тем значительнее влияние данного факторного признака на моделируемый результативный. Знак коэффициента регрессии говорит о характере влияния фактора на результативный признак.

Коэффициент эластичности показывает, на сколько процентов изменится результативный признаку при изменении факторного признака на 1%. Общая формула для расчета коэффициента эластичности выглядит следующим образом:

,

где у"(х) - первая производная уравнения регрессии у(х) по х .

При различных значениях факторного признака х коэффициент эластичности принимает различные значения.

Для линейного уравнения регрессии коэффициент эластичности примет вид:

Для параболической связи коэффициент эластичности равен:

.

Для гиперболической связи коэффициент эластичности равен:

3. Корреляционный анализ. Показатели тесноты связи между признаками

В случае линейной зависимости между признаками для оценки тесноты связи применяют линейный коэффициент корреляции :

Линейный коэффициент корреляции изменяется в пределах от -1 до +1. Если |r| <0,3, то связь слабая. Если 0,3 <|r| < 0,7, то связь средняя. Если 0,7 < |r| < 0,9, то связь выше средней или тесная. Если |r| > 0,9, то связь сильная или весьма тесная. Если , то это дает основание говорить об отсутствии линейной связи между х и у.

Экспоненциальная регрессия имеет вид

ŷ = е + b (или ŷ = ba х ); (24)

степенная регрессия имеет вид

ŷ = а ; (25)

Для нахождения коэффициентов а иb предварительно проводят процедуру линеаризации выражений (24) и (25):

lnŷ =lnb+ x lnа, (26)

lnŷ =lnb lnx , (27)

а затем уже строят линейную регрессию между lnŷ и х для экспоненциальной регрессии, и между lnŷ и lnх для степенной регрессии.

Наибольшее распространение степенной функции в эконометрике связано с тем, что параметр а имеет четкое экономическое истолкование, – он является коэффициентом эластичности. Это значит, что коэффициент b показывает, на сколько % в среднем изменится результат, если фактор изменится на 1%.

Для вычисления параметров экспоненциальной регрессии (24) на компьютере используется встроенная статистическая функция ЛГРФПРИБЛ . Порядок вычисления аналогичен применению функции ЛИНЕЙН .

Для вычисления параметров степенной регрессии после преобразования исходных данных в соответствие с (27), можно воспользоваться функцией ЛИНЕЙН.

Для получения графиков однофакторных регрессий можно применить Мастер диаграмм , строя предварительно непрерывный или точечный график исходных данных (диаграмму рассеяния), а затем использовать режим Добавить линию тренда , причем в этом режиме Excel предоставляет возможность выбора шести функций – линейной, логарифмической, полиномиальной, степенной, экспоненциальной и скользящей средней. После выбора функции в режиме Параметры задайте флажок Показывать уравнение на диаграмме и Поместить на диаграмму величину достоверности аппроксимации( R ^2) .

4. Временные ряды.

4.1. Характеристики временных рядов. Выявление тренда в динамических рядах экономических показателей.

Методы математической статистики широко применяются для анализа экономических временных рядов .

В общем случае временной ряд содержит детерминированную и случайную составляющие:

у t =f(t,х t)+ t , t=1,…,Т,

гдеу t – значения временного ряда; f(t,х t) – детерминированная составляющая; х t – значения факторов, влияющих на детерминированную составляющую в момент t;  t – случайная составляющая; Т – длина ряда.

Получив оценки детерминированной и случайной составляющих, решают задачи прогноза будущих значений, как самого временного ряда, так и его составляющих.

Если детерминированная составляющая зависит только от времени и линейна относительно своих параметров, то задача сводится к задаче множественной линейной регрессии, рассмотренной выше.

Действительно, в этом случае

у t = 0 + 1  1 (t) + 2  2 (t) +…+ m  m (t)+ t , t=1,…,Т. (28)

В частном случае,

у t = 0 + 1 t 1 + 2 t 2 +…+ m t m +  t , t=1,…,Т. (29)

Детерминированная составляющая в свою очередь представляется тремя составляющими.

Долговременная эволюторно изменяющаяся составляющая является результатом действия факторов, приводящих к постепенному изменению экономического показателя. Так, в результате научно-технического прогресса, совершенствования системы управления производством показатели эффективности производства растут, а удельные расходы на единицу полезного эффекта снижаются.

Долговременная циклическая составляющая проявляется на протяжении длительного времени в результате действия факторов, обладающих большим последействием или циклически изменяющихся во времени. Например, кризисы перепроизводства или периодичность солнечной активности, влияющая на урожайность.

Сезонная циклическая составляющая легко просматривается в колебаниях продуктивности сельскохозяйственных животных, а также в колебаниях розничного товарооборота в зависимости от времени года.

Многие исследователи первую составляющую называют трендом , другие трендом называют все три составляющие.

Эволюторно изменяющуюся долговременную составляющую во многих практических случаях представляют в виде некоторой аналитической функции (см. ниже), тогда как долговременная и сезонная циклические составляющие представляются тригонометрическими трендами .

Для построения эволюторных трендов (моделирования тенденции) чаще всего применяются те же функции, которые мы рассматривали выше:

    линейный тренд: ŷ t =b + at ;

    гипербола: ŷ t = b+a /t ;

    экспоненциальный тренд: ŷ t = е b+ a t (или ŷ t =ba t );

    тренд в форме степенной функции ŷ t = b t a ;

    полином порядка m: ŷ t = b + a 1 t + a 2 t 2 +…+ a m t m .

Параметры каждого из перечисленных выше трендов можно определить обычным МНК, используя в качестве независимой переменной время t. Для нелинейных трендов предварительно проводят процедуру их линеаризации.

Пример 6 . Имеются помесячные данные о темпах роста заработной платы в РФ за 10 месяцев 2004 г. в процентах к уровню декабря 2003г. (табл. 10). Требуется выбрать наилучший тип тренда и определить его параметры.

Таблица 10

Определим параметры основных видов тренда. Результаты этих расчетов представлены в табл. 11.

Таблица 11

Наилучшей является степенная форма тренда, которая в исходном виде (после потенцирования) примет следующий вид

ŷ t = е 4.39 t 0,193

или ŷ t = 80,32t 0,193 .

Наиболее простую экономическую интерпретацию имеют параметры линейного и экспоненциального трендов.

Параметры линейного тренда можно интерпретировать так:

b – начальный уровень временного ряда при t =0;

a – средний за период абсолютный прирост ряда.

Применительно к примеру 6 можно сказать, что темпы роста месячной заработной платы за 10 месяцев 2004г. изменялись от 82,66% со средним за месяц абсолютным приростом 4,72%.

Параметры экспоненциального тренда имеют следующую интерпретацию:

b – начальный уровень временного ряда при t =0;

е a – средний за период коэффициент роста ряда.

В примере 6 уравнение экспоненциального тренда в исходной форме имеет вид

ŷ t = е 4.43 е 0,045 t

или ŷ t = 83,96е 0,045 t .

Следовательно, можно сказать, что темпы роста месячной заработной платы за 10 месяцев 2004г. изменялись от 83,96% со средним за месяц темпом роста, равным е 0,045 = 1,046.

      Моделирование сезонных и циклических колебаний.

Общий вид модели (аддитивной) следующий:

где Т – трендовая, S – сезонная и Е – случайная компонента.

S может моделироваться с помощью тригонометрических функций, однако можно обойтись и более простым способом, суть которого разберем на простом примере.

Пример 7. Пусть известны объемы потребления электроэнергии жителями района за четыре года (табл.12).

Таблица 12

№ квартала

Потребление электроэнергии

Итого за 4 квартала

Скользящая средняя за 4 квартала

Центрированная скользящая средняя

Оценка сезонной компоненты

Данный временной ряд содержит сезонные колебания периодичностью 4 (объемы потребления электроэнергии в осенне-зимний период выше, чем весной и летом).

Шаг 1. Проведем выравнивание исходных данных методом скользящей средней. Для этого:

а) просуммируем у t последовательно за каждые 4 квартала со сдвигом на один (гр.3 табл. 12);

б) разделив эти суммы на 4, найдем скользящие средние (гр.4 табл. 12);

в) приведем эти значения к соответствующим кварталам, для чего найдем средние значения из двух последовательных скользящих средних – центрированные скользящие средние (гр. 5 табл.12).

Шаг 2. Найдем оценки сезонной компоненты (гр.6 табл. 12). Найдем средние за каждый квартал оценки сезонной компоненты

Š 1 =(0,575+0,55+0,675)/3=0,6;

Š 2 =(–2,075 – 2,025 – 1,775)/3= –1,958;

Š 3 =(–1,25 – 1,1 – 1,475)/3= –1,275;

Š 4 =(2,55+2,7+2,875)/3=2,708.

Сумма значений сезонной компоненты по всем кварталам должна быть равна нулю, а у нас получилось 0,6 – 1,958 – 1,275 + 2,7=0,075, поэтому определяем корректирующий коэффициент k=0,075/4=0,01875. Окончательно определяем сезонную компоненту S i = Š i – k.

Таким образом, получаем

S 1 =0,581; S 2 = –1,979; S 3 = –1,294; S 4 =2,69.

Занесем полученные значения в табл.13 для соответствующих кварталов (гр.3).

Таблица 13

T+E= y t – S t

Шаг 3 . Вычисляем T+E= y t – S t (гр.4 табл.13).

Шаг 4. По данным графы 4 строим линейный тренд Т=5,715 + 0,186t . Подставляя в это уравнение t =1,2,…16, находим Т (гр. 5 табл.13).

Шаг 5 . Находим теоретические значения T+S (гр. 6 табл. 13).

Шаг 6. Вычисляются ошибки модели и их квадраты (гр. 7 и 8 табл.13).

Федеральное государственное образовательное учреждение

высшего профессионального образования

«СИБИРСКИЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ»

Институт управления бизнес-процессами и экономики

Кафедра теоретические основы экономики

Лабораторная работа № 2

по курсу эконометрика

(Вариант 6,7)

Руководитель _______________ Середа В.А.

подпись, дата

Студентка, УБ11-01 _______________ Ивкина В.А.

подпись, дата

Красноярск 2013

Введение……………………………………….…………………………………..3

1.Линейное уравнение регрессии 5

2.Показательное уравнение регрессии 7

3.Логарифмическое уравнение регрессии 9

Логарифмическое уравнение регрессии определяется по формуле: 9

Получим логарифмическое уравнение регрессии: 9

5.Поверка значимости уравнения регрессии и отдельных коэффициентов линейного уравнения 13

6.Построение интервального прогноза для значения x = xmax по уравнению линейной регрессии 17

7.Средний коэффициент эластичности 20

Цель работы: Закрепить навыки построения уравнений регрессии, графиков уравнений, вычисления оценок и построения доверительных интервалов для уравнений регрессии.

    Построить уравнения регрессии, включая линейную регрессию

    Вычислить индексы парной корреляции для каждого уравнения

    Проверить значимость уравнений регрессии и отдельных коэффициентов линейного уравнения

    Определить лучшее уравнение регрессии на основе средней ошибки аппроксимации

    Построить интервальный прогноз для значения x=x max для линейного уравнения регрессии

    Определить средний коэффициент эластичности

Исходные данные:

Области и республики

Холодильники. Морозильники.(X )

Стиральные машины.(Y)

Белгородская область

Брянская область

Владимирская область

Воронежская область

Ивановская область

Калужская область

Костромская область

Курская область

Липецкая область

Московская область

Орловская область

Рязанская область

Смоленская область

Тамбовская область

Тверская область

Тульская область

Ярославская область

Республика Карелия

Республика Коми

Архангельская область

Вологодская область

Калининградская область

Ленинградская область

Мурманская область

Новгородская область

Псковская область

Краснодарский край

Ставропольский край

Астраханская область

Волгоградская область

Ростовская область

Республика Башкортостан

Республика Марий Эл

Республика Мордовия

Республика Татарстан

Удмуртская Республика

Чувашская Республика

Кировская область

Нижегородская область

Оренбургская область

Пензенская область

Пермская область

Самарская область

Саратовская область

Ульяновская область

  1. Линейное уравнение регрессии

Формула линейного уравнения регрессии (1)

x,y – переменные,

a,b – параметры.

Система нормальных уравнений (2) в общем виде:

(2)

n - количество наблюдений в совокупности.

Система нормальных уравнений с вычисленными коэффициентами:

Решение системы:

Построенное линейное уравнение регрессии:

Рис. 1 График линейного уравнения регрессии

  1. Показательное уравнение регрессии

Показательное уравнение регрессии имеет следующий вид:

,

,

x,y – то же что и в формуле (1),

Найдем b 0 и b 1:

Полечим показательное уравнение регрессии:

  1. Логарифмическое уравнение регрессии

Логарифмическое уравнение регрессии определяется по формуле:

x,y – то же что и в формуле (1),

b – то же что и в формуле (1),

,

(8),

x,y – то же что и в формуле (1),

b – то же что и в формуле (1),

n – то же что и в формуле (2).

Найдем b 0 и b 1:

Получим логарифмическое уравнение регрессии:

Рис. 1 График логарифмического уравнения регрессии

    Индекс парной корреляции для уравнений регрессии

Индекс парной корреляции исчисляется по следующей формуле:

(9)

y – то же что и в формуле (1),

–значение у из исследуемого уравнения,

Среднее значение y.

Для оценки качества построенной модели регрессии можно использовать индекс детерминации или среднюю ошибку аппроксимации. Чем выше показатель детерминации или чем ниже ошибка аппроксимации, чем лучше модель описывает исходные данные.

Средняя ошибка аппроксимации – среднее относительное отклонение расчетных значений от фактических, рассчитывается по формуле

(10)

y – то же что и в фотрмуле (1).

Индекс парной корреляции для линейного уравнения регрессии:

= 0,92

Средняя ошибка аппроксимации для линейного уравнения регрессии:

=6%

Индекс парной корреляции для логарифмического уравнения регрессии:

=0,95

Средняя ошибка аппроксимации для логарифмического уравнения регрессии:

=6%

Построенные уравнения считаются удовлетворительными, так как . Коэффициент детерминации достаточно высокий, а это значит, что модель точно описывает исходные данные.

  1. Поверка значимости уравнения регрессии и отдельных коэффициентов линейного уравнения

Оценка статистической значимости уравнения регрессии в целом осуществляется с помощью F -критерия Фишера.

Величина F факт определяется по формуле:

(11)

Индекс детерминации,

n – то же что и в формуле (2),

m – число параметров при переменных.

Таким образом, для

F факт = =2,26

F крит =4,08, при α =0,05

F табл >

=3,87

F крит =4,08, при α =0,05

F табл >F факт, гипотеза H 0 не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.

Для оценки статистической значимости коэффициентов линейной регрессии применяется t- критерий Стьюдента:

Величины t b ,факт и t a , факт определяются по формулам:

a,b – то же что и в формуле (1),

r xy - коэффициент корреляции,

m b , m a , m rxy – стандартные ошибки.

Таким образом, для

    линейного уравнения регрессии:

    логарифмического уравнения регрессии:

Стандартные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:

(15)

(16)

Где, y – то же что и в формуле (1),

–то же что и в формуле (9),

То же что и в формуле (9),

1. Построим уравнения степенной нелинейной регрессии вида для пар переменных y, x.

Нахождение модели парной регрессии сводится к оценке уравнения в целом и по параметрам (b0, b1). Для оценки параметров однофакторной модели используют метод наименьших квадратов (МНК). В МНК получается, что сумма квадратов отклонений фактических значений показателя у от теоретических ух минимальна

Сущность нелинейных уравнений заключается в приведении их к линейному виду и как при линейных уравнениях решается система относительно коэффициентов b0 и b1.


Рисунок 3 Линия регрессии на корреляционном поле. Ось ординат - значения y(Производительность труда), ось абсцисс -значения x (Удельный вес рабочих в составе ППП)


Рисунок 4 Линия регрессии на корреляционном поле. Ось ординат - значения y(степ.функция), ось абсцисс -значения x (Удельный вес рабочих в составе ППП)

Найдем среднюю относительную ошибку аппроксимации по формуле:

Полученное значение между 20% и 50%, что свидетельствует о существенности удовлетворительного отклонения расчетных данных от фактических, по которым построена эконометрическая модель.

Исследование статистической значимости уравнения регрессии в целом проводится с помощью F-критерия Фишера. Расчетное значение критерия находится по формуле:

Для парного уравнения p = 1.

Табличное (теоретическое) значение критерия находится по таблице критических значений распределения Фишера-Снедекора по уровню значимости по уровню значимости б и двум числам степеней свободы k1 = p = 1 и k2 = n - p - 1 = 51.

Если Fрасч

то гипотеза принимается, а уравнение линейной регрессии в целом считается статистически незначимым (с вероятностью ошибки 5%).Для уравнения Fрасч = 0,01609). Неравенство выполняется. Уравнение в целом статистически незначимо.

Теснота нелинейной корреляционной связи определяется с помощью корреляционных отношений (индекс корреляции).

Выбор редакции
Три дня длилось противостояние главы управы района "Беговой" и владельцев легендарной шашлычной "Антисоветская" . Его итог – демонтаж...

Святой великомученик Никита родился в IV веке в Готии (на восточной стороне реки Дунай в пределах нынешней Румынии и Бессарабии) во...

РЕШЕНИЕ ИМЕНЕМ РОССИЙСКОЙ ФЕДЕРАЦИИ 07 мая 2014 года г. Ефремов Тульская областьЕфремовский районный суд Тульской области в...

Откуда это блюдо получило такое название? Лично я не знаю. Есть еще одно – «мясо по-капитански» и мне оно нравится больше. Сразу...
Мясо по-французски считается исконно русским блюдом, очень сытное блюдо, с удачным сочетанием картофеля, помидоров и мяса. Небольшие...
Мне хочется предложить хозяюшкам на заметку рецепт изумительно нежной и питательной икры из патиссонов. Патиссоны имеют схожий с...
Бананово-шоколадную пасту еще называют бананово-шоколадным крем-джемом, поскольку бананы сначала отвариваются и масса по консистенции и...
Всем привет! Сегодня в расскажу и покажу, как испечь открытый пирог с адыгейским сыром и грибами . Чем мне нравится этот рецепт — в нём...
Предлагаю вам приготовить замечательный пирог с адыгейским сыром. Учитывая, что пирог готовится на дрожжевом тесте, его приготовление не...