Компютри, Софтуер
Регресия в Excel: уравнението примери. линейна регресия
Регресионен анализ - метод на статистическо проучване, за да покаже зависимостта на даден параметър от един или повече независими променливи. В ерата на предварително компютър, употребата му е доста трудно, особено когато става дума за големи обеми от данни. Днес се научите как да се изгради регресия в Excel, можете да решим сложни статистически проблеми, само за няколко минути. По-долу са конкретни примери на икономиката.
видове регресионни
Тази концепция е въведена за математика от Франсис Галтън през 1886. Регресията е:
- линеен;
- параболична;
- мощност;
- експоненциално;
- хиперболичен;
- експоненциално;
- логаритмична.
ПРИМЕР 1
Да разгледаме проблема за определяне на зависимостта на броя на оставки на членове на персонала на средната работна заплата в срок от 6 промишлени предприятия.
Задача. Шест дружества анализират средната месечна работна заплата, а броят на служителите, които се откажат доброволно. В табличен вид имаме:
А | B | C | |
1 | X | Брой на оставки | заплата |
2 | ш | 30000 рубли | |
3 | 1 | 60 | 35000 рубли |
4 | 2 | 35 | 40000 рубли |
5 | 3 | 20 | 45000 рубли |
6 | 4 | 20 | 50,000 рубли |
7 | 5 | 15 | 55000 рубли |
8 | 6 | 15 | 60000 рубли |
За проблема за определяне на зависимостта на работниците количеството сепарирането от средното за 6 предприятия регресия модел има формата на уравнението Y = 0 + 1 х 1 + ... + К х К, където х и - влияещи променливи, а I - регресионни коефициенти, ак - редица фактори.
Y за дадена задача - това е индикатор за пожар служител, допринасящ фактор - заплатата, която е обозначена с X.
Възползвайки се от мощта на електронна таблица "Excel"
Регресионен анализ в Excel трябва да се предхожда от прилагане на съществуващите данни за настолни вградени функции. Въпреки това, за тези цели е по-добре да използвате един много полезен добавка в "пакет анализ". За да го активирате, трябва да:
- с "Файл" на раздела отидете в "Settings";
- в прозореца, който се отваря, изберете "Добавки";
- кликнете върху бутона "Go", който се намира в долния десен ъгъл на линията "управление";
- сложите отметка до "допълнителният модул" и потвърдите действието си, като натиснете "ОК".
Ако всичко е направено правилно, от дясната страна на "Data" в раздела, който се намира над работен лист "Excel", показва желания бутон.
Линейна регресия в Excel
Сега, когато имате на разположение всички необходими инструменти за виртуални иконометрични изчисления, можем да започнем да се справи наш проблем. За да направите това:
- се кликне върху бутона за "Анализ на данни";
- кликнете върху бутона "регресия" в отворения прозорец;
- раздел, който се появява да се въведе диапазон от стойности Y (броят на работниците сепарирането) и Х (заплата);
- потвърждават своите действия, като натиснете «ОК» бутона.
В резултат на това, програмата автоматично ще запълни нов лист таблица регресионен анализ на данните. Обърнете внимание! В Excel, има възможност да се определи мястото, което предпочитате за тази цел. Например, може да е един и същ лист, където стойностите Y и X, или дори нова книга, специално предназначен за съхранение на тези данни.
Резултати от регресионен анализ за R-квадрат
Данните за Excel, получени в разгледаните примерни данни имат следния вид:
На първо място, ние трябва да обърнем внимание на стойността на корен квадратен. Той представлява коефициентът на определяне. В този пример, R-квадрат = 0.755 (75.5%), т. Е. изчисляват параметрите на модела, за да обясни връзката между параметрите разгледани от 75.5%. Колкото по-висока стойност на коефициента на характер избрания модел се счита за по-полезен за специфични задачи. Смята се, за да се опише правилно фактическата ситуация в R-квадрат стойност над 0.8. Ако R-квадрат <0.5, след това регресионен анализ в Excel не може да се счита за приемлива.
анализ съотношение
Номер 64.1428 показва каква ще бъде стойността на Y, ако всичко XI на променливи в модела ни ще бъде сменена с нова. С други думи, може да се твърди, че стойността на анализирания параметър се влияе от други фактори, различни от тези, описани в конкретния модел.
Следващият фактор -0.16285 намира в клетка Б18, показва важно влияние на променливата X на Y. Това означава, че средното възнаграждение на служители в модел отразява броя на оставка от теглото на -0.16285, т. Е. степента на неговото въздействие изобщо малък. Знакът "-" показва, че коефициентът е отрицателен. Очевидно е, тъй като всички знаем, че колкото по заплата в предприятието, по-малко хора са изразили желание да прекрати трудовия договор или отхвърлена.
множествена регресия
Под този термин се отнася до комуникационната уравнение с няколко независими променливи от вида:
Y = е (х 1 + х 2 + ... х т) + ε, където Y - е знак за ефективно (зависима променлива), и X 1, X 2, ... х m - това са признаци на фактори (независими променливи).
оценка на параметър
За множествена регресия (MR) се извършва с помощта на метод на най-малките квадрати (LSM). За линейни уравнения на форма Y = A + B 1 х 1 + ... + б m х m + ε изграждане на система на нормални уравнения (см. По-долу)
За да се разбере принципът на метода, считаме случая за двуфакторна. Тогава ние ситуацията, описана от формулата
Следователно, ние се получи:
където σ - е дисперсията на съответната функция, отразено в индекса.
МНК е приложимо към уравнението MR да standartiziruemom мащаб. В този случай, ние получаваме уравнението:
където т у, т х 1, ... т х - standartiziruemye променливи, за които средните стойности са 0; р и - стандартизирани регресионни коефициенти и стандартно отклонение - 1.
Моля, имайте предвид, че всички р аз в този случай определя като нормализирани и tsentraliziruemye следователно сравнение между счита за валидно и приемливо. В допълнение, той е приет за извършване на скрининг на фактори, като се отстраняват тези, които имат най-ниските стойности на βi.
Проблемът с използване на линейна регресия уравнение
Да предположим, че имате маса на динамиката на цената на даден продукт N за последните 8 месеца. Необходимо е да се реши дали придобиването на своята партия на цена от 1850 рубли. / T.
А | B | C | |
1 | месеца | име на месеца | Цена N |
2 | 1 | януари | 1750 рубли за тон |
3 | 2 | февруари | 1755 рубли за тон |
4 | 3 | март | 1767 рубли за тон |
5 | 4 | април | 1760 рубли за тон |
6 | 5 | май | 1770 рубли за тон |
7 | 6 | юни | 1790 рубли за тон |
8 | 7 | юли | 1810 рубли за тон |
9 | 8 | август | 1840 рубли за тон |
За да реши този проблем в табличен процесор "Excel" изисква да се използва вече са известни например инструмент "Анализ на данни", представен по-горе. След това изберете раздела "регресия" и определени параметри. Ние трябва да помним, че в "Input обхват Y» трябва да се въведе в диапазон от стойности на зависимата променлива (в този случай цената на стоките в определени месеци от годината) и в "Input интервал X» - за независима (месец). Ние потвърдите действието, като кликнете върху «ОК». В нов работен лист (ако е посочено), ние получаваме данните за регресия.
Ние сме изграждане на тях линейно уравнение на формуляра Y = ос + б, където като параметри А и В са коефициентите от номера на реда на месец и името на коефициентите и "Y-пресичане" линия на листа с резултатите от анализа на регресия. По този начин, линейна регресия уравнение (EQ) 3 за проблема могат да бъдат написани като:
Цената на стоки N = 11714 * 1727.54месеца номер +.
или в алгебрични нотация
у = 11 714 х + 1727,54
анализ на резултатите
За да се реши дали получените адекватно линейна регресия уравнение с използване на множество коефициенти на корелация (CMC) и определяне, както и изпитването и Т-тест на Fisher. В таблица "Excel" регресия с резултатите, които действат под имената множествена R, R-квадрат, съответно F-т-статистика и статистиката,.
KMC R дава възможност да се оцени близостта вероятностни връзката между независими и зависими променливи. Високата му стойност показва достатъчно силна връзка между променливата "Брой на месеца" и "N Каталог на цената в рубли за един т." Въпреки това, естеството на тези отношения е неизвестен.
Квадратът на коефициента на определяне R 2 (RI) е цифров характеристика на част от общото разсейване и показва разсейване на експерименталната част данни, т.е. стойности на зависимата променлива съответстваща на линейна регресия уравнение. В този проблем, тази стойност е 84.8%, т.т.. Е. статистика с висока степен на точност, получен са описани SD.
F-статистика, известен също като критерий на Fisher, използвани за оценка на значимостта на линейна зависимост или опровергава хипотеза се потвърждава съществуването си.
Стойността на т-статистика (т тест на Student) помага да се оцени значението на коефициента на свободна неизвестен елемент на линеен зависимост. Ако стойността на т-тест> т кр, хипотезата за линейно уравнение незначителност на свободен термин се отхвърли.
В този проблем за свободен Терминът чрез инструменти "Excel" е установено, че т = 169,20903, и р = 2,89E-12, т. Е. имат нулева вероятност верните ще бъде отхвърлена хипотезата за незначителност на свободната план. За неизвестен коефициент при Т = 5,79405 и р = 0,001158. С други думи, вероятността отхвърли правилната хипотеза ще незначимост на коефициента за неизвестното, е 0,12%.
По този начин, може да се твърди, че получените линейна регресия уравнение адекватно.
Проблемът на целесъобразността на закупуване на акции
Множествена регресия е извършено в Excel с помощта на същия инструмент "Анализ на данни". Помислете за конкретното приложение.
Ръководство компания «NNN» трябва да реши дали да закупи 20% от акциите на ЗАО «MMM». Пакетна цена (SP) е 70 милиона щатски долара. Специалисти на "NNN» събрани данни за подобни сделки. Решено бе да се направи оценка на стойността на акциите на тези параметри, изразени в милиони щатски долари, като например:
- задължения (VK);
- обем оборот (VO);
- вземания (VD);
- стойност на дълготрайните материални активи (SOF).
В допълнение, използвайте дълговете на заплатите на предприятия (V3 U) в хиляди щатски долара.
решение маса процесорни Excel средство
Първо трябва да се създаде таблица за въвеждане на данни. Това е, както следва:
Напред:
- повикване кутия "анализ на данни";
- избран раздел "регресия";
- прозореца "Input интервал Y» прилага диапазон зависими променливи стойности от колона G;
- кликнете върху иконата с червена стрелка отдясно на прозореца "Input интервал X» и изолирани върху лист гама от всички стойности на колона B, C, D, Е.
Марк точката "New лист" и кликнете "OK".
Вземете регресионен анализ за тази задача.
Резултатите от проучването и заключенията
"Събиране" закръглени от данните, представени по-горе върху лист таблица Excel процесор регресионно уравнение:
SD = 0.103 * СОФ + 0541 * VO - 0031 * VK + 0405 * VD + 0691 * VZP - 265,844.
В по-обичайната математическа форма той може да се изписва така:
у = 0103 * x1 + 0541 * х2 - 0031 * x3 + 0405 * x4 + 0691 * Х5 - 265844
Данните за «MMM» АД, представени в таблицата по-долу:
SOF, USD | VO, USD | VK, USD | VD, USD | VZP, USD | JV, USD |
102,5 | 535,5 | 45.2 | 41.5 | 21.55 | 64.72 |
заместването им в регресионното уравнение, получено фигура на 64.72 милиона щатски долара. Това означава, че акциите на ЗАО «MMM» не трябва да купуват, защото цената им е доста скъп на 70 милиона щатски долара.
Както можете да видите, използването на електронна таблица "Excel" и регресионното уравнение позволено да вземете информирано решение относно целесъобразността съвсем конкретна сделка.
А знаеш ли какво е регресия. Примери за Excel, обсъдени по-горе, ще ви помогне в решаването на практически проблеми на иконометрията.
Similar articles
Trending Now