Използване на числени методи при решаване на инженерни задачи. Нелинейно регресионно уравнение Параболичен регресионен модел

Силова регресия

Степенната функция има формата y = bx a . Привеждаме тази функция в линейна форма, за това вземаме логаритъм от двете части: . Нека = y * , = x * , = b * , тогава y * = ax * + b * . Необходимо е да се намерят два параметъра: a и b * . За да направите това, съставяме функцията i * - (ax i * +b *)) 2 , отваряме скобите i * - ax i * - b *) 2 и съставяме системата:

Нека A = i * , B = i * , C = i * x i * , D = i *2 , тогава системата ще приеме формата: aD + bA = C

Решаваме тази система от линейни алгебрични уравнения по метода на Крамер и по този начин намираме желаните стойности на параметрите a и b * :

Таблица. Има точки

Използвайки метода за изчисляване на параметрите на степенна функция, получаваме:

a = 1,000922, b = 1,585807. Тъй като показателят на променливата е приблизително равен на единица, графиката на функцията ще изглежда като права линия.

Функционална графика y = 1.585807x 1.000922:

Блокова диаграма:

Параболична регресия

Квадратната функция има формата y = ax 2 + bx + c, следователно е необходимо да се намерят три параметъра: a, b, c, при условие че са дадени координатите на n точки. За да направим това, съставяме функцията S \u003d i - (ax i 2 + bx i + c)) 2, отваряме скобите S \u003d i - ax i 2 - bx i - c) 2 и съставяме системата:


Ние решаваме тази система от линейни алгебрични уравнения по метода на Крамер и по този начин намираме желаните стойности на параметрите a, b и c:

Таблица. Има точки:

Използвайки метода за изчисляване на параметрите на квадратична функция, получаваме:

a = 0,5272728, b = -5,627879, c = 14,87333.

Функционална графика y = 0.5272728x 2 - 5.627879x + 14.87333:

блокова схема

Решение на уравнения от вида f(x)=0

Уравнение под формата f(x) = 0 е нелинейно алгебрично уравнение в една променлива, където функцията f(x) е дефинирана и непрекъсната на краен или безкраен интервал a< x < b. Всякое значение C???, обращающее функцию f(x) в ноль, называется корнем уравнения f(x) = 0. Большинство алгебраических нелинейни уравненияпод формата f(x) = 0 не може да бъде решен аналитично (т.е. точно), следователно на практика често се използват числени методи за намиране на корените.

Проблемът за числено намиране на корените на уравнение се състои от два етапа: разделяне на корените, т.е. намиране на такива околности на разглежданата област, които съдържат една стойност на корена, и прецизиране на корените, т.е. техните изчисления с определена степен на точност в тези квартали.

Сервизно задание. С помощта на този онлайн калкулатор можете да намерите параметрите на уравнение на нелинейна регресия (експоненциално, експоненциално, равностранна хипербола, логаритмично, експоненциално) (вижте примера).

Инструкция. Посочете количеството изходни данни. Полученото решение се записва във файл на Word. Шаблон за решение също се генерира автоматично в Excel. Забележка: ако трябва да определите параметрите на параболичната зависимост (y = ax 2 + bx + c), тогава можете да използвате услугата за аналитично подравняване.
Възможно е да се ограничи хомогенен набор от единици чрез елиминиране на аномални обекти на наблюдение чрез метода на Irwin или чрез правилото на трите сигми (елиминиране на тези единици, за които стойността на обяснителния фактор се отклонява от средната с повече от три пъти стандарта отклонение).

Видове нелинейна регресия

Тук ε е случайна грешка (отклонение, смущение), отразяваща влиянието на всички неотчетени фактори.

Регресионно уравнение от първи реде уравнение на двойна линейна регресия.

Регресионно уравнение от втори редтова е полиномно регресионно уравнение от втори ред: y = a + bx + cx 2 .

Регресионно уравнение от трети редсъответно уравнението на полиномна регресия от трети ред: y = a + bx + cx 2 + dx 3 .

За да приведете нелинейни зависимости към линейни, се използват методи за линеаризация (вижте метода за подравняване):

  1. Промяна на променливите.
  2. Логаритъм от двете страни на уравнението.
  3. Комбиниран.
y = f(x)трансформацияМетод на линеаризация
y = b x aY = log(y); X = log(x)Логаритъм
y = b e axY = log(y); X=xКомбиниран
y = 1/(ax+b)Y = 1/y; X=xПромяна на променливите
y = x/(ax+b)Y=x/y; X=xПромяна на променливите. Пример
y = aln(x)+bY=y; X = log(x)Комбиниран
y = a + bx + cx2x 1 = x; х2 = х2Промяна на променливите
y = a + bx + cx2 + dx3x 1 = x; x 2 \u003d x 2; x 3 = x 3Промяна на променливите
y = a + b/xx 1 = 1/xПромяна на променливите
y = a + sqrt(x)bx 1 = sqrt(x)Промяна на променливите
Пример. Според данните, взети от съответната таблица, направете следното:
  1. Изградете корелационно поле и формулирайте хипотеза за формата на връзката.
  2. Изчислете параметрите на уравненията на линейна, степенна, експоненциална, полулогаритмична, обратна, хиперболична двойна регресия.
  3. Оценете тясността на връзката, като използвате индикатори за корелация и определяне.
  4. Използвайте средния (общ) коефициент на еластичност, за да дадете сравнителна оценка на силата на връзката между фактора и резултата.
  5. Оценете качеството на уравненията, като използвате средната грешка на приближението.
  6. Оценете статистическата надеждност на резултатите от регресионното моделиране, като използвате F-теста на Fisher. Според стойностите на характеристиките, изчислени в параграфи. 4, 5 и този параграф, изберете най-доброто регресионно уравнение и дайте неговата обосновка.
  7. Изчислете прогнозната стойност на резултата, ако прогнозираната стойност на фактора се увеличи с 15% от средното му ниво. Определете доверителния интервал на прогнозата за ниво на значимост α=0,05.
  8. Оценете получените резултати, направете изводи в аналитична бележка.
годинаДействително крайно потребление на домакинствата (по текущи цени), милиарди рубли (1995 г. - трилион рубли), гСреден паричен доход на глава от населението (на месец), рубли. (1995 г. - хиляди рубли), х
1995 872 515,9
2000 3813 2281,1
2001 5014 3062
2002 6400 3947,2
2003 7708 5170,4
2004 9848 6410,3
2005 12455 8111,9
2006 15284 10196
2007 18928 12602,7
2008 23695 14940,6
2009 25151 16856,9

Решение. В калкулатора изберете видове нелинейна регресия. Получаваме следната таблица.
Уравнението на експоненциалната регресия е y = a e bx
След линеаризацията получаваме: ln(y) = ln(a) + bx
Получаваме емпирични регресионни коефициенти: b = 0,000162, a = 7,8132
Регресионно уравнение: y = e 7,81321500 e 0,000162x = 2473,06858e 0,000162x

Уравнението на степенна регресия има формата y = a x b
След линеаризацията получаваме: ln(y) = ln(a) + b ln(x)
Емпирични регресионни коефициенти: b = 0,9626, a = 0,7714
Регресионно уравнение: y = e 0,77143204 x 0,9626 = 2,16286 x 0,9626

Уравнението на хиперболичната регресия е y = b/x + a + ε
След линеаризация получаваме: y=bx + a
Емпирични регресионни коефициенти: b = 21089190.1984, a = 4585.5706
Емпирично регресионно уравнение: y = 21089190.1984 / x + 4585.5706

Уравнението на логаритмичната регресия има формата y = b ln(x) + a + ε
Емпирични регресионни коефициенти: b = 7142.4505, a = -49694.9535
Регресионно уравнение: y = 7142,4505 ln(x) - 49694,9535

Уравнението на експоненциалната регресия има формата y = a b x + ε
След линеаризацията получаваме: ln(y) = ln(a) + x ln(b)
Емпирични регресионни коефициенти: b = 0,000162, a = 7,8132
y = e 7,8132 *e 0,000162x = 2473,06858*1,00016x

хг1/xlog(x)лог(y)
515.9 872 0.00194 6.25 6.77
2281.1 3813 0.000438 7.73 8.25
3062 5014 0.000327 8.03 8.52
3947.2 6400 0.000253 8.28 8.76
5170.4 7708 0.000193 8.55 8.95
6410.3 9848 0.000156 8.77 9.2
8111.9 12455 0.000123 9 9.43
10196 15284 9.8E-59.23 9.63
12602.7 18928 7.9E-59.44 9.85
14940.6 23695 6.7E-59.61 10.07
16856.9 25151 5.9E-59.73 10.13

Линейна регресия

Уравнението на линейната регресия е уравнение на права линия, което приближава (приблизително описва) връзката между случайните променливи X и Y.

Помислете за произволна двумерна променлива (X, Y), където -- зависим случайни променливи. Представяме едно от количествата като функция на другото. Ние се ограничаваме до приблизително представяне на количеството като линейна функция на количеството X:

къде са параметрите за определяне. Може да се направи различни начини: най-често срещаният от тях е методът на най-малките квадрати. Функцията g(x) се нарича средноквадратична регресия на Y върху X. Функцията g(x) се нарича средноквадратична регресия на Y върху X.

където F е общото квадратно отклонение.

Избираме a и b така, че сумата на квадратите на отклоненията да е минимална. За да намерим коефициентите a и b, при които F достига минималната си стойност, ние приравняваме частните производни на нула:

Намираме a и b. След извършване на елементарни трансформации получаваме система от две линейни уравнения за a и b:

къде е размерът на извадката.

В нашия случай A = 3888; B=549; С=8224; D = 1182; N = 100.

Нека намерим a и b от тази линейна. Ще получим стационарна точка за където 1,9884; 0,8981.

Следователно уравнението ще приеме формата:

y = 1,9884x + 0,8981


Ориз. десет

Параболична регресия

Въз основа на данните от наблюденията, нека намерим примерно уравнение на кривата на средноквадратичната (в нашия случай параболична) регресия. Нека използваме метода на най-малките квадрати, за да определим p, q, r.

Ограничаваме се до представянето на Y като параболична функция на X:

където p, q и r са параметри, които трябва да бъдат определени. Това може да стане с помощта на метода на най-малките квадрати.

Избираме параметрите p, q и r така, че сумата на квадратите на отклоненията да е минимална. Тъй като всяко отклонение зависи от търсените параметри, сумата от квадратите на отклоненията също е функция F на тези параметри:

За да намерим минимума, приравняваме съответните частни производни на нула:

Намерете p, q и r. След извършване на елементарни трансформации получаваме система от три линейни уравнения за p, q и r:

Решаване на тази система по метода обратна матрица, получаваме: p = -0.0085; q = 2,0761;

Следователно уравнението на параболичната регресия ще приеме формата:

y = -0,0085x2 + 2,0761x + 0,7462

Нека начертаем параболична регресия. За по-лесно наблюдение регресионната диаграма ще бъде на фона на диаграма на разсейване (вижте Фигура 13).


Ориз. 13

Сега нека начертаем линиите на линейна регресия и параболична регресия върху една и съща диаграма за визуално сравнение (вижте Фигура 14).


Ориз. четиринадесет

Линейната регресия е показана в червено, докато параболичната регресия е показана в синьо. Диаграмата показва, че разликата в този случай е по-голяма, отколкото при сравняване на две линии на линейна регресия. Необходими са допълнителни изследвания за това коя регресия най-добре изразява връзката между x и y, т.е. какъв тип връзка между x и y.

В някои случаи емпиричните данни на статистическата съвкупност, визуализирани с помощта на координатна диаграма, показват, че увеличението на фактора е придружено от изпреварващо увеличение на резултата. За теоретично описание на този вид корелационна връзка на характеристиките можем да вземем параболичното регресионно уравнение от втори ред:

където , е параметър, показващ средната стойност на ефективния признак при условие на пълно изолиране на влиянието на фактора (х=0); - коефициент на пропорционалност на изменението на резултата при условие на абсолютно увеличение на знака-фактор за всяка негова единица; c е коефициентът на ускорение (забавяне) на растежа на ефективния признак за всяка единица на фактора.

Приемайки базата за изчисляване на параметрите , , с метода на най-малките квадрати и условно приемайки медианата на класираната серия за начална, ще имаме Σх=0, Σх 3 =0. В този случай системата от уравнения в опростена форма ще бъде:

От тези уравнения могат да се намерят параметрите , , c, които в общ изгледможе да се напише така:

(11.20)

(11.22)

Това показва, че за определяне на параметрите , , с е необходимо да се изчислят следните стойности: Σ y, Σ xy, Σ x 2, Σ x 2 y, Σ x 4. За тази цел можете да използвате оформлението на таблицата. 11.9.

Да предположим, че има данни за дела на картофените култури в структурата на всички посевни площи и добива (брутна реколта) в 30 селскостопански организации. Необходимо е да се състави и реши уравнението на корелационната връзка между тези показатели.

Таблица 11.9. Изчисляване на помощни показатели за уравнението

параболична регресия

№ п.п. х при ху х 2 х 2 г х 4
х 1 1 x 1 y 1
х 2 на 2 x 2 y 2
н x n при n x n y n
Σ Σx Σy Σhu Σх 2 Σx 2 г Σx 4

Графичното представяне на корелационното поле показа, че изследваните показатели са емпирично свързани помежду си с линия, приближаваща се към парабола от втори ред. Следователно изчисляването на необходимите параметри , , s като част от желаното параболично регресионно уравнение ще бъде извършено с помощта на оформлението на табл. 11.10.

Таблица 11.10. Изчисляване на спомагателни данни за уравнението

параболична регресия

№ п.п. Х, % y, хиляди тона ху х 2 х 2 г х 4
1,0 5,0 5,0 1,0 5,0 1,0
1,5 7,0 10,5 2,3 15,8 5,0
н 8,0 20,0 160,0 64,0
Σ

Заместител специфични стойностиΣ y=495, Σ xy=600, Σ x 2 =750, Σ x 2 y=12375, Σ x 4 =18750, налични в таблицата. 11.10, във формули (11.20), (11.21), (11.22). Вземете

По този начин уравнението на параболичната регресия изразява влиянието специфично теглокартофени култури в структурата на посевните площи на култура (брутен добив) от култури в селскостопанските организации, има следната форма:

(11.23)

Уравнение 11.23 показва, че при условия на даден рамка за вземане на пробисредният добив (брутна реколта) от картофи (10 хиляди ценнера) може да се получи без влиянието на изследвания фактор - увеличаване на дела на културите в структурата на посевните площи, т.е. при такова условие, че колебанията в специфичното тегло на културите няма да повлияят на размера на добива на картофи (x=0). Параметърът (коефициент на пропорционалност) β = 0,8 показва, че всяко процентно увеличение на дела на културите осигурява увеличение на добива средно с 0,8 хиляди тона, а параметърът c = 0,1 показва, че един процент (на квадрат) увеличението на добива е се ускорява средно с 0,1 хил. тона картофи.

Регресионен и корелационен анализ - статистически методи за изследване. Това са най-често срещаните начини за показване на зависимостта на параметър от една или повече независими променливи.

По-долу, използвайки конкретни практически примери, ще разгледаме тези два много популярни анализа сред икономистите. Ще дадем и пример за получаване на резултати, когато се комбинират.

Регресионен анализ в Excel

Показва влиянието на някои стойности (независими, независими) върху зависимата променлива. Например как броят на икономически активното население зависи от броя на предприятията, заплатите и други параметри. Или: как влияят на нивото на БВП чуждите инвестиции, цените на енергията и т.н.

Резултатът от анализа ви позволява да дадете приоритет. И въз основа на основните фактори, да се прогнозира, планира развитието на приоритетните области, да се вземат управленски решения.

Регресията се случва:

  • линеен (y = a + bx);
  • параболичен (y = a + bx + cx 2);
  • експоненциален (y = a * exp(bx));
  • мощност (y = a*x^b);
  • хиперболичен (y = b/x + a);
  • логаритмичен (y = b * 1n(x) + a);
  • експоненциален (y = a * b^x).

Разгледайте примера за изграждане на регресионен модел в Excel и интерпретиране на резултатите. Нека вземем линеен тип регресия.

Задача. В 6 предприятия средномес заплатаи броят на пенсионираните служители. Необходимо е да се установи зависимостта на броя на пенсионираните служители от средната работна заплата.

Линейният регресионен модел има следния вид:

Y \u003d a 0 + a 1 x 1 + ... + a k x k.

Където a са регресионните коефициенти, x са влияещите променливи и k е броят на факторите.

В нашия пример Y е индикаторът за напуснали работници. Влияещият фактор е работната заплата (x).

Excel има вградени функции, които могат да се използват за изчисляване на параметрите на линеен регресионен модел. Но добавката Analysis ToolPak ще го направи по-бързо.

Активирайте мощен аналитичен инструмент:

След като бъде активирана, добавката ще бъде достъпна в раздела Данни.

Сега ще се занимаваме директно с регресионния анализ.



На първо място, обръщаме внимание на R-квадрата и коефициентите.

R-квадрат е коефициентът на детерминация. В нашия пример това е 0,755, или 75,5%. Това означава, че изчислените параметри на модела обясняват връзката между изследваните параметри с 75,5%. Колкото по-висок е коефициентът на детерминация, толкова по-добър е моделът. Добър - над 0,8. Слабо - под 0,5 (такъв анализ едва ли може да се счита за разумен). В нашия пример - "не е лошо".

Коефициентът 64.1428 показва какво ще бъде Y, ако всички променливи в разглеждания модел са равни на 0. Тоест други фактори, които не са описани в модела, също влияят върху стойността на анализирания параметър.

Коефициентът -0.16285 показва тежестта на променливата X върху Y. Тоест средната месечна заплата в този модел влияе върху броя на напусналите с тежест -0.16285 (това е малка степен на влияние). Знакът „-“ показва отрицателно въздействие: колкото по-висока е заплатата, толкова по-малко напускат. Което е справедливо.



Корелационен анализ в Excel

Корелационният анализ помага да се установи дали има връзка между показателите в една или две проби. Например между времето за работа на машината и разходите за ремонт, цената на оборудването и продължителността на работа, височината и теглото на децата и т.н.

Ако има връзка, тогава дали увеличението на един параметър води до увеличение (положителна корелация) или намаление (отрицателна) на другия. Корелационният анализ помага на анализатора да определи дали стойността на един индикатор може да предвиди възможната стойност на друг.

Коефициентът на корелация се обозначава с r. Варира от +1 до -1. Класификацията на корелациите за различните области ще бъде различна. Когато стойността на коефициента е 0, няма линейна връзка между извадките.

Помислете как да използвате Excel, за да намерите коефициента на корелация.

Функцията CORREL се използва за намиране на сдвоените коефициенти.

Задача: Установете дали има връзка между времето за работа на струг и разходите за неговата поддръжка.

Поставете курсора в произволна клетка и натиснете бутона fx.

  1. В категорията "Статистически" изберете функцията CORREL.
  2. Аргумент "Масив 1" - първият диапазон от стойности - времето на машината: A2: A14.
  3. Аргумент "Масив 2" - вторият диапазон от стойности - цената на ремонта: B2:B14. Натиснете OK.

За да определите вида на връзката, трябва да погледнете абсолютното число на коефициента (всяка сфера на дейност има своя собствена скала).

За корелационен анализ на няколко параметъра (повече от 2) е по-удобно да използвате "Анализ на данни" (добавка "Пакет за анализ"). В списъка трябва да изберете корелация и да посочите масив. Всичко.

Получените коефициенти ще бъдат показани в корелационната матрица. Като този:

Корелационно-регресионен анализ

На практика тези две техники често се използват заедно.

Пример:


Сега данните от регресионния анализ са видими.