엔지니어링 문제를 해결하기 위해 수치적 방법을 사용합니다. 비선형 회귀 방정식 포물선 회귀 모델

거듭제곱 회귀

거듭제곱 함수의 형식은 y = bx a 입니다. 이 함수를 선형 형식으로 가져옵니다. 이를 위해 두 부분의 로그를 취합니다. . = y * , = x * , = b * 라고 하면 y * = ax * + b * 입니다. a 와 b * 라는 두 개의 매개변수를 찾아야 합니다. 이를 위해 우리는 함수 i * - (ax i * +b *)) 2 를 구성하고 괄호 i * - ax i * - b *) 2 를 열고 시스템을 구성합니다.

A = i * , B = i * , C = i * x i * , D = i *2 라고 하면 시스템은 aD + bA = C 형식을 취합니다.

우리는 Cramer 방법으로 선형 대수 방정식 시스템을 풀고 매개 변수 a와 b *의 원하는 값을 찾습니다.

테이블. 포인트가 있다

거듭제곱 함수의 매개변수를 계산하는 방법을 사용하여 다음을 얻습니다.

a = 1.000922, b = 1.585807. 변수의 지수는 대략 1과 같기 때문에 함수의 그래프는 직선처럼 보일 것입니다.

함수 그래프 y = 1.585807x 1.000922:

블록 다이어그램:

포물선 회귀

2차 함수의 형식은 y = ax 2 + bx + c이므로 n점의 좌표가 주어진다는 조건으로 a, b, c의 세 가지 매개변수를 찾아야 합니다. 이를 위해 우리는 함수 S \u003d i - (ax i 2 + bx i + c)) 2를 작성하고 대괄호 S \u003d i - ax i 2 - bx i - c) 2를 열고 시스템을 구성합니다.


우리는 Cramer 방법으로 선형 대수 방정식 시스템을 풀고 매개 변수 a, b 및 c의 원하는 값을 찾습니다.

테이블. 포인트가 있습니다:

이차 함수의 매개변수를 계산하는 방법을 사용하여 다음을 얻습니다.

a = 0.5272728 , b = -5.627879 , c = 14.87333.

함수 그래프 y = 0.5272728x 2 - 5.627879x + 14.87333:

블록 다이어그램

f(x)=0 형식의 방정식의 해

f(x) = 0 형식의 방정식은 한 변수의 비선형 대수 방정식으로, 여기서 함수 f(x)는 유한 또는 무한 간격 a에서 정의되고 연속적입니다.< x < b. Всякое значение C???, обращающее функцию f(x) в ноль, называется корнем уравнения f(x) = 0. Большинство алгебраических 비선형 방정식 f(x) = 0 형식은 분석적으로(즉, 정확하게) 풀 수 없으므로 실제로는 수치적 방법을 사용하여 근을 찾는 경우가 많습니다.

방정식의 근을 수치적으로 찾는 문제는 두 단계로 구성됩니다. 루트의 하나의 값을 포함하는 고려된 영역의 그러한 이웃을 찾고 루트의 정제, 즉 이 지역에서 주어진 정확도로 계산합니다.

서비스 할당. 이 온라인 계산기를 사용하여 비선형 회귀 방정식(지수, 지수, 등변 쌍곡선, 로그, 지수)의 매개변수를 찾을 수 있습니다(예제 참조).

지침. 소스 데이터의 양을 지정합니다. 결과 솔루션은 Word 파일에 저장됩니다. 솔루션 템플릿도 Excel에서 자동으로 생성됩니다. 메모: 포물선 의존성 매개변수(y = ax 2 + bx + c)를 결정해야 하는 경우 분석 정렬 서비스를 사용할 수 있습니다.
Irwin 방법이나 3시그마의 법칙을 통해 관찰의 비정상적인 대상을 제거함으로써 동질적인 단위 집합을 제한하는 것이 가능합니다(설명 요인의 값이 평균에서 표준의 3배 이상 벗어나는 단위를 제거합니다. 편차).

비선형 회귀 유형

여기에서 ε은 설명되지 않은 모든 요인의 영향을 반영하는 무작위 오류(편차, 섭동)입니다.

1차 회귀 방정식쌍별 선형 회귀 방정식입니다.

2차 회귀 방정식이것은 2차 다항식 회귀 방정식입니다: y = a + bx + cx 2 .

3차 회귀 방정식각각 3차 다항식 회귀 방정식: y = a + bx + cx 2 + dx 3 .

비선형 종속성을 선형 종속성으로 가져오기 위해 선형화 방법이 사용됩니다(정렬 방법 참조).

  1. 변수의 변경.
  2. 방정식의 양변에 대한 로그입니다.
  3. 결합.
y = f(x)변환선형화 방법
y = b x aY = 로그(y); X = 로그(x)로그
y = b e axY = 로그(y); X=x결합
y = 1/(ax+b)Y = 1/y; X=x변수의 변경
y = x/(ax+b)Y=x/y; X=x변수의 변경. 예시
y = aln(x)+bY=y; X = 로그(x)결합
y = a + bx + cx2x 1 = x; x2 = x2변수의 변경
y = a + bx + cx2 + dx3x 1 = x; x 2 \u003d x 2; x 3 = x 3변수의 변경
y = a + b/xx 1 = 1/x변수의 변경
y = a + 제곱근(x)bx 1 = 제곱근(x)변수의 변경
예시. 해당 테이블에서 가져온 데이터에 따라 다음을 수행합니다.
  1. 상관 필드를 만들고 연결 형태에 대한 가설을 세웁니다.
  2. 선형, 거듭제곱, 지수, 반대수, 역, 쌍곡선 쌍 회귀 방정식의 매개변수를 계산합니다.
  3. 상관 관계 및 결정 지표를 사용하여 관계의 견고성을 평가합니다.
  4. 평균(일반) 탄성 계수를 사용하여 요인과 결과 간의 관계 강도에 대한 비교 평가를 제공합니다.
  5. 평균 근사 오차를 사용하여 방정식의 품질을 추정합니다.
  6. Fisher의 F-검정을 사용하여 회귀 모델링 결과의 통계적 신뢰성을 평가합니다. 단락에서 계산된 특성 값에 따라. 4, 5 및 이 단락에서 가장 좋은 회귀 방정식을 선택하고 그 근거를 제시하십시오.
  7. 요인의 예측값이 평균 수준의 15%만큼 증가하면 결과의 예측값을 계산합니다. 유의 수준 α=0.05에 대한 예측의 신뢰 구간을 결정합니다.
  8. 얻은 결과를 평가하고 분석 노트에 결론을 내립니다.
년도가계의 실제 최종 소비 (현재 가격), 10 억 루블 (1995 - 조 루블), y인구의 1인당 평균 현금 수입(월), 문지름. (1995 - 천 루블), x
1995 872 515,9
2000 3813 2281,1
2001 5014 3062
2002 6400 3947,2
2003 7708 5170,4
2004 9848 6410,3
2005 12455 8111,9
2006 15284 10196
2007 18928 12602,7
2008 23695 14940,6
2009 25151 16856,9

해결책. 계산기에서 선택 비선형 회귀 유형. 우리는 다음 표를 얻습니다.
지수 회귀 방정식은 y = a e bx입니다.
선형화 후 다음을 얻습니다. ln(y) = ln(a) + bx
경험적 회귀 계수를 얻습니다. b = 0.000162, a = 7.8132
회귀 방정식: y = e 7.81321500 e 0.000162x = 2473.06858e 0.000162x

거듭제곱 회귀 방정식의 형식은 y = a x b입니다.
선형화 후 다음을 얻습니다. ln(y) = ln(a) + b ln(x)
경험적 회귀 계수: b = 0.9626, a = 0.7714
회귀 방정식: y = e 0.77143204 x 0.9626 = 2.16286x 0.9626

쌍곡선 회귀 방정식은 y = b/x + a + ε입니다.
선형화 후 다음을 얻습니다. y=bx + a
경험적 회귀 계수: b = 21089190.1984, a = 4585.5706
경험적 회귀 방정식: y = 21089190.1984 / x + 4585.5706

대수 회귀 방정식의 형식은 y = b ln(x) + a + ε입니다.
경험적 회귀 계수: b = 7142.4505, a = -49694.9535
회귀 방정식: y = 7142.4505 ln(x) - 49694.9535

지수 회귀 방정식의 형식은 y = a b x + ε입니다.
선형화 후 다음을 얻습니다. ln(y) = ln(a) + x ln(b)
경험적 회귀 계수: b = 0.000162, a = 7.8132
y = 전자 7.8132 * 전자 0.000162x = 2473.06858*1.00016x

엑스와이1/x로그(x)학의 뜻)
515.9 872 0.00194 6.25 6.77
2281.1 3813 0.000438 7.73 8.25
3062 5014 0.000327 8.03 8.52
3947.2 6400 0.000253 8.28 8.76
5170.4 7708 0.000193 8.55 8.95
6410.3 9848 0.000156 8.77 9.2
8111.9 12455 0.000123 9 9.43
10196 15284 9.8E-59.23 9.63
12602.7 18928 7.9E-59.44 9.85
14940.6 23695 6.7E-59.61 10.07
16856.9 25151 5.9E-59.73 10.13

선형 회귀

선형 회귀 방정식은 확률 변수 X와 Y 간의 관계를 근사화(대략적으로 설명)하는 직선 방정식입니다.

임의의 2차원 변수(X, Y)를 고려합니다. 여기서 -- 종속 랜덤 변수. 수량 중 하나를 다른 하나의 함수로 나타냅니다. 우리는 수량 X의 선형 함수로서 수량의 대략적인 표현으로 우리 자신을 제한합니다.

결정될 매개변수는 어디에 있습니다. 할 수 있다 다른 방법들: 가장 일반적인 방법은 최소제곱법입니다. 함수 g(x)를 X에 대한 Y의 rms 회귀라고 합니다. 함수 g(x)를 X에 대한 Y의 rms 회귀라고 합니다.

여기서 F는 총 제곱 편차입니다.

편차 제곱의 합이 최소가 되도록 및 b를 선택합니다. F가 최소값에 도달하는 계수와 b를 찾기 위해 편도함수를 0으로 동일시합니다.

우리는 및 b를 찾습니다. 기본 변환을 수행한 후 및 b에 대한 두 개의 선형 방정식 시스템을 얻습니다.

표본 크기는 어디에 있습니까?

우리의 경우 A = 3888; B=549; C=8224; D = 1182, N = 100

이 선형에서 a와 b를 구합시다. 1,9884에 대한 고정 포인트를 받게 됩니다. 0.8981.

따라서 방정식은 다음과 같은 형식을 취합니다.

y = 1.9884x + 0.8981


쌀. 십

포물선 회귀

관측 데이터를 기반으로 평균 제곱근(이 경우 포물선) 회귀 곡선의 샘플 방정식을 찾아보겠습니다. 최소 제곱법을 사용하여 p, q, r을 결정합시다.

우리는 Y를 X의 포물선 함수로 나타내는 것으로 제한합니다.

여기서 p, q 및 r은 결정될 매개변수입니다. 이것은 최소 자승법을 사용하여 수행할 수 있습니다.

제곱 편차의 합이 최소가 되도록 매개변수 p, q 및 r을 선택합니다. 각 편차는 구하는 매개변수에 따라 달라지므로 제곱 편차의 합도 다음 매개변수의 함수 F입니다.

최소값을 찾기 위해 해당 편도함수를 0과 동일시합니다.

p, q 및 r을 찾습니다. 기본 변환을 수행한 후 p, q 및 r에 대한 3개의 선형 방정식 시스템을 얻습니다.

방법으로 이 시스템 풀기 역행렬, 우리는 다음을 얻습니다. p = -0.0085; q = 2.0761;

따라서 포물선 회귀 방정식은 다음과 같은 형식을 취합니다.

y = -0.0085x2 + 2.0761x + 0.7462

포물선 회귀를 플롯해 보겠습니다. 관찰의 편의를 위해 회귀 플롯은 산점도의 배경에 대해 표시됩니다(그림 13 참조).


쌀. 13

이제 시각적 비교를 위해 선형 회귀 및 포물선 회귀 선을 동일한 차트에 표시해 보겠습니다(그림 14 참조).


쌀. 십사

선형 회귀는 빨간색으로 표시되고 포물선 회귀는 파란색으로 표시됩니다. 다이어그램은 이 경우의 차이가 두 개의 선형 회귀선을 비교할 때보다 더 크다는 것을 보여줍니다. 어떤 회귀가 x와 y 사이의 관계를 가장 잘 표현하는지, 즉 x와 y 사이의 관계 유형에 대한 추가 연구가 필요합니다.

경우에 따라 좌표 다이어그램을 사용하여 시각화한 통계 모집단의 경험적 데이터는 요인의 증가가 결과의 놀라운 증가를 동반함을 보여줍니다. 이러한 종류의 기능 상관 관계에 대한 이론적 설명을 위해 2차 포물선 회귀 방정식을 사용할 수 있습니다.

여기서, 는 요인의 영향이 완전히 격리된 조건(х=0)에서 유효 특성의 평균값을 나타내는 매개변수입니다. - 각 단위에 대한 부호 계수의 절대 증가 조건에서 결과 변화의 비례 계수; c는 요인의 각 단위에 대한 유효 특성의 성장 가속(감속) 계수입니다.

매개변수 계산의 기초를 가정하고 최소 제곱 방법으로 순위가 매겨진 계열의 중앙값을 조건부로 받아들이면 Σх=0, Σх 3 =0이 됩니다. 이 경우 단순화 된 형식의 방정식 시스템은 다음과 같습니다.

이 방정식에서 매개변수 , , c를 찾을 수 있습니다. 일반보기다음과 같이 작성할 수 있습니다.

(11.20)

(11.22)

이것은 매개변수 , 를 결정하기 위해 Σ y, Σ xy, Σ x 2, Σ x 2 y, Σ x 4 값을 계산할 필요가 있음을 보여줍니다. 이를 위해 테이블 ​​레이아웃을 사용할 수 있습니다. 11.9.

30개의 농업 조직에서 모든 파종 면적 및 작물 수확량(총 수확량)의 구조에서 감자 작물의 비율에 대한 데이터가 있다고 가정합니다. 이 지표들 사이의 상관 관계 방정식을 작성하고 해결할 필요가 있습니다.

표 11.9. 방정식에 대한 보조 지표 계산

포물선 회귀

아니요. 엑스 ~에 x 2 x 2 년 x 4
x 1 1 x 1 y 1
x 2 2시에 x 2 y 2
N x n n에 x n y n
Σ Σx 쨔이 Σ후 Σх 2 Σx 2 y ∑x4

상관 필드의 그래픽 표현은 연구된 지표가 2차 포물선에 접근하는 선에 의해 경험적으로 상호 연결되어 있음을 보여주었습니다. 따라서 원하는 포물선 회귀 방정식의 일부로 필요한 매개변수 , , s의 계산은 표의 레이아웃을 사용하여 수행됩니다. 11.10.

표 11.10. 방정식에 대한 보조 데이터 계산

포물선 회귀

아니요. X, % y, 천 톤 x 2 x 2 년 x 4
1,0 5,0 5,0 1,0 5,0 1,0
1,5 7,0 10,5 2,3 15,8 5,0
N 8,0 20,0 160,0 64,0
Σ

대리자 특정 값Σ y=495, Σ xy=600, Σ x 2 =750, Σ x 2 y=12375, Σ x 4 =18750, 표에 나와 있습니다. 11.10, 식 (11.20), (11.21), (11.22). 얻다

따라서 영향을 나타내는 포물선 회귀 방정식은 비중농업 조직의 작물 수확 (총 수확)을 위해 파종 된 지역의 구조에서 감자 작물의 형태는 다음과 같습니다.

(11.23)

방정식 11.23은 주어진 조건에서 샘플링 프레임감자 (10,000 센트)의 평균 수확량 (총 수확량)은 연구 된 요인의 영향없이 얻을 수 있습니다. 파종 된 지역의 구조에서 작물의 비율 증가, 즉. 작물의 비중 변동이 감자 수확량에 영향을 미치지 않는 조건(x=0). 매개변수(비례 계수) β = 0.8은 작물 몫의 각 백분율 증가가 평균 0.8천 톤의 수확량 증가를 제공한다는 것을 보여주고 매개변수 c = 0.1은 수확량 증가가 1%(제곱)임을 나타냅니다. 평균 0.1,000톤의 감자에 의해 가속화되었습니다.

회귀 및 상관 분석 - 통계 연구 방법. 이것은 하나 이상의 독립 변수에 대한 매개변수의 종속성을 표시하는 가장 일반적인 방법입니다.

아래에서 구체적인 실제 사례를 사용하여 경제학자들 사이에서 매우 인기 있는 이 두 가지 분석을 고려할 것입니다. 우리는 또한 그것들을 결합했을 때 결과를 얻는 예를 제공 할 것입니다.

Excel의 회귀 분석

종속 변수에 대한 일부 값(독립, 독립)의 영향을 보여줍니다. 예를 들어, 경제 활동 인구의 수가 기업 수, 임금 및 기타 매개변수에 따라 어떻게 달라지는지. 또는: 외국인 투자, 에너지 가격 등이 GDP 수준에 어떤 영향을 미치는지.

분석 결과를 통해 우선 순위를 지정할 수 있습니다. 그리고 주요 요소를 기반으로 예측하고 우선 순위 영역의 개발을 계획하고 관리 결정을 내립니다.

회귀 발생:

  • 선형(y = a + bx);
  • 포물선(y = a + bx + cx 2);
  • 지수(y = a * exp(bx));
  • 거듭제곱(y = a*x^b);
  • 쌍곡선(y = b/x + a);
  • 대수(y = b * 1n(x) + a);
  • 지수(y = a * b^x).

Excel에서 회귀 모델을 작성하고 결과를 해석하는 예를 고려하십시오. 선형 유형의 회귀를 살펴보겠습니다.

작업. 6개 기업에서 월평균 그리고 퇴직한 직원의 수. 평균 급여에 대한 퇴직 직원 수의 의존성을 결정할 필요가 있습니다.

선형 회귀 모델의 형식은 다음과 같습니다.

Y \u003d a 0 + a 1 x 1 + ... + a k x k.

여기서 는 회귀 계수, x는 영향을 미치는 변수, k는 요인 수입니다.

이 예에서 Y는 퇴직 근로자의 지표입니다. 영향을 미치는 요소는 임금(x)입니다.

Excel에는 선형 회귀 모델의 매개변수를 계산하는 데 사용할 수 있는 기본 제공 함수가 있습니다. 그러나 Analysis ToolPak 추가 기능을 사용하면 더 빠르게 작업을 수행할 수 있습니다.

강력한 분석 도구 활성화:

활성화되면 데이터 탭에서 추가 기능을 사용할 수 있습니다.

이제 우리는 회귀 분석을 직접 다룰 것입니다.



우선, 우리는 R-제곱과 계수에 주목합니다.

R-제곱은 결정 계수입니다. 이 예에서는 0.755 또는 75.5%입니다. 이는 모델의 계산된 매개변수가 연구된 매개변수 간의 관계를 75.5% 설명한다는 것을 의미합니다. 결정 계수가 높을수록 더 좋은 모델입니다. 양호 - 0.8 이상. 나쁨 - 0.5 미만(이러한 분석은 합리적인 것으로 간주될 수 없음). 우리의 예에서 - "나쁘지 않음".

계수 64.1428은 고려 중인 모델의 모든 변수가 0인 경우 Y가 무엇인지 보여줍니다. 즉, 모델에 설명되지 않은 다른 요인도 분석된 매개변수의 값에 영향을 미칩니다.

계수 -0.16285는 Y에 대한 변수 X의 가중치를 보여줍니다. 즉, 이 모델 내의 평균 월 급여는 가중치가 -0.16285(작은 영향 정도)로 퇴직자 수에 영향을 미칩니다. "-"기호는 부정적인 영향을 나타냅니다. 급여가 높을수록 퇴직이 적습니다. 공정합니다.



Excel의 상관관계 분석

상관 분석은 하나 또는 두 개의 샘플에서 지표 사이에 관계가 있는지 여부를 확인하는 데 도움이 됩니다. 예를 들어, 기계의 작동 시간과 수리 비용 사이, 장비 가격과 작동 기간, 어린이의 키와 체중 등.

관계가 있는 경우 한 매개변수의 증가가 다른 매개변수의 증가(양의 상관관계) 또는 감소(음의)로 이어지는지 여부. 상관 분석은 분석가가 한 지표의 값이 다른 지표의 가능한 값을 예측할 수 있는지 여부를 결정하는 데 도움이 됩니다.

상관 계수는 r로 표시됩니다. +1에서 -1까지 다양합니다. 다른 영역에 대한 상관 관계의 분류는 다를 것입니다. 계수 값이 0이면 샘플 간에 선형 관계가 없습니다.

Excel을 사용하여 상관 계수를 찾는 방법을 고려하십시오.

CORREL 함수는 쌍을 이루는 계수를 찾는 데 사용됩니다.

작업: 선반의 작동 시간과 유지 관리 비용 사이에 관계가 있는지 확인합니다.

커서를 아무 셀에 놓고 fx 버튼을 누릅니다.

  1. "통계" 범주에서 CORREL 기능을 선택합니다.
  2. 인수 "배열 1" - 값의 첫 번째 범위 - 기계 시간: A2: A14.
  3. 인수 "Array 2" - 값의 두 번째 범위 - 수리 비용: B2:B14. 확인을 클릭합니다.

연결 유형을 결정하려면 계수의 절대 수를 확인해야 합니다(각 활동 필드에는 자체 척도가 있습니다).

여러 매개변수(2개 이상)의 상관관계 분석을 위해서는 "데이터 분석"("분석 패키지" 추가 기능)을 사용하는 것이 더 편리합니다. 목록에서 상관관계를 선택하고 배열을 지정해야 합니다. 모두.

결과 계수는 상관 행렬에 표시됩니다. 이 같은:

상관-회귀 분석

실제로 이 두 기술은 종종 함께 사용됩니다.

예시:


이제 회귀 분석 데이터가 표시됩니다.