Решение задач и выполнение научно-исследовательских разработок: Отправьте запрос сейчас: irina@bodrenko.org    
математика, IT, информатика, программирование, статистика, биостатистика, экономика, психология
Решение задач: по математике, IT, экономике, психологии




 Регрессионный анализ Нефть и газ Методы SEO оптимизации SEO оптимизация Компьютерные науки Математика и информатика Векторный и тензорный анализ Теория игр Аналитическая геометрия и линейная алгебра Дифференциальная геометрия и топология Дополнительные главы дифференциальной геометрии Bodrenko.com Bodrenko.org © 2008-2018 Bodrenko.org: Irina I. Bodrenko. All rights reserved.
© 2008-2018 Bodrenko.org: Ирина Ивановна Бодренко. Все права защищены

Bodrenko.org

Bodrenko.com
Bodrenko.org

Учебные дисциплины на сайте Bodrenko.org
Портабельные Windows-приложения на сайте Bodrenko.com
Методы SEO оптимизации - SEO оптимизация - "Геометрические методы математической физики" Компьютерные науки Математика и информатика Векторный и тензорный анализ Теория игр Аналитическая геометрия и линейная алгебра Римановы многообразия Элементы вариационного исчисления Дифференциальная геометрия и топология "Геометрия подмногообразий" Дополнительные главы дифференциальной геометрии "Дифференциальные уравнения на многообразиях" "Дифференциальная геометрия и топология кривых" Bodrenko.com Bodrenko.org


ПРИЛОЖЕНИЕ 1 1.РEГРЕССИОННЫЙ АНАЛИЗ ПАРАМЕТРОВ ПРОЦЕССА СЕПАРАЦИИ
В ПРОМЫСЛОВЫХ АППАРАТАХ
Исследование состава газа, выделившегося на каждой ступени разгазирования при дифразгазировании пластовой нефти на скважинах 11041, 523 и 11047 Урмышлинского месторождения, бобриковского горизонта.

1.1. Регрессионные математические модели

Регрессией называется зависимость некоторой случайной величины Y от одной случайной (или неслучайной) величины X или от нескольких величин. Если, например, при каждом значении величины X=x_i наблюдается n_i значений y_i1, ..., y_in_i случайной величины Y, то зависимость средних арифметических y_i = y_i 1, ..., y_i n_i n_i этих значений от x_i и является регрессией в статистическом понимании этого термина. В зависимости от природы задачи и целей анализа результаты эксперимента (x_1, y_1),..., (x_n, y_n) по-разному интерпретируются в отношении переменной X. Для установления связей между величинами в эксперименте используется модель, основанная на упрощенных допущениях: величина X является контролируемой величиной, значения которой заранее задаются при планировании эксперимента, а наблюдаемые значения Y представимы в виде y_i = f(x_i, alpha) + epsilon_i, i=1,..., n. где величины epsilon_i характеризуют ошибки, независимые при различных измерениях и одинаково распределенные с нулевым средним и постоянной дисперсией. В случае неконтролируемой переменной X результаты наблюдений (x_1, y_1),..., (x_n, y_n) представляют собой выборку из некоторой двумерной совокупности. Исследование регрессии по экспериментальным данным проводится методами, основанными на принципах средней квадратической регрессии. Регрессионный анализ содержит следующие этапы: 1. Выбор модели регрессии, что заключает в себе определение типа функции регрессии f(x,alpha). 2. Оценка параметров alpha в выбранной модели методом наименьших квадратов. 3. Проверка статистических гипотез о регрессии. Наиболее естественной с точки зрения единого метода оценки неизвестных параметров является модель регрессии, линейная относительно этих параметров: f(x, alpha) = alpha_0 f_0(x) + ... + alpha_m f_m(x). Выбор функций f_j(x), j=1,..., m, иногда определяется по расположению экспериментальных значений (x_i, y_i) на диаграмме рассеяния, но чаще --- теоретическими соображениями. При выборе типа регрессии определяют форму зависимости между величинами X и Y. Прямая регрессия появляется при условии, что с уменьшением или увеличением величины X значения величины Y также соответственно уменьшаются или увеличиваются. Обратная регрессия возникает, если при уменьшении или увеличении величины X величина Y увеличивается или уменьшается соответственно. Стандартный метод оценки регрессии основан на использовании многочлена некоторой степени m, 1<= m < n: f(x,alpha) = alpha_0 + alpha_1 x+ ... + alpha_m x^m. Для оценки неизвестных параметров регрессии alpha_0, ..., alpha_m используется метод наименьших квадратов Согласно этому методу в качестве статистических оценок параметров alpha_0, ..., alpha_m выбираются такие значения alpha_0, ..., alpha_m, которые минимизируют функцию S(alpha_0, ..., alpha_m) = Sum_i=1^n (f_(x_i,alpha) - y_i)^2. Многочлен f(x) = alpha_0 + alpha_1 x+ ... + alpha_m x^m, построенный методом наименьших квадратов, называется эмпирической линией регрессии и является статистической оценкой неизвестной истинной линии регрессии.

1.2. Нелинейные однофакторные регрессионные модели.

1.2.1. Параболическая модель второй степени.

Пусть между переменными X и Y существует параболическая корреляционная зависимость вида Y_x = a_0 + a_1x + a_2 x^2. (1.1) Подберем параметры a_0, a_1, a_2 в уравнении параболической регрессии (1.1) так, чтобы точки (x_1,y_1), ... , (x_n, y_n), построенные по данным наблюдений, лежали как можно ближе к параболе (1.1). Назовем отклонением разность Y_i- y_i, i = 1, 2, ..., n где Y_i --- вычисленная по уравнению (1.1) ордината, соответствующая наблюдаемому значению x_i, y_i --- наблюдаемая ордината, соответствующая x_i. Подберем параметры a_0, a_1, a_2 так, чтобы сумма квадратов отклонений была минимальной (в этом состоит сущность метода наименьших квадратов). Так как каждое отклонение зависит от отыскиваемых параметров, то и сумма квадратов отклонений есть функция S этих параметров: S(a_0, a_1, a_2)= Sum_i=1^n(Y_i - y_i)^2, или S(a_0, a_1, a_2)= Sum_i=1^n(a_0 + a_1 x_i + a_2 x_i^2 - y_i)^2. Необходимое условие экстремума функции трех независимых переменных состоит в равенстве нулю частных производных этой функции по каждой из переменных: d S/d a_0 = 0, d S/d a_1 = 0, d S/d a_2 = 0. Вычисляя частные производные функции S и проводя алгебраические преобразования, получаем следующую систему линейных уравнений относительно неизвестных a_0, a_1, a_2: n a_0+a_1 Sum_i=1^n x_i + a_2 Sum_i=1^n x_i^2=Sum_i=1^n y_i, a_0 Sum_i=1^n x_i+ a_1 Sum_i=1^n x_i^2 + a_2 Sum_i=1^n x_i^3 =Sum_i=1^n x_iy_i, (1.2) a_0 Sum_i=1^n x_i^2 + a_1 Sum_i=1^n x_i^3 + a_2 Sum_i=1^n x_i^4=Sum_i=1^n x_i^2 y_i. Показатель средней ошибки аппроксимации epsilon вычисляется по формуле: epsilon = 1/nSum_i=1^n |Y_i - y_i|/y_i *100%. (1.3) Практика показывает, что применение указанного критерия является достаточно надежным способом отбора адекватных математических моделей, при этом значение ошибки аппроксимации не должно превышать 12 --- 15%.

1.2.2. Пример расчета параметров уравнения параболической регрессии.

Пусть контролируемая величина X --- давление в сепараторе, случайная величина Y описывает остаточное газосодержание нефти на выходе из сепаратора. Обозначим через x_1,..., x_n наблюдаемые значения факторного признака X, а через y_1, ..., y_n --- наблюдаемые соответствующие значения результативного признака Y. По данным n =5 наблюдений, взятых из таблицы 2.3, составим следующую корреляционную таблицу:

X 0,135 0,130 0,120 0,115 0,100
Y 0,62 0,54 0,31 0,34 0,46

Параметры уравнения регрессии --- это величины a_0, a_1, a_2. Они являются решением системы нормальных уравнений (1.2). Для нахождения коэффициентов системы (1.2) составим следующую таблицу.

x_i y_i x_i^2 x_i^3 x_i^4 x_iy_i x_i^2y_i
0,135 0,62 0,018225 0,002460375 0,000332150625 0,0837 0,0112995
0,130 0,54 0,0169 0,002197 0,00028561 0,0702 0,009126
0,120 0,31 0,0144 0,001728 0,00020736 0,0372 0,004464
0,115 0,34 0,013225 0,001520875 0,0001749006250,0391 0,0044965
0,100 0,46 0,01 0,001 0,0001 0,046 0,0046
Sum_i=1^5 x_i= Sum_i=1^5 y_i= Sum_i=1^5 x_i^2= Sum_i=1^5 x_i^3= Sum_i=1^5 x_i^4= Sum_i=1^5 x_i y_i= Sum_i=1^5 x_i^2 y_i=
0,6 2,27 0,07275 0,00890625 0,00110002125 0,2762 0,033986

Следовательно, система нормальных уравнений (1.2) для данных наблюдений будет иметь следующий вид:

5 a_0+ 0,6 a_1 + 0,07275 a_2 = 2,27
0,6 a_0 + 0,07275 a_1 + 0,00890625 a_2 = 0,2762 ,
0,07275 a_0 + 0,00890625 a_1 + 0,00110002125 a_2 = 0,033986.

Будем решать полученную систему трех уравнений с тремя неизвестными методом Гаусса. Для этого рассмотрим расширенную матрицу A, в которую, помимо коэффициентов при неизвестных, включен стоблец свободных членов: A=

5 0,6 0,07275 2,27
0,60,07275 0,00890625 0,2762
0,07275 0,00890625 0,00110002125 0,033986

Разделим первое уравнение на 5, чтобы сделать коэффициент при a_0 равным 1. Далее умножим первую строку полученной матрицы на -0,6 и сложим со второй строкой, а затем --- на -0,07275 и сложим с третьей строкой. Получим матрицы:

5 0,6 0,07275 2,27
0,60,07275 0,00890625 0,2762
0,07275 0,00890625 0,00110002125 0,033986

и

1 0,12 0,01455 0,454
0 0,00075 0,00017625 0,0038
0 0,00017625 0,00004150875 0,0009575

Далее, так как в полученной системе во втором уравнении коэффициент при неизвестном a_1 равен 0,00075\ne 1, разделим вторую строку на 0,00075, а затем умножим ее на -0,00017625 и сложим с третьей строкой. Получим матрицы:

1 0,12 0,01455 0,454
0 0,00075 0,00017625 0,0038
0 0,00017625 0,00004150875 0,0009575

и

1 0,12 0,01455 0,454
0 1 0,235 5,0666667
0 0 0,00000009 0,0000645

Отсюда, методом обратного хода получим систему равенств: a_2 = 716,6666667, a_1 = - 163,17, a_0 = 9,6069. Уравнение регрессии имеет вид: Y = 9,6069 - 163,17 x + 716,6666667 x^2. (1.4) Оценим, насколько адекватна построенная модель эмпирическим данным. Для этого вычислим значения Y_i по формуле (1.4) для всех x_i (i= 1,..., 5) и сравним полученные результаты. Соответствующие вычисления проведем в следующей таблице:

x_i y_i Y_i Delta_i = y_i - Y_i |Delta_i|/y_i
0,135 0,62 0,6402 - 0,0202 0,0326
0,130 0,54 0,5065 0,0335 0,0620
0,120 0,31 0,3465 - 0,0365 0,1177
0,115 0,34 0,3203 0,0197 0,0579
0,100 0,46 0,4566 0,0034 0,0074

Подставим значения, полученные в последнем столбце таблицы, в формулу (1.3). Мы находим: epsilon = 1/5*Sum_i=1^5 |Y_i - y_i|/y_i *100% =1/5*(0,0326 +0,0620 + 0,1177 + 0,0579 +0,0074) 100% ~ 5,55%. Таким образом, построенная модель является точной. 1.1.5. Однофакторная гиперболическая модель регрессии.

Пусть между переменными X и Z существует гиперболическая корреляционная зависимость вида Z = b_0 + b_1/x. (1.5) Воспользуемся методом наименьших квадратов для определения значений параметров b_0, b_1 в уравнении гиперболической регрессии (1.5). Необходимо, чтобы точки (x_1, z_1), ... , (x_n, z_n), построенные по данным наблюдений, лежали как можно ближе к гиперболе (1.5). Сущность метода наименьших квадратов заключается в нахождении параметров модели b_0, b_1, при которых минимизируется функция S, равная сумме квадратов отклонений эмпирических, т.е. фактически наблюдаемых значений результативного признака Z от теоретических, полученных по выбранному уравнению регрессии (1.5): S(b_0,b_1) =Sum_i=1^n(Z_i - z_i)^2 = Sum_i=1^n(b_0 + b_1/(x_i- z_i))^2 ---> min, где через Z_i обозначены теоретические значения результативного признака, вычисленные по формуле (1.5) для соответствующих значений x_i факторного признака, т.е. Z_i = b_0 + b_1/x_i. Необходимым условием существования экстремума функции двух независимых переменных является обращение в нуль ее частных производных первого порядка по каждой из переменных: \frac d S d b_0 = 0, \frac d S d b_1 = 0. Вычисляя частные производные функции S(b_0, b_1)= Sum_i=1^n(b_0 + b_1/(x_i- z_i))^2, получим d S/ d b_0 = 2 Sum_i=1^n (b_0 + b_1/(x_i- z_i)) = 0, d S/ d b_1 = 2 Sum_i=1^n (b_0 + b_1/(x_i- z_i))*1/x_i = 0. Проводя алгебраические преобразования, получим систему нормальных уравнений относительно неизвестных b_0, b_1: n b_0+ b_1 Sum_i=1^n 1/x_i =Sum_i=1^n z_i, b_0 Sum_i=1^n 1/x_i+ b_1 Sum_i=1^n 1/x_i^2 =Sum_i=1^n z_i/x_i. (1.6)

1.1.6. Пример расчета параметров уравнения гиперболической регрессии.

Пусть контролируемая величина X --- это давление в сепараторе, а величина Z выражает капельный унос нефти газом. Обозначим через x_1,..., x_n наблюдаемые значения факторного признака X, а через z_1, ..., z_n --- наблюдаемые соответствующие значения результативного признака Z. Используя таблицу 2.3, построим корелляционную таблицу для величин X и Z:

X 0,135 0,130 0,120 0,115
Z 0,243 0,261 0,294 0,342

Так как при снижении давления в сепараторах происходит повышение капельного уноса нефти газом, и наоборот, с увеличением давления унос капельной нефти уменьшается, то применяется обратная регрессия вида (1.5). Для нахождения параметров b_0, b_1 вычислим коэффициенты системы (1.6) в следующей таблице.

x_i z_i 1/x_i 1/x_i^2 z_i/x_i
0,135 0,243 7,4074074 54,8696845 1,8
0,130 0,261 7,6923077 59,1715976 2,0076923
0,120 0,294 8,3333333 69,4444444 2,45
0,115 0,342 8,6956522 75,6143667 2,9739131
Sum_i=1^4 x_i= Sum_i=1^4 z_i= Sum_i=1^4 1/x_i= Sum_i=1^4 1/x_i^2= Sum_i=1^4 z_i/x_i=
0,5 1,14 32,1286704 259,1000932 9,2316054

Запишем в систему (1.6) полученные значения коэффициентов:

4 b_0+ 32,1286704 b_1 = 1.14 ,
32,1286704 b_0 + 259,1000932 b_1 = 9,2316054.

Для нахождения неизвестных b_0, b_1 вычислим определители D=

4 32,1286704
32,1286704 259,1000932

= 4,1489, D_1=

1,14 32,1286704
9,2316054 259,1000932

= -1,2251, D_2=

4 1,14
32,1286704 9,2316054

= 0,299738. Тогда b_0 = D_1/D= -1,2251/4,1489= -0,295283, b_1 = D_2/D= 0,299789/4,1489= 0,0711713. Таким образом, эмпирическая линия регрессии будет иметь следующий вид: Z = -0,295283 + 0,0711713*1/x. (1.7) Для оценки адекватности построенной модели эмпирическим данным вычислим значения Z_i по формуле (1.7) для всех x_i (i= 1,..., 4) и сравним полученные результаты. Соответствующие вычисления проведем в следующей таблице:

x_i z_i Z_i Delta_i = z_i - Z_i |Delta_i|/z_i
0,135 0,243 0,2319118 0,0110812 0,0456017
0,130 0,261 0,2521885 0,0088115 0,0337605
0,120 0,294 0,2978112 - 0,0038112 0,0129633
0,115 0,342 0,3235978 0,0184022 0,0538076

Вычислим показатель средней ошибки аппроксимации epsilon = 1/4*Sum_i=1^4 |Delta_i|/z_i *100%. (1.8) Подставляя данные, полученные в последнем столбце таблицы, в формулу (1.8), находим: epsilon = 1/4*(0,0456017 +0,0337605 + 0,0129633 + 0,0538076) 100% ~ 3,65%. Следовательно, построенная модель является точной, т.к. ошибка аппроксимации достаточно мала.

1.2.7. Параболическая модель третьей степени.

Пусть между переменными X и Y существует нелинейная корреляционная зависимость вида Y_x = a_0 + a_1x + a_2 x^2 + a_3 x^3. (1.9) Подберем параметры a_0, a_1, a_2, a_3 в уравнении параболической регрессии (1.9) так, чтобы точки (x_1,y_1), ... , (x_n, y_n), построенные по данным наблюдений, лежали как можно ближе к линии (1.9). Исходя из принципа наименьших квадратов, минимизируем функцию S(a_0, a_1, a_2, a_3)= Sum_i=1^n(a_0 + a_1 x_i + a_2 x_i^2 + a_3 x_i^3- y_i)^2. Необходимое условие экстремума функции S(a_0, a_1, a_2, a_3) состоит в равенстве нулю частных производных этой функции по каждой из переменных: d S/ d a_0 = 0, d S/ d a_1 = 0, d S/ d a_2 = 0, d S/ d a_3 = 0. Вычислим частные производные функции S: \frac d S d a_0 = 2Sum_i=1^n(a_0+a_1x_i + a_2x_i^2+a_3x_i^3 - y_i) = 0, \frac d S d a_1 = 2Sum_i=1^n(a_0+a_1x_i + a_2x_i^2+a_3x_i^3 - y_i)x_i = 0, \frac d S d a_2 = 2Sum_i=1^n(a_0+a_1x_i + a_2x_i^2+a_3x_i^3 - y_i)x_i^2 = 0, \frac d S d a_3 = 2Sum_i=1^n(a_0+a_1x_i + a_2x_i^2+a_3x_i^3 - y_i)x_i^3 = 0. Проводя алгебраические преобразования, отсюда получим следующую систему линейных уравнений относительно неизвестных a_0, a_1, a_2, a_3: n a_0+a_1 Sum_i=1^n x_i + a_2 Sum_i=1^n x_i^2 +a_3 Sum_i=1^n x_i^3 =Sum_i=1^n y_i, a_0 Sum_i=1^n x_i+ a_1 Sum_i=1^n x_i^2 + a_2 Sum_i=1^n x_i^3 + a_3 Sum_i=1^n x_i^4 =Sum_i=1^n x_iy_i, a_0 Sum_i=1^n x_i^2 + a_1 Sum_i=1^n x_i^3 + a_2 Sum_i=1^n x_i^4 + a_3 Sum_i=1^n x_i^5 =Sum_i=1^n x_i^2 y_i, a_0 Sum_i=1^n x_i^3 + a_1 Sum_i=1^n x_i^4 + a_2 Sum_i=1^n x_i^5 + a_3 Sum_i=1^n x_i^6 =Sum_i=1^n x_i^3 y_i (1.9) Решим систему (1.9) методом Крамера. Для этого вычислим следующие определители: D= \left| \beginarraycccc n Sum_i=1^n x_i Sum_i=1^n x_i^2 Sum_i=1^n x_i^3 Sum_i=1^n x_iSum_i=1^n x_i^2 Sum_i=1^n x_i^3 Sum_i=1^n x_i^4 Sum_i=1^n x_i^2Sum_i=1^n x_i^3Sum_i=1^n x_i^4Sum_i=1^n x_i^5 Sum_i=1^n x_i^3Sum_i=1^n x_i^4Sum_i=1^n x_i^5Sum_i=1^n x_i^6 \endarray \right|, D_0= \left| \beginarraycccc Sum_i=1^n y_i Sum_i=1^n x_i Sum_i=1^n x_i^2 Sum_i=1^n x_i^3 Sum_i=1^n x_iy^iSum_i=1^n x_i^2 Sum_i=1^n x_i^3 Sum_i=1^n x_i^4 Sum_i=1^n x_i^2y_iSum_i=1^n x_i^3Sum_i=1^n x_i^4Sum_i=1^n x_i^5 Sum_i=1^n x_i^3y_iSum_i=1^n x_i^4Sum_i=1^n x_i^5Sum_i=1^n x_i^6 \endarray \right|, D_1= \left| \beginarraycccc n Sum_i=1^n y_i Sum_i=1^n x_i^2 Sum_i=1^n x_i^3 Sum_i=1^n x_iSum_i=1^n x_iy_i Sum_i=1^n x_i^3 Sum_i=1^n x_i^4 Sum_i=1^n x_i^2Sum_i=1^n x_i^2y_iSum_i=1^n x_i^4Sum_i=1^n x_i^5 Sum_i=1^n x_i^3Sum_i=1^n x_i^3y_iSum_i=1^n x_i^5Sum_i=1^n x_i^6 \endarray \right|, D_2= \left| \beginarraycccc n Sum_i=1^n x_i Sum_i=1^n y_i Sum_i=1^n x_i^3 Sum_i=1^n x_iSum_i=1^n x_i^2 Sum_i=1^n x_iy_i Sum_i=1^n x_i^4 Sum_i=1^n x_i^2Sum_i=1^n x_i^3Sum_i=1^n x_i^2y_iSum_i=1^n x_i^5 Sum_i=1^n x_i^3Sum_i=1^n x_i^4Sum_i=1^n x_i^3y_iSum_i=1^n x_i^6 \endarray \right|, D_3= \left| \beginarraycccc n Sum_i=1^n x_i Sum_i=1^n x_i^2 Sum_i=1^n y_i Sum_i=1^n x_iSum_i=1^n x_i^2 Sum_i=1^n x_i^3 Sum_i=1^n x_iy_i Sum_i=1^n x_i^2Sum_i=1^n x_i^3Sum_i=1^n x_i^4Sum_i=1^n x_i^2y_i Sum_i=1^n x_i^3Sum_i=1^n x_i^4Sum_i=1^n x_i^5Sum_i=1^n x_i^3y_i \endarray \right|. Тогда a_0 = \fracD_0D, a_1 =\fracD_1D, a_2 =\fracD_2D, a_3 =\fracD_3D.

1.3. Многофакторные регрессионные модели

1.3.1. Проблема факторной размерности регрессионной модели

Наиболее часто в регрессионном анализе изучается парная регрессия. Корреляционную зависимость можно исследовать и комплексно при помощи множественной регрессии как связь между несколькими факторными признаками X_1, ..., X_k и одним результативным признаком Y. Но там, где это целесообразно, следует ограничиваться парной регрессией. Таким образом, одной из проблем построения регрессионной модели является ее размерность k, т.е. определение числа факторных признаков, включаемых в модель. Их число должно быть оптимальным. Исключая второстепенные, несущественные факторы, получают модель, реализуемую быстрее и качественнее. Практика выработала определенный критерий, который позволяет установить соотношение между числом факторных признаков, включаемых в модель, и объемом исследуемой совокупности. Согласно данному критерию число факторных признаков должно быть в 5-6 раз меньше объема изучаемой совокупности. Практика построения многофакторных регрессионных моделей показывает, что целесообразнее всего использовать следующие типы моделей:
1) линейная: Y_1, 2,..., k = a_0 + a_1 x_1 + a_2 x_2 + ... + a_k x_k; 2) степенная: Y_1, 2,..., k = a_0 x_1^a_1x_2^a_2... x_k^a_k; 3) показательная: Y_1, 2,..., k = e^a_0 +a_1 x_1 +a_2 x_2 ... + a_k x_k; 4) параболическая: Y_1, 2, ..., k = a_0 +a_1 x_1^2 + a_2 x_2^2 ... + a_k x_k^2; 5) гиперболическая: Y_1, 2, ..., k=a_0+\fraca_1x_1+\fraca_2x_2+...+\fraca_kx_k.

1.3.2. Гиперболические многофакторные модели.

Уравнение гиперболической многофакторной модели имеет вид: Y_1,2,...,k=a_0 +\fraca_1x_1+\fraca_2x_2+...+\fraca_kx_k, (1.10) где Y_1, 2,..., k --- теоретические значения результативного признака, полученные подстановкой соответствующих значений факторных признаков в правую часть уравнения (1.10). Параметры a_0, a_1 , a_2, ..., a_k уравнения (1.10) могут быть определены методом наименьших квадратов. Пусть набор наблюдаемых значений x_1,i, x_2,i,..., x_k,i факторных величин X_1, X_2, ..., X_k соответствует наблюдаемому значению y_i случайной величины Y. Найдем минимум функции S(a_0, a_1, a_2, ..., a_k) = Sum_i=1^n (a_0 +\fraca_1x_1,i+\fraca_2x_2,i +... +\fraca_kx_k,i-y_i)^2 \longrightarrow \min. Необходимое условие экстремума функции S(a_0, a_1, a_2, ..., a_k) имеет вид: \frac d S d a_0 = 0, \frac d S d a_1 = 0, \frac d S d a_2 = 0, ... \frac d S d a_k = 0. Проводя соответствующие преобразования, получим систему нормальных уравнений с k+1 неизвестным по числу параметров a_0, a_1, a_2, ..., a_k. n a_0+a_1 Sum_i=1^n \frac1x_1,i + a_2 Sum_i=1^n \frac1x_2,i + ... + a_k Sum_i=1^n \frac1x_k,i =Sum_i=1^n y_i, a_0 Sum_i=1^n \frac1x_1,i + a_1 Sum_i=1^n \frac1x_1,i^2 + a_2 Sum_i=1^n \frac1x_2,i x_1,i+ ... + a_k Sum_i=1^n \frac1x_k,i x_1,i =Sum_i=1^n \fracy_ix_1,i, a_0 Sum_i=1^n \frac1x_2,i + a_1 Sum_i=1^n \frac1x_1,ix_2,i + a_2 Sum_i=1^n \frac1x_2,i^2 + ... + a_k Sum_i=1^n \frac1x_k,i x_2,i =Sum_i=1^n \fracy_ix_2,i, ... ... ... ... ... ... ... ... ... ... ... ... ... ... a_0 Sum_i=1^n \frac1x_k,i + a_1 Sum_i=1^n \frac1x_1,ix_k,i + a_2 Sum_i=1^n \frac1x_2,ix_k,i+ ... + a_k Sum_i=1^n \frac1x_k,i^2 =Sum_i=1^n \fracy_ix_k,i. (1.11)

1.3.3. Вычисление коэффициентов регрессии двухфакторной гиперболической модели.

Если число факторных признаков k=2, то в этом случае система (1.11) принимает вид: \left\ \beginarrayrclclcl n a_0+a_1 Sum_i=1^n \frac1x_1,i + a_2 Sum_i=1^n \frac1x_2,i =Sum_i=1^n y_i, a_0 Sum_i=1^n \frac1x_1,i + a_1 Sum_i=1^n \frac1x_1,i^2 + a_2 Sum_i=1^n \frac1x_2,i x_1,i =Sum_i=1^n \fracy_ix_1,i, a_0 Sum_i=1^n \frac1x_2,i + a_1 Sum_i=1^n \frac1x_1,ix_2,i + a_2 Sum_i=1^n \frac1x_2,i^2 =Sum_i=1^n \fracy_ix_2,i. \endarray \right. (1.12) Решение системы (1.12) запишем в виде: a_0 = \fracC_0C, a_1 = \fracC_1C, a_2 = \fracC_2C, где C= \left| \beginarrayccc n Sum_i=1^n \frac1x_1,i Sum_i=1^n \frac1x_2,i Sum_i=1^n \frac1x_1,i Sum_i=1^n \frac1x_1,i^2 Sum_i=1^n \frac1x_2,ix_1,i Sum_i=1^n \frac1x_2,i Sum_i=1^n \frac1x_1,ix_2,i Sum_i=1^n \frac1x_2,i^2 \endarray \right|, C_0= \left| \beginarrayccc Sum_i=1^n y_i Sum_i=1^n \frac1x_1,i Sum_i=1^n \frac1x_2,i Sum_i=1^n \fracy_ix_1,i Sum_i=1^n \frac1x_1,i^2 Sum_i=1^n \frac1x_2,ix_1,i Sum_i=1^n \fracy_ix_2,i Sum_i=1^n \frac1x_1,ix_2,i Sum_i=1^n \frac1x_2,i^2 \endarray \right|, C_1= \left| \beginarrayccc n Sum_i=1^n y_i Sum_i=1^n \frac1x_2,i Sum_i=1^n \frac1x_1,i Sum_i=1^n \fracy_ix_1,i Sum_i=1^n \frac1x_2,ix_1,i Sum_i=1^n \frac1x_2,i Sum_i=1^n \fracy_ix_2,i Sum_i=1^n \frac1x_2,i^2 \endarray \right|, C_2= \left| \beginarrayccc n Sum_i=1^n \frac1x_1,i Sum_i=1^n y_i Sum_i=1^n \frac1x_1,i Sum_i=1^n \frac1x_1,i^2 Sum_i=1^n \fracy_ix_1,i Sum_i=1^n \frac1x_2,i Sum_i=1^n \frac1x_1,ix_2,i Sum_i=1^n \fracy_ix_2,i \endarray \right|.

1.4. Нахождение эмпирических линий регрессии для параметров газа при дифразгазировании пластовой нефти

1.4.1. Результаты промысловых исследований.

Исследованию подвергался состав газа, выделившегося на каждой ступени разгазирования при дифразгазировании пластовой нефти на скважинах 11041, 523 и 11047 Урмышлинского месторождения, бобриковского горизонта. Обработке подвергалась пластовая нефть со средними значениями основных параметров, приведенными в таблице 5.2.

|p1.5in|p1.5in|p1.5in|p1.5in| Наименование параметров Скважина 11041 Скважина 523 Скважина 11047
Температура,^0 C 25^0 C 25^0 C 25^0 C
Давление насыщения, МПа 4,30 4,50 4,30
Пластовый газовый фактор, м^3/т 25,73 27,59 22,81
Плотность пластовой нефти, кг/м^3 875,92 877,90 851,46
Вязкость пластовой нефти, мПа*с 18,67 16,25 12, 76

Данные наблюдений за составом газа на каждой ступени разгазирования в зависимости от ступеней давления представлены в таблице 5.3.

1.4.2. Построение регрессионных моделей для компонентного состава, плотности и молекулярной массы газа.

В ходе построения математических моделей был разработан вычислительный алгоритм, реализованный в виде программы на языке программирования "Turbo C" и проведены расчеты на ЭВМ. Результаты расчетов и текст программы даны в Приложении 1. 1.4.3. Анализ результатов численных экспериментов и их интерпретация.

Пример анализа полученных результатов

Важнейшей характеристикой газа является его плотность. Для анализа полученных результатов по данному показателю составим таблицу:

Эмпирические линии регрессии для плотности газа

Скважина 11041 Скважина 523 Скважина 11047
Уравнение гиперболической регрессии Y = a_0 + a_1/X Y = 1.081056 + (0.037197)/X Y = 1.076263 + (0.043601)/X Y= 1.108326 + (0.036856)/X
Показатель средней ошибки аппроксимации epsilon epsilon = 6.165971% epsilon = 5.107804 % epsilon = 5.570887 %
Уравнение параболической регрессии Y = a_0 + a_1 X + a_2 X^2 Y = 1.593078 + (-0.0715932) X + (0.170255) X^2 Y = 1.622531 + (-0.684187) X + (0.153706) X^2 Y = 1.664905 + (-0.757626) X + (0.181110) X^2
Показатель средней ошибки аппроксимации epsilon epsilon = 7.172647% epsilon = 7.038820 % epsilon = 7.712038 %
Уравнение параболической регрессии третьего порядка Y = a_0 + a_1 X + a_2 X^2 + a_3 X^3 Y = 1.762547 + (-1.769234) X + (1.2000091) X^2 + (-0.226919) X^3 Y = 1.7811455 + (-1.615212) X + (1.039004) X^2 + (-0.189375)X^3 Y = 1.845311 + (-1.862997) X + (1.255856) X^2 + (-0.236285) X^3
Показатель средней ошибки аппроксимации epsilon epsilon = 3.606947% epsilon = 3.564842 % epsilon = 2.938081 %

При выборе адекватной модели необходимо в комплексе учесть следующие характеристики: 1) показатель средней ошибки аппроксимации epsilon не должен превышать 15 %, 2) значение коэффициента a_0 в уравнении регрессии отражает влияние второстепенных факторов и поэтому должно быть наименьшим, 3) при повышении степени аппроксимируешего многочлена возможно повышение точности аппроксимации в ущерб размерности модели, 4) общий вид корреляционной связи на основе экспериментальных данных в изучаемом случае является обратным.

Проводя анализ регрессионных моделей, построенных в настоящей работе для динамики плотности газа приходим к выводу о том, что наиболее адекватно отражает изучаемый процесс гиперболическая регрессионная модель, поскольку в этом случае она достаточно точна, а влияние второстепенных факторов является наименьшим.

Литература


1. Кендалл М. Дж., Стюарт А. Статистические выводы и связи, пер. с англ., М., 1973.
2. Смирнов Н.В., Дунин-Барковский Н.В. Курс теории вероятностей и математической статистики для технических приложений, M., 1969.
3. Айвазян С.А. Статистическое исследование зависимостей, М., 1968.
4. Дрейпер Н., Смит Г. Прикладной регрессионный анализ, пер. с англ., М., 1973.
5. Математическая энциклопедия, т.4, M., 1984.