С какой целью используется метод возрастных передвижек. Метод передвижки возрастных групп в демографии и его приложения1

ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА 2009 Управление, вычислительная техника и информатика № 3(8) УДК 519.21 А.А. Назаров, М.Г. Носова МЕТОД ПЕРЕДВИЖКИ ВОЗРАСТНЫХ ГРУПП В ДЕМОГРАФИИ И ЕГО ПРИЛОЖЕНИЯ1 Предлагаются методы прямой и обратной передвижки возрастных групп. Находятся основные характеристики, определяющие распределение вероятностей значений численностей групп для методов прямой и обратной передвижки. Выполняется оценка величины людских потерь Российской Федерации в годы Великой Отечественной войны с использованием данных переписей населения 1939 и 1959 гг. и методов прямой и обратной передвижки возрастных групп. Ключевые слова: метод передвижки, численность населения. В связи с возрастающей ролью демографического фактора в социальноэкономическом планировании актуальными являются перспективные расчеты численности и состава населения. В решении этой задачи полезным является математическое моделирование. Разработка и использование разного рода математических моделей служат как для анализа воспроизводства населения в целом, так и для выявления закономерностей развития тех или иных демографических процессов. При моделировании принимаются определенные исходные предположения в отношении основных составляющих процесса (рождаемость, смертность, миграция и т.п.). На этой основе исчисляются другие характеристики населения и его структуры. Особое место в математическом моделировании занимает метод передвижки возрастов (или метод компонент), разработанный П. К. Уэлптоном . Исчислением половозрастной структуры населения методом возрастной передвижи занимались С.Г. Струмилин, А.Я. Боярский, П.П. Шушерин, М.С. Бедный, С. Щербов, В. Лутц, У. Сандерсон, а также Комиссия по народонаселению ООН, Государственный комитет Российской Федерации по статистике, Центр демографии и экологии человека . Метод передвижки возрастных групп достаточно эффективен для краткосрочных прогнозов с горизонтальным планированием на срок не более 10 – 15 лет. В данной работе методом передвижки возрастных групп определяется величина людских потерь Российской Федерации в годы Великой Отечественной войны, с использованием данных переписей населения 1939 и 1959 гг. 1. Метод передвижки по возрастам Метод прямой передвижки применяется для определения оценок значений численности N(x+τ,t+τ) группы лиц возраста x+τ в году t+τ при условии, что известна численность N(x,t), τ – шаг прогнозирования. Численность населения рас1 Работа выполнена при поддержке АВЦП «Развитие научного потенциала высшей школы (2009 – 2010 гг.)» Федерального агентства по образованию РФ по проекту «Разработка методов исследования немарковских систем массового обслуживания и их применения к сложным экономическим системам и компьютерным сетям связи». А.А. Назаров, М.Г. Носова 68 сматривается в совокупности, без разделения по половому признаку. Обозначим через p(x,x+τ) условную вероятность достижения возраста x+τ лицами возраста x. Известно , что p (x , x + τ) = S (x + τ) / S (x) , где S(x) – функция дожития , которая есть вероятность того, что человек доживет до возраста x. При заданных N(x,t) и p(x,x+τ) распределение вероятностей значений величины N(x+τ, t+τ) определяется схемой Бернулли и является биномиальным: P{N (x + τ, t + τ) = m} = C Nm(x,t) p (x, x + τ) m (1 − p (x, x + τ)) N (x ,t) − m (1) с математическим ожиданием S (x + τ) . (2) S (x) Обозначая оценку значения величины N(x+τ,t+τ) тем же символом, равенство (2) перепишем в виде N (x + τ, t + τ) S (x) = N (x, t) S (x + τ) + ε1 , (3) MN (x + τ, t + τ) = N (x, t) p (x, x + τ) = N (x, t) где ε1 – случайная ошибка с математическим ожиданием M ε1 = 0 . Равенство (3) является основным для применения метода передвижки по возрастам. В частности, для метода прямой передвижки оно записывается в виде S (x + τ) N (x + τ, t + τ) = N (x, t) + ε2 , (4) S (x) где N(x,t) задано, а N(x+τ,t+τ) является оценкой значения численности демографической группы лиц возраста x+τ в году t+τ, а ε 2 – случайная ошибка с математическим ожиданием M ε 2 = 0 . При замене аргумента x на x–τ и t на t–τ равенство (3) перепишем в виде N (x, t) S (x − τ) = N (x − τ, t − τ) S (x) + ε3 , где ε3 – случайная ошибка с математическим ожиданием M ε3 = 0 . Откуда получим S (x − τ) + ε4 , (5) S (x) где N(x,t) задано, а N(x–τ, t–τ) является оценкой значения численности демографической группы лиц возраста x–τ в году t–τ, ε 4 – случайная ошибка с математичеN (x − τ, t − τ) = N (x, t) ским ожиданием M ε 4 = 0 . Равенство (5) позволяет определить оценку значения численности демографической группы в прошлые моменты времени. Назовем это методом обратной передвижки. Оценка N(x–τ, t–τ) требует дополнительного исследования, которое выполним ниже. Из равенства (1) очевидно следует, что оценка численности N(x+τ, t+τ), полученная прямой передвижкой, имеет дисперсию DN (x + τ, t + τ) = N (x, t) p (x, x + τ)(1 − p (x, x + τ)) = N (x, t) S (x + τ) ⎛ S (x + τ) ⎞ 1− , S (x) ⎜⎝ S (x) ⎟⎠ а коэффициент вариации V1 этой величины составляет V1 = DN (x + τ, t + τ) = MN (x + τ, t + τ) 1 N (x, t) S (x) −1 . S (x + τ) Метод передвижки возрастных групп в демографии и его приложения 69 Определим границы значений коэффициента вариации V1. Так как численности пятилетних возрастных групп в статистических данных РФ составляют порядка нескольких миллионов, то первый сомножитель 1/ N (x, t) имеет величину менее 10–3. Используя статистические данные о зависимости функции выживания от возраста и проанализировав все возможные значения второго сомножителя для τ ∈ лет и x ≤ 70 лет, получаем, что второй сомножитель принимает максимальное значение 12,578 при τ = 45 лет. В результате получаем, что коэффициент V1 в этом случае имеет значения менее 0,0126. Поскольку оценка (4) обладает достаточно высокой точностью, то ошибкой ε 2 можно пренебречь. 2. Метод обратной передвижки Равенство (5), определяющее оценку численности N(x–τ, t–τ) в методе обратной передвижки, получено применением прямой передвижки, поэтому необходимо найти характеристики этой оценки, в частности ее математическое ожидание и дисперсию. При заданном значении N(x,t) найдем распределение вероятностей значений численности N(x–τ, t–τ) группы лиц возраста x–τ в году t–τ. По формуле Байеса можно записать P{N (x − τ, t − τ) = m / N (x, t) = n} = P{N (x, t) = n / N (x − τ, t − τ) = m}P{N (x − τ, t − τ) = m} . (6) = ∞ ∑ P{N (x, t) = n / N (x − τ, t − τ) = v}P{N (x − τ, t − τ) = v} v=n Здесь, аналогично (1) P{N (x, t) = n / N (x − τ, t − τ) = m} = Cmn p(x − τ, x) n (1 − p(x − τ, x))m − n , (7) где p(x − τ, x) = S (x) / S (x − τ) . Априорное распределение P{N (x − τ, t − τ) = m} будем полагать пуассоновским с некоторым параметром a, значение которого определим ниже: P{N (x − τ, t − τ) = m} = a m −a e . m! (8) Рассмотрим сумму ∞ ψ (z) = ∑ z v P{N (x, t) = n / N (x − τ, t − τ) = v}P{N (x − τ, t − τ) = v}. v =n Для краткости обозначим p(x, x + τ) = p . В силу равенств (7) и (8) функцию ψ(z) запишем в виде ∞ ψ (z) = ∑ z v Cvn p n (1 − p)v − n = v =n n −a ∞ p e n! 1 ∞ av −a v! av = e = p n e− a ∑ z v (1 − p)v − n v! n !(v − n)! v! v=n ∑ z v (v − n)! (1 − p)v −n av = v=n = zn (apz) n − a ∞ z v − n e ∑ [ a(1 − p)]v − n = n! v = n (v − n)! (ap) n − a az (1− p) (ap) n = zn e e exp {a [ (1 − p) z − 1]} . n! n! А.А. Назаров, М.Г. Носова 70 Производящая функция φ(z) распределения (6) имеет вид ϕ(z) = ∞ ∑ z m P{N (x − τ, t − τ) = m / N (x, t) = n} = m=n = ψ(z) = z n exp{(z − 1)a (1 − p)}. ψ (1) (9) Таким образом, распределение (6) является сверткой вырожденного распределения детерминированной величины n и пуассоновского распределения с параметром λ = a (1 − p) = a{1 − p(x − τ, x)} . (10) Найдем апостериорное среднее значение величины N(x–τ,t–τ). Очевидно, можно записать MN (x − τ, t − τ) = n + a{1 − p(x − τ, x)} . Полагая, что априорное и апостериорное средние значения совпадают, запишем равенство a = n + a{1 − p(x − τ, x)} , из которого найдем значения параметра a в виде S (x − τ) a = n / p (x − τ, x) = n . S (x) (11) Таким образом, распределение (6) определяется производящей функцией (9) с параметром a вида (11). Найдем условные математическое ожидание и дисперсию величины N(x–τ,t–τ) при условии, что выполняется равенство n=N(x,t). Очевидно, что выполняется равенство S (x − τ) MN (x − τ, t − τ) = a = N (x, t) , (12) S (x) которое оправдывает выбор оценки в виде (5). Найдем условную дисперсию величины оценки (5) при условии, что n=N(x,t). В силу равенства (9) DN (x − τ, t − τ) = a{1 − p (x − τ, x)} = = N (x, t) S (x − τ) ⎛ S (x) ⎞ ⎛ S (x − τ) ⎞ 1− = N (x, t) ⎜ − 1⎟ ⎜ ⎟ S (x) ⎝ S (x − τ) ⎠ ⎝ S (x) ⎠ а коэффициент вариации V2 составляет величину V2 = DN (x − τ, t − τ) = MN (x − τ, t − τ) 1 N (x, t) S (x) ⎛ S (x) ⎞ 1− . S (x − τ) ⎝⎜ S (x − τ) ⎠⎟ Здесь аналогично V1 определим диапазон значений коэффициента вариации V2. Первый сомножитель 1/ N (x, t) имеет величину менее 10–3. Аналогично V1, проанализировав все возможные значения второго сомножителя для τ ∈ лет и x ≤ 70 лет, получаем, что второй сомножитель максимальное значение 0,489 при- Метод передвижки возрастных групп в демографии и его приложения 71 нимает при τ = 45 . В результате имеем, что коэффициент вариации V2 имеет значения менее 10–3 для любых τ и x. Заметим, что в смысле значений коэффициентов вариации, оценки, полученные обратной передвижкой, на порядок (в 10 раз) точнее оценок, полученных прямой передвижкой при одинаковом горизонте прогнозирования τ. Поэтому случайной ошибкой ε 4 здесь также можно пренебречь. Применим рассмотренный метод передвижки по возрастам к решению поставленной задачи определения величины людских потерь РФ в годы ВОВ. 3. Определение величины людских потерь РФ в годы ВОВ Для решения поставленной задачи кроме статистических данных распределения населения РФ по основным пятилетним возрастным группам в 1939 и 1959 гг. необходимо знать значения коэффициентов дожития. Такую информацию можно получить по результатам переписи населения РФ до 1939 г., либо после 1959 г. В данной работе воспользуемся статистическими данными 1979 г. (табл. 1). Таблица 1 Статистические данные распределения численности населения РФ 1939 и 1959 гг. (тыс. чел.) № гр.: возраст № 1: 0-4 № 2: 5-9 № 3: 10-14 № 4: 15-19 № 5: 20-24 № 6: 25-29 № 7: 30-34 № 8: 35-39 № 9: 40-44 № 10: 45-49 № 11: 50-54 № 12: 55-59 № 13: 60-64 № 14: 65-69 № 15: ≥70 1939 13806 11735 14158 9495 8744 10454 8820 7240 5315 4268 3710 3332 2775 2079 2426 1959 13353 12415 8502 8975 11552 10591 11103 6423 6177 7167 5965 4751 3589 2664 4303 1979 10523 9707 9512 12385 12995 11902 8016 8399 10485 9376 9716 5595 5065 5493 8200 По данным 1959 и 1979 гг. найдем оценки коэффициентов дожития лиц n-й группы до возраста лиц (n+4)-й группы N (n + 4,1979) p(n, n + 4) = N (n,1959) как отношение численности N(n+4,1979) (n+4)-й группы населения в 1979 г. к численности N(n,1959) n-й группы населения 1959 г., состоящих из одних и тех же лиц Российской Федерации (табл. 2). Последнее значение 0,3855 в первой строке получено как отношение численности 8200 последней (15)-й группы 1979 г. к суммарной численности 21272 А.А. Назаров, М.Г. Носова 72 групп с 11-й по 15-ю 1959 г. Коэффициенты p(n, n+4) применяются в методе прямой передвижки, а p(n–4, n) соответственно в методе обратной передвижки. Таблица 2 Оценки коэффициентов дожития № гр. №1 №2 №3 №4 №5 №6 №7 №8 №9 № 10 № 11 № 12 № 13 № 14 № 15 p(n, n+4) 0,9732 0,9587 0,9428 0,9358 0,9076 0,8853 0,8751 0,8711 0,8200 0,7664 p(n–4, n) 0,9732 0,9587 0,9428 0,9358 0,9076 0,8853 0,8751 0,8711 0,8200 0,7664 0,3855 0,3855 3.1. Определение людских потерь методом прямой передвижки Применяя значения коэффициентов дожития, приведенные в первой строке табл. 2, методом прямой передвижки, по формуле (4), найдем значения оценок численностей возрастных групп на 1959 г. по данным 1939 г. Эти значения приведены в табл. 3. Таблица 3 Значения оценок численностей возрастных групп на 1959 г., полученных методом прямой передвижки № гр. 1939 p(n, n+4) №1 №2 №3 №4 №5 №6 №7 №8 №9 № 10 № 11 № 12 № 13 № 14 № 15 13806 11735 14158 9495 8744 10454 8820 7240 5315 4268 0,9732 0,9587 0,9428 0,9358 0,9076 0,8853 0,8751 0,8711 0,8200 0,7664 14322 0,3855 Передвижка на 1959 1959 Разность 13436 11250 13349 8886 7936 9255 7718 6307 4358 3271 5521 11552 10591 11103 6423 6177 7167 5965 4751 3589 2664 4303 1884 659 2246 2463 1753 2088 1753 1556 769 607 1218 Метод передвижки возрастных групп в демографии и его приложения 73 В последней строке этой таблицы приведены значения разностей прогнозных, полученных методом прямой передвижки, и фактических значений численностей возрастных групп 1959 г. Эти значения можно интерпретировать как величину людских потерь РФ в годы ВОВ. Их суммарные значение составляет S1 = 17001 тыс. 3.2 Определение людских потерь методом обратной передвижки Применяя значения коэффициентов дожития, приведенные во второй строке табл. 2, методом обратной передвижки по формуле (5), найдем значения оценок численностей возрастных групп на 1939 г. по данным 1959 г. Результаты приведены в табл. 4. Таблица 4 Значения оценок численностей возрастных групп на 1959 г., полученных методом обратной передвижки № гр. №1 №2 №3 №4 №5 №6 №7 №8 №9 № 10 № 11 № 12 № 13 № 14 № 15 1959 11552 10591 11103 6423 6177 7167 5965 4751 3589 2664 4303 p(n–4, n) 0,9732 0,9587 0,9428 0,9358 0,9076 0,8853 0,8751 0,8711 0,8200 0,7664 0,3855 Передвижка на 1939 11870 11047 11776 6863 6806 8096 6817 5454 4377 3476 1939 Разность 13806 11735 14158 9495 8744 10454 8820 7240 5315 4268 1936 688 2382 2632 1938 2358 2003 1786 938 792 11163 14322 3159 Здесь значения последней строки получено вычитанием из фактической численности возрастных групп 1939 г. значений, полученных обратной передвижкой. Эти разности можно интерпретировать как количество тех лиц данной возрастной группы, которые оказались исключенными из процесса формирования населения 1959 г. Суммарная величина S 2 этих разностей по всем возрастным группам составляет S2 = 20612 тыс. Эта сумма складывается из потерь по естественным причинам, а также людских потерь, обусловленных ВОВ, значения которых по возрастным группам определяется произведением значений последней строки табл. 4 на коэффициенты p(n, n+4). Эти значения приведены в табл. 5. Значения последней строки этой таблицы совпадают со значением последней строки табл. 3, следовательно, значение людских потерь РФ в годы ВОВ составляет 17 млн человек. А.А. Назаров, М.Г. Носова 74 Таблица 5 Значения людских потерь, обусловленных ВОВ № гр. №1 №2 №3 №4 №5 №6 №7 №8 №9 № 10 № 11 № 12 № 13 № 14 № 15 1936 688 2382 2632 1938 2358 2003 1786 938 792 p(n,n+4) 0,9732 0,9587 0,9428 0,9358 0,9076 0,8853 0,8751 0,8711 0,8200 0,7664 3159 0,3855 1884 659 2246 2463 1759 2088 1753 1556 769 607 1218 Заключение Метод прямой и обратной передвижки возрастов может применяться для расчета численности возрастных групп населения в годы между датами переписи. Данный метод является простым инструментом при демографическом анализе и дает результаты, вполне адекватные реальности. ЛИТЕРАТУРА 1. Whelpton P.K. Population of the United States, 1925 to 1975 // The American Journal of Sociology. 1928. V. 34. N 2. P. 253 – 270. 2. Демографический энциклопедический словарь / под ред. Д.И. Валентея. М.: Советская энциклопедия, 1985. 608 с. 3. Медков В.М. Демография. М.: ИНФРА-М, 2007. 683 с. 4. Фалин Г.И., Фалин А.И. Введение в актуарную математику. М.: Изд-во МГУ, 1994. 86 с. 5. Назаров А.А., Терпугов А.Ф. Теория вероятностей и случайных процессов: Учебное пособие. Томск: Изд-во НТЛ, 2006. 204 с. 6. Российский статистический ежегодник: Статистический сборник: Официальное издание / Гос. комитет РФ по статистике (Госкомстат России) / под ред. В.Л. Соколина и др. М.: 2001. 642 с. Назаров Анатолий Андреевич Носова Мария Геннадьевна Томский государственный университет E- mail: [email protected]; [email protected] Поступила в редакцию 11 мая 2009 г.

Метод экстраполирования по экспоненте

Метод экстраполяции по среднему темпу роста

Метод экстраполяции по среднему абсолютному приросту

Математические методы

А. Методы экстраполяции – простейшие методы прогнозирования, основанные на предположении неизменности среднегодовых темпов роста, среднегодовых абсолютных и относительных приростов.

Методы экстраполяции применяются в демографии для расчёта общей численности населения только при отсутствии резких колебаний рождаемости, смертности и миграции.

Математическая модель по этому методу имеет вид линейной функции:

где – прогнозируемый уровень численности населения;

– базовый уровень численности населения;

– абсолютный среднегодовой прирост численности населения;

t – период прогнозирования.

В реальности неизменные среднегодовые абсолютные приросты могут оставаться таковыми только непродолжительное время, поэтому прогнозирование численности населения с использованием указанной линейной функции может быть использовано только в краткосрочных прогнозах.

Математическая модель по этому методу имеет вид степенной функции:

где: – среднегодовой коэффициент роста численности населения.

В этой модели предполагается ежегодное изменение численности населения в одно и то же число раз, т.е. его рост (или снижение) в геометрической прогрессии.

От среднегодовых коэффициентов роста можно перейти к среднегодовым коэффициентам прироста , и тогда формулу можно преобразовать следующим образом:

где – среднегодовой коэффициент прироста населения.

Путём преобразования формулы можно определить период удвоения населения, период сокращения населения вдвое .

Математическая модель по этому методу имеет вид экспоненциальной функции:

где: e – основание натурального логарифма (2,7183);

где – среднегодовой коэффициент прироста населения

Применение экспоненциальной функции более предпочтительно по сравнению с линейной функцией и степенной, т.к. это гарантирует, что численность населения не станет отрицательной.

Б. Аналитический метод – основан на подборе функции, наиболее близкой по своему графическому отображению к эмпирической кривой.

Например, часто применяется логистическая функция ("логистик" с греческого – искусство вычислять, рассуждать), особенность которой в демографическом прогнозировании состоит в том, что её приращение уменьшается по мере роста численности населения.

Выше были представлены методы расчёта общей численности населения. Большое значение для целей социально-экономического планирования имеет прогноз будущего состава населения, в первую очередь по возрасту и полу . Для расчёта отдельных возрастных групп (а также – с разбивкой по полу) используют метод передвижки возрастов (за рубежом чаще называемый методом компонент).


Суть метода состоит в том, что первоначальная численность населения как бы "передвигается" в будущее, уменьшаясь за счёт умерших (и уехавших) и пополняясь за счёт родившихся (и приехавших). Следовательно, для прогноза необходимо знать базовую численность и структуру населения, а также – гипотезы относительно тенденций воспроизводства и миграции населения в прогнозном периоде.

Передвижка осуществляется по временным шагам, равным длине возрастной группы.

Для этого численность возрастной группы населения в начале прогнозного периода умножается на коэффициент передвижки (дожития). Коэффициент передвижки – соотношение двух чисел смежных возрастных групп: живущих в возрасте "x+1" и "x" (и ), взятых из таблицы смертности. При этом следует учитывать миграционное сальдо.

Модель передвижки возрастов имеет вид :

где – численность возрастной группы " ";

– численность возрастной группы "";

– коэффициент передвижки в следующий возраст (вероятность жить в возрасте "");

МС – миграционное сальдо .

C использованием коэффициента миграционного сальдо, модель передвижки возрастов выглядит следующим образом.

ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА

2009 Управление, вычислительная техника и информатика № 3(8)

А.А. Назаров, М.Г. Носова

МЕТОД ПЕРЕДВИЖКИ ВОЗРАСТНЫХ ГРУПП В ДЕМОГРАФИИ И ЕГО ПРИЛОЖЕНИЯ1

Предлагаются методы прямой и обратной передвижки возрастных групп. Находятся основные характеристики, определяющие распределение вероятностей значений численностей групп для методов прямой и обратной передвижки. Выполняется оценка величины людских потерь Российской Федерации в годы Великой Отечественной войны с использованием данных переписей населения 1939 и 1959 гг. и методов прямой и обратной передвижки возрастных групп.

Ключевые слова: метод передвижки, численность населения.

В связи с возрастающей ролью демографического фактора в социальноэкономическом планировании актуальными являются перспективные расчеты численности и состава населения. В решении этой задачи полезным является математическое моделирование. Разработка и использование разного рода математических моделей служат как для анализа воспроизводства населения в целом, так и для выявления закономерностей развития тех или иных демографических процессов. При моделировании принимаются определенные исходные предположения в отношении основных составляющих процесса (рождаемость, смертность, миграция и т.п.). На этой основе исчисляются другие характеристики населения и его структуры.

Особое место в математическом моделировании занимает метод передвижки возрастов (или метод компонент), разработанный П. К. Уэлптоном . Исчислением половозрастной структуры населения методом возрастной передвижи занимались С.Г. Струмилин, А.Я. Боярский, П.П. Шушерин, М.С. Бедный, С. Щербов, В. Лутц, У. Сандерсон, а также Комиссия по народонаселению ООН, Государственный комитет Российской Федерации по статистике, Центр демографии и экологии человека .

Метод передвижки возрастных групп достаточно эффективен для краткосрочных прогнозов с горизонтальным планированием на срок не более 10 - 15 лет. В данной работе методом передвижки возрастных групп определяется величина людских потерь Российской Федерации в годы Великой Отечественной войны, с использованием данных переписей населения 1939 и 1959 гг.

1. Метод передвижки по возрастам

Метод прямой передвижки применяется для определения оценок значений численности Мх+т/+т) группы лиц возраста х+т в году t+т при условии, что известна численность Щх,(), т - шаг прогнозирования. Численность населения рас-

1 Работа выполнена при поддержке АВЦП «Развитие научного потенциала высшей школы (2009 -2010 гг.)» Федерального агентства по образованию РФ по проекту «Разработка методов исследования немарковских систем массового обслуживания и их применения к сложным экономическим системам и компьютерным сетям связи».

сматривается в совокупности, без разделения по половому признаку. Обозначим через р(х,х+т) условную вероятность достижения возраста х+т лицами возраста х. Известно , что

р(х, х + т) = £(х + т) / £(х),

где £(х) - функция дожития , которая есть вероятность того, что человек доживет до возраста х. При заданных Щх,() и р(х,х+т) распределение вероятностей значений величины Мх+т, t+т) определяется схемой Бернулли и является биномиальным:

Р{Ы (х + т, t + т) = т} = Ст(x,t) р(х, х + т)т (1 - р(х, х + т))N (x,t)-т (1)

с математическим ожиданием

MN(х + т, t + т) = N(х, 0р(х, х + т) = N(х, ^ £(х + т) . (2)

Обозначая оценку значения величины М(х+т^+т) тем же символом, равенство (2) перепишем в виде

N (х + т, t + т)£ (х) = N (х, ^£ (х + т) + е1, (3)

где е1 - случайная ошибка с математическим ожиданием М е1 = 0.

Равенство (3) является основным для применения метода передвижки по возрастам. В частности, для метода прямой передвижки оно записывается в виде

N (х + т, t + т) = N (х, 0 £ (х + т) +е2, (4)

где Щх^) задано, а N(x+т,t+т) является оценкой значения численности демографической группы лиц возраста х+т в году t+т, а е2 - случайная ошибка с математическим ожиданием Ме2 = 0 .

При замене аргумента х на х-т и t на - равенство (3) перепишем в виде N(х,^£(х-т) = N(х-т,t-т)£(х) + е3, где е3 - случайная ошибка с математическим ожиданием Ме3 = 0 . Откуда получим

N (х -т, t -т) = N (х, t)£(х-- + е4, (5)

где N(x,t) задано, а Щх-т, t-т) является оценкой значения численности демографической группы лиц возраста х-т в году ^т, е4 - случайная ошибка с математическим ожиданием Ме4 = 0 . Равенство (5) позволяет определить оценку значения численности демографической группы в прошлые моменты времени. Назовем это методом обратной передвижки. Оценка N(x-т, ^т) требует дополнительного исследования, которое выполним ниже.

Из равенства (1) очевидно следует, что оценка численности N(x+т, t+т), полученная прямой передвижкой, имеет дисперсию

DN(х + т, t + т) = N(х,Г)р(х, х + т)(1 - р(х, х + т)) = N(х,Г) £(х + т) | \ - £(х + т) |,

£(х) I £(х))

а коэффициент вариации У1 этой величины составляет

V = л/DN(х + т, t + т) = 1 I £(х) 1

1 MN(x + т, t + т) Л/N(х, t) \ £(х + т)

Определим границы значений коэффициента вариации ¥\. Так как численности пятилетних возрастных групп в статистических данных РФ составляют порядка нескольких миллионов, то первый сомножитель 1/VN(х,ґ) имеет величину менее 10-3. Используя статистические данные о зависимости функции выживания от возраста и проанализировав все возможные значения второго сомножителя для т є лет их < 70 лет, получаем, что второй сомножитель принимает максимальное значение 12,578 при т = 45 лет. В результате получаем, что коэффициент V] в этом случае имеет значения менее 0,0126. Поскольку оценка (4) обладает достаточно высокой точностью, то ошибкой є2 можно пренебречь.

2. Метод обратной передвижки

Равенство (5), определяющее оценку численности Щх-т, ґ-т) в методе обратной передвижки, получено применением прямой передвижки, поэтому необходимо найти характеристики этой оценки, в частности ее математическое ожидание и дисперсию. При заданном значении М(х,ґ) найдем распределение вероятностей значений численности М(х-т, ґ-т) группы лиц возраста х-т в году ґ-т.

По формуле Байеса можно записать

(х-т, ґ-т) = т / N (х, ґ) = п} =

(х, ґ) = п / N (х-т, ґ-т) = т}Р{М (х-т, ґ-т) = т}

^ Р{М (х, ґ) = п / N (х-т, ґ-т) = у}Р{М (х-т, ґ-т) = V}

Здесь, аналогично (1)

Р{Ы(х,t) = п / N(х -т,t -т) = т} = СПр(х -т, х)п (1 - р(х -т, х))т-п, (7)

где р(х-т,х) = £(х)/£(х-т). Априорное распределение Р^(х-т,t-т) = т} будем полагать пуассоновским с некоторым параметром а, значение которого определим ниже:

Р^(х-т,t-т) = т} =-----------е~а. (8)

Рассмотрим сумму

у (х) = X хуР^ (х, ^ = п / N (х - т, t - т) = у}Р^ (х - т, t - т) = V}.

Для краткости обозначим р(х, х + т) = р. В силу равенств (7) и (8) функцию уХ запишем в виде

у (х) = X хСрп (1 - р)”-п ^-е~а = рпе-а X - (1 - рГп а =

V! п!(V - п)! V!

V=n " V=n "V ’

п -а ад л /- _ \п ад V-п

Р^е- X ^ (1 - р)v-па = (ар!-е-а X [а(1 - р)]-п =

п! v=n (V - п)! п! v=n (V - п)!

(ар)п я-ае (!-р) = (ар)п

ехр{а[(1 - р)г -1]}.

Производящая функция ф(х) распределения (6) имеет вид

ф(г) = X гтР^(х - т,t - т) = т /N(х,t) = п} =

У7Т) = хп ехр{(х - 1)а(1 - р)}. (9)

Таким образом, распределение (6) является сверткой вырожденного распределения детерминированной величины п и пуассоновского распределения с параметром

Х = а(1 - р) = а{1 - р(х -т, х)} . (10)

Найдем апостериорное среднее значение величины Мх-т,М:). Очевидно, можно записать

MN(х -т, t -т) = п + а{1 - р(х-т, х)} .

Полагая, что априорное и апостериорное средние значения совпадают, запишем равенство

а = п + а{1 - р(х-т,х)} ,

из которого найдем значения параметра а в виде

а = п / р(х -т, х) = п------. (11)

Таким образом, распределение (6) определяется производящей функцией (9) с параметром а вида (11). Найдем условные математическое ожидание и дисперсию величины Мх-т/-т) при условии, что выполняется равенство п=Щх,(). Очевидно, что выполняется равенство

MN (х-т, t-т) = а = N (х, Г) -£(---, (12)

которое оправдывает выбор оценки в виде (5).

Найдем условную дисперсию величины оценки (5) при условии, что п=Щх,(). В силу равенства (9)

DN (х-т, t-т) = а{1 - р(х-т, х)} =

N (х,) DN(х-т,t-т) 1 I £(х) Т £(х)

MN(х-т,t-т) ^(х,£(х-т) [ £(х-т))

Здесь аналогично У1 определим диапазон значений коэффициента вариации У2. Первый сомножитель 1/^/^х,7) имеет величину менее 103. Аналогично Уь проанализировав все возможные значения второго сомножителя для т е лет и х < 70 лет, получаем, что второй сомножитель максимальное значение 0,489 при-

нимает при т = 45. В результате имеем, что коэффициент вариации У2 имеет значения менее 10-3 для любых т и х. Заметим, что в смысле значений коэффициентов вариации, оценки, полученные обратной передвижкой, на порядок (в 10 раз) точнее оценок, полученных прямой передвижкой при одинаковом горизонте прогнозирования т. Поэтому случайной ошибкой е4 здесь также можно пренебречь.

Применим рассмотренный метод передвижки по возрастам к решению поставленной задачи определения величины людских потерь РФ в годы ВОВ.

3. Определение величины людских потерь РФ в годы ВОВ

Для решения поставленной задачи кроме статистических данных распределения населения РФ по основным пятилетним возрастным группам в 1939 и 1959 гг. необходимо знать значения коэффициентов дожития. Такую информацию можно получить по результатам переписи населения РФ до 1939 г., либо после 1959 г. В данной работе воспользуемся статистическими данными 1979 г. (табл. 1).

Таблица 1

Статистические данные распределения численности населения РФ 1939 и 1959 гг. (тыс. чел.)

№ гр.: возраст 1939 1959 1979

№ 1: 0-4 13806 13353 10523

№ 2: 9 - 5 11735 12415 9707

№ 3: 10-14 14158 8502 9512

№ 4: 15-19 9495 8975 12385

№ 5: 20-24 8744 11552 12995

№ 6: 25-29 10454 10591 11902

№ 7: 30-34 8820 11103 8016

№ 8: 35-39 7240 6423 8399

№ 9: 40-44 5315 6177 10485

№ 10 9 4 - 5 4 4268 7167 9376

№ 11 4 5 - 0 5 3710 5965 9716

№ 12: 55-59 3332 4751 5595

№ 13 4 6 - 0 6 2775 3589 5065

№ 14 9 6 - 5 6 2079 2664 5493

№ 15: >70 2426 4303 8200

По данным 1959 и 1979 гг. найдем оценки коэффициентов дожития лиц п-й группы до возраста лиц (п+4)-й группы

р(п, п + 4) =-

как отношение численности Мп+4,1979) (п+4)-й группы населения в 1979 г. к численности Мп,1959) п-й группы населения 1959 г., состоящих из одних и тех же лиц Российской Федерации (табл. 2).

Последнее значение 0,3855 в первой строке получено как отношение численности 8200 последней (15)-й группы 1979 г. к суммарной численности 21272

групп с 11-й по 15-ю 1959 г. Коэффициенты р(п, п+4) применяются в методе прямой передвижки, а р(п-4, п) соответственно в методе обратной передвижки.

Т аблица 2

Оценки коэффициентов дожития

№ гр. р(п, п+4) р(п-4, п)

№ 5 0,9076 0,9732

№ 6 0,8853 0,9587

№ 7 0,8751 0,9428

№ 8 0,8711 0,9358

№ 9 0,8200 0,9076

№ 10 0,7664 0,8853

№ 11 0,3855 0,8751

3.1. Определение людских потерь методом прямой передвижки

Применяя значения коэффициентов дожития, приведенные в первой строке табл. 2, методом прямой передвижки, по формуле (4), найдем значения оценок численностей возрастных групп на 1959 г. по данным 1939 г. Эти значения приведены в табл. 3.

Т аблица 3

Значения оценок численностей возрастных групп на 1959 г., полученных методом прямой передвижки

№ гр. 1939 р(п, п+4) Передвижка на 1959 1959 Разность

№ 1 13806 0,9732

№ 2 11735 0,9587

№ 3 14158 0,9428

№ 4 9495 0,9358

№ 5 8744 0,9076 13436 11552 1884

№ 6 10454 0,8853 11250 10591 659

№ 7 8820 0,8751 13349 11103 2246

№ 8 7240 0,8711 8886 6423 2463

№ 9 5315 0,8200 7936 6177 1753

№ 10 4268 0,7664 9255 7167 2088

№ 11 14322 0,3855 7718 5965 1753

№ 12 6307 4751 1556

№ 13 4358 3589 769

№ 14 3271 2664 607

№ 15 5521 4303 1218

В последней строке этой таблицы приведены значения разностей прогнозных, полученных методом прямой передвижки, и фактических значений численностей возрастных групп 1959 г. Эти значения можно интерпретировать как величину людских потерь РФ в годы ВОВ. Их суммарные значение составляет й = 17001 тыс.

3.2 Определение людских потерь методом обратной передвижки

Применяя значения коэффициентов дожития, приведенные во второй строке табл. 2, методом обратной передвижки по формуле (5), найдем значения оценок численностей возрастных групп на 1939 г. по данным 1959 г. Результаты приведены в табл. 4.

Т аблица 4

Значения оценок численностей возрастных групп на 1959 г., полученных методом обратной передвижки

№ гр. 1959 р(п-4, п) Передвижка на 1939 1939 Разность

№ 1 11870 13806 1936

№ 2 11047 11735 688

№ 3 11776 14158 2382

№ 4 6863 9495 2632

№ 5 11552 0,9732 6806 8744 1938

№ 6 10591 0,9587 8096 10454 2358

№ 7 11103 0,9428 6817 8820 2003

№ 8 6423 0,9358 5454 7240 1786

№ 9 6177 0,9076 4377 5315 938

№ 10 7167 0,8853 3476 4268 792

№ 11 5965 0,8751 11163 14322 3159

№ 12 4751 0,8711

№ 13 3589 0,8200

№ 14 2664 0,7664

№ 15 4303 0,3855

Здесь значения последней строки получено вычитанием из фактической численности возрастных групп 1939 г. значений, полученных обратной передвижкой. Эти разности можно интерпретировать как количество тех лиц данной возрастной группы, которые оказались исключенными из процесса формирования населения 1959 г. Суммарная величина £2 этих разностей по всем возрастным группам составляет £2 = 20612 тыс. Эта сумма складывается из потерь по естественным причинам, а также людских потерь, обусловленных ВОВ, значения которых по возрастным группам определяется произведением значений последней строки табл. 4 на коэффициенты р(п, п+4). Эти значения приведены в табл. 5.

Значения последней строки этой таблицы совпадают со значением последней строки табл. 3, следовательно, значение людских потерь РФ в годы ВОВ составляет 17 млн человек.

Таблица 5

Значения людских потерь, обусловленных ВОВ

а г % p(n,n+4)

№ 1 1936 0,9732

№ 2 688 0,9587

№ 3 2382 0,9428

№ 4 2632 0,9358

№ 5 1938 0,9076 1884

№ 6 2358 0,8853 659

№ 7 2003 0,8751 2246

№ 8 1786 0,8711 2463

№ 9 938 0,8200 1759

№ 10 792 0,7664 2088

№ 11 3159 0,3855 1753

Заключение

Метод прямой и обратной передвижки возрастов может применяться для расчета численности возрастных групп населения в годы между датами переписи. Данный метод является простым инструментом при демографическом анализе и дает результаты, вполне адекватные реальности.

ЛИТЕРАТУРА

1. Whelpton P.K. Population of the United States, 1925 to 1975 // The American Journal of Sociology. 1928. V. 34. N 2. P. 253 - 270.

2. Демографический энциклопедический словарь / под ред. Д.И. Валентея. М.: Советская энциклопедия, 1985. 608 с.

3. МедковВ.М. Демография. М.: ИНФРА-М, 2007. 683 с.

4. Фалин Г.И., Фалин А.И. Введение в актуарную математику. М.: Изд-во МГУ, 1994. 86 с.

5. Назаров А.А., Терпугов А.Ф. Теория вероятностей и случайных процессов: Учебное пособие. Томск: Изд-во НТЛ, 2006. 204 с.

6. Российский статистический ежегодник: Статистический сборник: Официальное издание / Гос. комитет РФ по статистике (Госкомстат России) / под ред. В. Л. Соколина и др. М.: 2001. 642 с.

Назаров Анатолий Андреевич Носова Мария Геннадьевна Томский государственный университет

Выше были представлены методы расчёта общей численности населения. Большое значение для целей социально-экономического планирования имеет прогноз будущего состава населения, в первую очередь по возрасту и полу. Для расчёта отдельных возрастных групп (а также – с разбивкой по полу) используют метод передвижки возрастов (за рубежом чаще называемый методом компонент).

Суть метода состоит в том, что первоначальная численность населения как бы "передвигается" в будущее, уменьшаясь за счёт умерших (и уехавших) и пополняясь за счёт родившихся (и приехавших). Следовательно, для прогноза необходимо знать базовую численность и структуру населения, а также – гипотезы относительно тенденций воспроизводства и миграции населения в прогнозном периоде.

Передвижка осуществляется по временным шагам, равным длине возрастной группы. Для этого численность возрастной группы населения в начале прогнозного периода умножается на коэффициент передвижки (дожития). Коэффициент передвижки – соотношение двух чисел смежных возрастных групп: живущих в возрасте "x+1" и "x" ( и ), взятых из таблицы смертности. При этом следует учитывать миграционное сальдо.

Модель передвижки возрастов имеет вид:

, (7.17)

где – численность возрастной группы " ";

– численность возрастной группы " ";

– коэффициент передвижки в следующий возраст (вероятность жить в возрасте " ");

МС – миграционное сальдо.

C использованием коэффициента миграционного сальдо, модель передвижки возрастов выглядит следующим образом:

, (7.18)

Задание 7.3 . Требуется определить методом передвижки возрастов перспективную численность лиц в возрасте 4 лет на начало 2009 г. при условии сохранения имеющихся тенденций естественного и механического движения, если имеются следующие условные данные о численности населения по региону на начало 2005г. (таблица 7.1).

Таблица 7.1

Исходные данные для расчёта перспективной численности населения


Метод компонент открывает перед разработчиками демографического прогноза более широкие возможности. В отличие от экстраполяционного и аналитического он позволяет получать не только общую численность населения, но и его распределение по полу и возрасту.
Двойное название данного метода связано с тем, во-первых, что его применение основано на использовании уравнения демографического баланса:
P1 = P0 + B - D + Мп - Му,
где Po и P1 - численность населения соответственно в начале и конце периода (года),
В - число рождений за период,
D - число смертей за период,
Мп - миграционный приток за период,
Му - миграционный отток за период.
При этом В, D, Мп и Му называются компонентами изменения численности населения за период (год).
Во-вторых, с тем, что данные о численности отдельных возрастно-поло- вых групп передвигаются каждый год в следующий возраст, а численность нулевой возрастной группы определяется на основании прогноза годового числа рождений и младенческой смертности.
Суть метода компонент заключается в «отслеживании» движения отдельных когорт во времени в соответствии с заданными (прогнозными) параметрами рождаемости, смертности и миграции. Если эти параметры зафиксированы в некоторый начальный момент времени to, оставаясь затем неизменными на
протяжении периода Аt, то это однозначно определяет численность и структуру населения в момент времени to +А^.
Начиная с момента времени t0, численность населения каждого отдельного возраста уменьшается в соответствии с прогнозными повозрастными вероятностями смерти. Из исходной численности населения каждого возраста вычитается число умерших, а оставшиеся в живых становятся на год старше. Прогнозные повозрастные уровни рождаемости используются для определения числа рождений на каждый год прогнозного периода. Родившиеся также начинают испытывать риск смерти в соответствии с принятыми ее уровнями. Метод ком-
понент учитывает также повозрастные интенсивности миграции (прибытия и выбытия).
Процедура повторяется для каждого года прогнозного периода. Тем самым определяется численность населения каждого возраста и пола, общая чис-ленность населения, общие коэффициенты рождаемости, смертности, а также коэффициенты общего и естественного прироста. При этом прогнозные расчеты могут производиться как для однолетних возрастных интервалов, так и для различных возрастных групп (5-летних или 10-летних). Техника перспективных расчетов в обоих случаях совершенно одинакова. Перспективные расчеты обычно делаются отдельно для женского и мужского населения. Численность населения обоих полов и его возрастная структура получается простым сумми-рованием численностей женского и мужского населения. При этом все прогнозные параметры рождаемости, смертности и миграции могут меняться для каждого года или интервала лет прогнозного периода.