скачать книгу бесплатно
:
«Все три выборки принадлежат одной генеральной совокупности или разным генеральным совокупностям с равными средними арифметическими» (если гипотеза H
неверна, то параметр I
оказывает существенное влияние на D
).
Уровень значимости p есть вероятность необоснованно (ошибочно) отвергнуть (считать неверной) гипотезу H0. Проведем расчеты отдельно для данных из работы Линна и для данных, полученных из имитационной модели.
Анализ данных из работы Линна показывает, что вероятность необоснованного отклонения нулевой гипотезы крайне мала: ?9,44 .10
(см. таблицу 1). Следовательно с большой степенью уверенности (1 – p ? 1) можно утверждать, что значения параметра D
зависят от значений параметра I
на основе данных, собранных в (Lynn, Vanhanen, 2002).
Таблица 1[5 - В таблице 1, в столбце SS представлены результаты расчета:– внутригрупповой дисперсии (Columns), характеризующей изменение средних в каждой из трех групп различных значений параметра Ii;– межгрупповой дисперсии (Error), характеризующей рассеяние значений Di вне влияния фактора Ii;– общей выборочной дисперсии (Total).В столбце df приведено число степеней свободы по каждому виду дисперсии. В столбце MS – среднее значение суммы квадратов разностей по каждому виду дисперсии, определяемое как отношение SS/df. В столбце F – значение статистики Фишера для MS. Значение уровня значимости p(Prob > F) для рассчитанного значения статистики F приведено в последнем столбце.]
Оценим характер влияния I
на D
. На рисунке 3 проиллюстрируем результат обработки данных из (Lynn, Vanhanen, 2002) в виде графика box plot («ящик с усами»). На этом рисунке вдоль оси Ох размещены три уровня фактора I
: «низкий», «средний» и «высокий» в соответствующем порядке. Для каждого из трех уровней фактора I
нарисован «ящик с усами» (фигура синего цвета – «ящик», пунктирные вертикальные прямые – «усы»). Горизонтальная линия («талия» у ящика) обозначает медиану выборки значений параметра D
, соответствующих уровню фактора I
(«низкий», «средний» и «высокий»). Как видно из рисунка 3, уровням фактора I
соответствуют следующие значения медианы D
: «низкий» – 0,017, «средний» – 0,065, «высокий» – 0,2. Нижняя и верхняя границы каждого из ящиков иллюстрируют первую и третью квантили q
и q
для выборки D
соответственно[6 - В промежутки значений [0, q
] и [q
, 1] попадает по 25 % от общего числа точек D
из выборки.]. Длина усов каждого из ящиков определяются значениями: нижняя – 9-й процентили, верхняя – 91-й процентили. Данные, выходящие за пределы усов (выбросы), отображаются на графике в виде крестиков.
Рис. 3. Box plot для значений D
при соответствующем уровне фактора I
, полученных из (Lynn, Vanhanen, 2002)
На основе анализа рисунка 3 можно сделать выводы:
1. С ростом значения I
растет медиана значений D
.
2. С ростом значения I
увеличиваются как значения квантилей q
, q
, 9-й и 91-й процентили, так и расстояние между ними, т. е. увеличивается разброс значений D
.
3. Распределение значений D
в выборке становится более симметричным относительно своей медианы с ростом I
.
Приведем результаты аналогичных процедур обработки для данных, полученных в имитационной модели (таблица 2, рисунок 4).
Таблица 2[7 - Столбцы в таблице 2 аналогичны столбцам в таблице 1.]
Так же, как и в случае данных из (Lynn, Vanhanen, 2002), вероятность необоснованного отклонения гипотезы Н
весьма мала, ?7,59.10
(см. таблицу 2). Следовательно, так же как и в предыдущем случае, с большой степенью уверенности (1 – p ? 1) можно утверждать, что значения параметра D
полученные с помощью имитационной модели, зависят от значений параметра I
. Оценим характер этого влияния, используя график box plot для данных имитационной модели (см. рисунок 4).
Рис. 4. Box plot для значений D
при соответствующем уровне фактора I
, полученных из имитационной модели (справа – увеличение картинки «ящика с усами» для уровня фактора I
«низкий» и «средний»)
Как видно из рисунка 4, трем уровням фактора I
соответствуют следующие значения медианы D
: «низкий» – 0,03, «средний» – 0,59, «высокий» – 0,73.
На основе рисунка 4 можно сделать вывод: с ростом значения I
растет медиана значений D
.
Сравнивая выводы о характере зависимостей в данных (Lynn, Vanhanen, 2002) и данных, полученных из имитационной модели, мы можем отметить, что 1-й вывод для данных из книги (Lynn, Vanhanen, 2002) воспроизводится моделью. Эффекты 2 и 3 в списке выводов для реальных данных не воспроизводятся имитационной моделью. Возможной причиной этого является отсутствие фактического общего рынка, который, в силу конкуренции между странами на рынке товаров, мог бы снизить ВВП некоторых стран с высокими значениями средних компетенций I
, тем самым способствуя эффектам 2 и 3 в списке эффектов для данных (Lynn, Vanhanen, 2002).
Анализ результатов имитационной модели
Как было показано в предыдущем разделе, ВВП страны тем выше, чем выше средний уровень компетенций работников в данной стране. Используя результат доказанной выше теоремы, построим с помощью имитационной модели зависимость максимально возможного ВВП maxGDP
от среднего уровня компетенций I
в странах, а также рассчитаем и построим зависимость процента потерь ВВП rl
(максимально возможный ВВП при фиксированном распределении доходов минус реализовавшийся ВВП при том же распределении доходов) от среднего уровня компетенций I
:
Рис. 5. Зависимость максимально возможного ВВП от среднего уровня компетентности в стране (слева иллюстрация данных, справа средние значения и статистические оценки по трем группам значений: «низкий», «средний» и «высокий» уровень I
)
Как видно из рисунка 5, зависимость maxGDP
от среднего уровня компетенций I
имеет схожий с GDP
характер, однако процент потерь ВВП rl
примерно один и тот же для разных значений среднего уровня компетенций I
в стране (рисунок 6). Следовательно, характер зависимости GDP
от I
не определяется потерями от того, что распределение количества товара по группам качества по-разному сегментировано в группах стран с разными значениями среднего уровня компетенций I
.
На величину выражения (5), помимо степени сегментированности распределения количества товара по группам качества, определенного выше, очевидно влияет распределение доходов потребителей (IC). Сравним распределение доходов потребителей для различных групп значений средних компетенций I
.
Рис. 6. Зависимость процента потерь ВВП от среднего уровня компетентности в стране (сверху иллюстрация данных, снизу средние значения и статистические оценки по трем группам значений: «низкий», «средний» и «высокий» уровень Ii)
Из рисунка 7 видно, что распределение доходов для стран с высокими значениями I
доминирует над распределением доходов стран с низкими значениями I
. Это и предопределяет для этих стран, согласно формуле (5), более высокие значения GDP
. Значения доходов работников из формулы (4) определяются распределением капитала бизнесменов в данной стране, и оно имеет схожий характер с распределением дохода работников (распределение капитала бизнесменов для стран с высокими значениями I
определяет распределение капитала стран с низкими значениями I
). Для выяснения причин, лежащих в основе различия в распределении капитала бизнесменов между группой стран с низкими и высокими значениями I
, рассмотрим следующий пример расчетов. Внесем одно изменение в алгоритм имитационной модели: изменим правило назначения работников на подзадачи порогового типа. Для каждой страны с фиксированным средним уровнем компетенций I
заменим минимальный порог каждой пороговой подзадачи ?
в формуле (7) на величину ?
+ I
– const. Таким образом, подзадачи всех задач становятся одинаково доступны для индивидов из всех стран (т. е. мы расширяем потенциальное множество задач, доступных для выполнения в каждой стране, сделав его одним и тем же для разных значений I
). Одновременно мы не изменили вклад в качество товара, определяемого частью открытых подзадач. Приведем зависимость ВВП от значений среднего уровня компетенций в странах I
(рисунок 8).
Рис. 7. Распределение дохода среди работников в странах с низким, средним и высоким уровнями средней компетенции в стране. График приведен в двойном логарифмическом масштабе (по обеим осям отложены логарифмы указанных величин)
Как видно из рисунка 8, положительная связь между ВВП и I
исчезла. Данный результат стабильно сохраняется на больших значениях тактов модельного времени t. По результатам последнего вычислительного эксперимента в имитационной модели можно сделать вывод, что превосходство стран с высоким I
над странами с низким I
определяется тем, что для бизнесменов из первой группы (с высоким I
) доступно для реализации большее множество задач, в то время как для вторых (с низким I
), доступно лишь его ограниченное подмножество.