Читать книгу Практикум по анализу данных в социологии в программе SPSS (Наталья Сергеевна Воронина) онлайн бесплатно на Bookz
bannerbanner
Практикум по анализу данных в социологии в программе SPSS
Практикум по анализу данных в социологии в программе SPSS
Оценить:
Практикум по анализу данных в социологии в программе SPSS

3

Полная версия:

Практикум по анализу данных в социологии в программе SPSS

Наталья Сергеевна Воронина

Практикум по анализу данных в социологии в программе SPSS

Посвящаю своей маме

Ворониной Елене Владимировне

Федеральное государственное бюджетное образовательное учреждение высшего образования «Государственный Академический Университет Гуманитарных Наук»

Рецензенты:

Григорьев Дмитрий Сергеевич – кандидат психологических наук,

научный сотрудник НИУ ВШЭ;

Кученкова Анна Владимировна – кандидат социологических наук,

старший научный сотрудник Института социологии ФНИСЦ РАН,

доцент РГГУ и ГАУГН;

Стрельникова Анна Владимировна – кандидат социологических наук,

доцент НИУ ВШЭ,

старший научный сотрудник Института социологии ФНИСЦ РАН,

доцент ГАУГН


© Воронина Н. С., 2024

© Рачко Г. Н., иллюстрации. 2024

Введение

В данном пособии читатель найдет краткий и простой в использовании курс по применению социологами статистических методов для анализа данных.

Акцент в учебном пособии сделан на практическом использовании навыка анализа данных и интерпретации полученных результатов. При описании назначения методов мы пытались сделать материал максимально понятным. Изучив приведенные примеры гайдов по выполнению статистических операций в SPSS и примеры интерпретации данных для конкретных социологических задач, читатель сможет применять полученные знания к своим исследованиям.

Очень часто в рабочем процессе автор данного учебного пособия сталкивался со студентами и коллегами, «убежденными качественниками», которые считали, что для анализа данных необходимо обладать неординарными математическими способностями и им никогда не овладеть таким навыком. Мы написали практическое руководство так, чтобы человек, даже без специальной математической подготовки, понял, что анализ данных можно освоить и успешно применять в исследовательской практике.

Книга адресована студентам бакалавриата и магистратуры, исследователям и специалистам, а также может быть полезна для преподавателей дисциплин по анализу данных, SPSS, так как содержит большое количество практических заданий и тестов.

Учебное пособие состоит из 12 глав. Каждая из глав о методах анализа данных включает в себя разделы:

1) для чего нужен метод,

2) требования и ограничения / условия применения метода,

3) как выполнить анализ в SPSS, а также интерпретацию полученных результатов.

Каждая из глав содержит вопросы для самопроверки, практические задания, список рекомендуемой литературы по теме и список примеров работ, где можно посмотреть, как другие авторы проводили аналогичный анализ.

Глава 1 посвящена объяснению того, как практически применять навыки анализа данных в научных работах, отчетах, дипломах, где предполагается применение количественной методологии. Для того чтобы показать место анализа данных в структуре научной работы, автор приводит описание каждого из пунктов структуры. На примерах показано, как приступить к анализу литературы, как написать введение, что должно быть описано в актуальности, как найти аргументы в пользу актуальности изучаемой темы, что позволяет выявить проблему исследования, как сформулировать цель и задачи исследования, как нащупать гипотезы исследования, описать данные и методы исследования и, наконец, интерпретировать результаты, привести основные выводы и обсудить полученные результаты. Также глава содержит описание наиболее распространенных ошибок при составлении анкеты для социологического исследования. После прочтения этой главы читатель поймет, что анализ данных не может существовать без проработки всех пунктов, описанной структуры и должен обязательно служить решением поставленной научной проблемы.

Главы 2-12 посвящены технологическим аспектам применения SPSS для анализа данных в социологических исследованиях.

Глава 2 знакомит читателя с программой SPSS, позволяет овладеть навыком ввода и загрузки данных. Автор показывает на конкретных примерах, как определять уровень измерения шкал в социологических исследованиях и правильно их применять в соответствии с той или иной задачей. Компьютерная программа производит анализ данных по тем данным, которые мы вводим, соответственно, задача исследователя в том, чтобы все виды анализа осуществлялись для тех шкал, для которых каждый из них предназначается. Автор показывает, как вводить данные по вопросам с множественными ответами, а также как вводить данные по «табличным вопросам». Большое количество практических примеров позволяет понять данную тему и не сомневаться в выборе шкал, что очень важно для исследователя.

Глава 3. Прежде чем выполнять расчеты, часто необходимо подготовить данные. Поэтому эта глава посвящена преобразованию данных и отбору по условиям. Глава включает разделы о взвешивании данных, создании фильтров (когда необходимо анализировать лишь часть выборки), описывает процедуру расщепления файла, функцию объединения данных, перекодировку в те же и другие переменные, освещает процедуру ранжирования наблюдений, вычисления новой переменной с примером расчета социологического индекса и описывает процедуру проверки индекса на надежность.

Глава 4 посвящена одномерному анализу данных, без которого не обходится ни одно количественное исследование. Данный вид анализа, в частности, позволяет получить представление о распределении частоты ответов респондентов на интересующий исследователя вопрос. В этой главе рассматривается выполнение частотного анализа, описательных статистик, расчет мер центральной тенденции, разброса, а также анализ множественных ответов. Читатель знакомится с выполнением расчета средних значений. Методы сравнения средних значений рассматриваются в главах 5 и 6.

Глава 5 посвящена сравнению средних значений для параметрических данных. Глава включает в себя рассмотрение одновыборочного T-критерия, T-критерия для независимых выборок, Т-критерия для парных выборок, а также однофакторный дисперсионный анализ (ANOVA).

Глава 6 рассматривает процедуры сравнения средних значений, но для непараметрических данных. Глава включает в себя рассмотрение критерия Манна – Уитни, критерия Краскела – Уоллиса, критерия Вилкоксона, критерия Фридмана.

Глава 7 описывает методику двумерного анализа данных. Из главы читатель узнает, как анализировать таблицы сопряженности, а также как правильно применять коэффициенты связи для разных шкал. Для определения связи между номинальными данными в главе подробно рассматривается критерий Хи-квадрат, для количественных шкал – коэффициент корреляции Пирсона, для порядковых – коэффициенты корреляции Спирмена и Кендалла. А также глава содержит раздел о частных корреляциях.

Глава 8 рассматривает регрессионный анализ, который позволяет выявить связь между одной зависимой и одной или несколькими независимыми переменными. В отличие от коэффициентов корреляции регрессионный анализ позволяет выявить влияние независимых переменных на зависимую переменную.

В главе рассматриваются разные виды регрессионного анализа в зависимости от уровня измерения шкалы: простая и множественная регрессия (когда и независимые переменные, и зависимая переменная измерены в количественной шкале); линейная регрессия с фиктивными переменными для случаев, когда игрек количественный, а в качестве иксов есть необходимость ввести номинальные переменные; линейная регрессия с эффектами взаимодействия, когда исследователь предполагает, что характер связи переменных может быть неоднороден в зависимости от подгрупп; бинарная логистическая регрессия для ситуации, когда игрек может принимать только два значения, а иксы могут быть измерены по любой шкале; мультиномиальная регрессия – частный случай бинарной логистической регрессии, – когда игрек принимает три значения и более, а иксы измерены по любой шкале; порядковая регрессия, когда зависимая переменная (игрек) измерена в порядковой шкале, а иксы могут быть любыми.

Глава 9 посвящена обсуждению факторного анализа (ФА) и метода главных компонент (МГК). Приводится обсуждение различий метода ФА и МГК. Факторный анализ претендует на выявление некоторых латентных переменных, а метод главных компонент позволяет сократить размерность пространства. Таким образом, он может быть обоснованием создания индекса.

Глава 10 описывает методику проведения кластерного анализа, представляющего метод многомерной классификации данных, позволяющего находить группы похожих объектов в пространстве данных по заданным параметрам классификации. В главе также рассматривается метод классификации к-средних.

Глава 11 рассматривает метод деревьев решений (CHAID), который также относится к методам многомерной классификации. С помощью данного метода можно ответить на вопрос, какие из независимых переменных наиболее сильно связаны с зависимой переменной. В социологии данный метод часто применяется для построения социально-демографического портрета какой-либо из социальных групп. Метод очень нагляден, удобен в интерпретации и в использовании, поскольку позволяет осуществить применение любого вида шкал, а также он устойчив к выбросам, позволяет улавливать не только линейные, но и нелинейные связи.

Глава 12 описывает дискриминантный анализ. Данный метод многомерной классификации предполагает предсказание попадания объектов в определенный класс. Задача метода – узнать, отличаются ли друг от друга классы по заданным параметрам.

Перед прочтением данного учебного пособия рекомендуем повторить[1] базовые для социолога понятия, которые будут встречаться в тексте, такие как выборка, генеральная совокупность, статистическая гипотеза, доверительный интервал, ошибка первого и второго рода, нулевая и альтернативная гипотезы, статистическая значимость, нормальное распределение, мода, медиана, среднее значение и другие.

Необходимо отметить, что при анализе данных в большинстве случаев мы имеем дело с выборками, а не с генеральной совокупностью. Практически никогда у нас нет в доступе генеральной совокупности. Поэтому за страницами данной книги останутся темы качества выборки, ее репрезентативности, правильного сбора данных, так как это темы для отдельного обсуждения.

Для исследовательских задач редко бывает необходимо получать результаты по конкретной нерепрезентативной выборке, обычно важно переносить результаты выборки на генеральную совокупность. Поэтому в учебном пособии большое внимание уделяется способам переноса данных с исследуемой выборки на генеральную совокупность, для этого осуществляется проверка статистических гипотез. Большинство методов анализа, которые мы будем обсуждать, предполагают генерализацию выводов (то есть статистическую проверку того, что вывод, полученный на выборке, которую мы используем, характерен и для генеральной совокупности).

Автор книги – Наталья Сергеевна Воронина – кандидат социологических наук, старший научный сотрудник Института социологии ФНИСЦ РАН, доцент Государственного университета гуманитарных наук (где преподает дисциплину «Практикум по анализу данных в социологии» с 2017 года), автор более 50 научных публикаций по социологии, участник многочисленных научных грантов РНФ, РФФИ. Наталья Сергеевна Воронина окончила школу с золотой медалью, с 2005 по 2010 год обучалась в ГАУГН (получен диплом с отличием, специальность «социолог, преподаватель социологии»), затем продолжила освоение количественных методов в социологии с помощью ряда курсов повышения квалификации (2017 год – «Количественный анализ социальных данных на основе SPSS и R» НИУ ВШЭ, 2017 год – «Методы многомерной классификации» НИУ ВШЭ, 2019 год – «Математические методы в психологии» СПбГУ, 2019 год – «Эксперт IBM SPSS Statistics» МГТУ имени Баумана).

Автор хотел бы поблагодарить своих преподавателей количественных методов Г. Г. Татарову, Ю. Н. Толстову, А. В. Стрельникову, А. Ю. Кропачева, Ю. Б. Епихину, М. Ф. Черныша, которые оказали неоценимую поддержку автору на этапе приобретения исследовательских навыков, призывали аккуратно относиться к анализу данных, познакомили с количественными методами и привили любовь к аналитической деятельности. Автор благодарит рецензентов Д. С. Григорьева, А. В. Стрельникову и А. В. Кученкову, а также Практикум по анализу данных в социологии в программе SPSS А. В. Жаворонкова за ценные комментарии и научную редактуру, которые были учтены при доработке текста. Благодарю А. В. Андреенкову за возможность анализировать российские данные Европейского Социального Исслледования, Ю. А. Зубок за небезразличное отношение к проблемам молодых ученых, коллег из ИСФНИСЦ РАН, которые всегда помогали советом и вдохновляли личным примером. Благодарю Д. Колодинского за качественную верстку данного учебного пособия. А также благодарю всю свою семью за поддержку.

Автор отдельно хотел бы поблагодарить преподавателя курсов повышения квалификации в НИУ ВШЭ Воронину Наталью Дмитриевну, чьи лекции были полезными для освоения навыка анализа данных. Знания, полученные на этих курсах, были использованы автором в собственной преподавательской деятельности и при составлении данного учебного пособия.

Автор благодарит талантливую молодую художницу Галину Рачко, придумавшую и создавшую иллюстрации к этой книге, с помощью которых мир анализа данных, мы надеемся, станет еще увлекательнее.

Глава 1. Практическое применение навыка анализа данных

Перед начинающим исследователем часто стоит вопрос: как в действительности применить навыки использования анализа данных?

В практике руководства студенческими работами автор часто сталкивается с тем, что студенты, освоив некоторый набор методов анализа данных и включив в текст некоторую аналитику данных, ошибочно полагают, что они тем самым подготовили научную работу. Поэтому мы считаем необходимым начать обсуждение с того, какое место занимает анализ данных в структуре научной работы.

В методической литературе существует большое количество описаний того, как строится научная деятельность и как написать научную работу. Этот процесс всегда содержит творческий элемент, видение автора, однако работать в некоторой структуре всегда легче, чем без нее. В самом упрощенном виде логику написания научной работы можно представить таким образом:

1.1. Примерный план научной работы

• Введение (актуальность, проблема, цель, задачи).

• Глава 1. Основные теоретические подходы к вашей теме.

• 1.1. Обоснование выбора теоретического подхода, используемого в работе.

• 1.2. Обзор зарубежных исследований о вашей теме.

• 1.3. Обзор российских исследований о вашей теме.

• Гипотезы.

• Глава 2. Данные и метод.

• 2.2. Результаты.

• 2.3. Обсуждение.

• Используемая литература.

Разберем подробнее каждый из пунктов.

Прежде всего стоит сказать несколько слов о выборе области исследования для научной работы. Для лучшей мотивации к работе над текстом стоит выбирать область, которая вас действительно интересует и увлекает.

Чтобы определить область исследования, необходимо сначала немало прочитать и записать много вариантов того, как может звучать ваша тема исследования. Советуем записывать варианты и затем обсуждать их с научным руководителем. Чтобы корректно и лучшим образом сформулировать тему исследования, посмотрите названия научных статей, диссертаций на выбранную вами тематику. Нужно помнить: то, что допускается для названия научной статьи, не всегда допускается для студенческих / аспирантских работ. Название для ВКР / диссертации должно быть сформулировано таким образом, чтобы оно не просто включало в себя описательный характер (например, «Особенности студенческой молодежи города Москвы»), а содержало в себе проблемную составляющую (например, «Влияние экономических и культурных ресурсов на успеваемость школьников из многодетных семей»[2]). Чаще всего тема, содержащая слово «особенности», сформулирована по принципу «это просто интересно посмотреть», не содержит научной новизны и как таковой исследовательской проблемы. Иначе говоря, выявление особенностей какой-либо социальной группы не является проблемой исследования, а сам термин «особенности» даже не является научным, но о формулировке проблемы исследования поговорим чуть позже.

Еще одна рекомендация при выборе темы: не стоит делать название очень громоздким, оно должно быть четким, ясным и предполагать конкретный ответ и внятный результат.

Во-первых, в название работы не стоит включать «сомнительные» термины. Например, если вы внесете в название «ментальные программы», к вам сразу же возникнет множество вопросов и критики от преподавателей вашего вуза. Что означает данный термин? Кто его разработал? Как эмпирически изучать «ментальные программы»? Таким образом, лучше не включать в работу термины, которые считаются околонаучными или недостаточно теоретически проработанными в социологии.

Во-вторых, следует избегать таких названий, которые похожи скорее на заголовок журналистской статьи, нежели научной работы, например: «Что, уже уходите? Как россияне относятся к отставке правительства?».

Написание научного текста – это не волшебный процесс. Написать научный текст без предварительного погружения в проблему исследования, без чтения множества литературных источников невозможно. Начинать нащупывать проблему можно, читая новости из социальной сферы, где вы можете остановить свое внимание на какой-то проблеме, которая вас заинтересует. Затем можно обратиться к порталам социологических исследований и поискать по основным тэгам на выбранную тематику, затем ознакомиться с основными социологическими журналами и там собрать литературу, относящуюся к вашей проблематике. Проблему своего исследования можно сформулировать исходя из результатов исследователей, отраженных в научных статьях схожей тематики. Знакомясь с их выводами, можно понять направление дальнейших научных разработок. Мы рекомендуем сделать подборку литературы из статей / монографий не только на русском, но и на английском языке (при знании других языков, нужно задействовать и это умение). Чтобы вам было понятнее, покажем на примере поиска исследовательской проблемы.

Например, нас интересует тема интеграции и адаптации иммигрантов. Этот интерес может выразиться в конкретных вопросах: каковы установки россиян к иммигрантам? с чем связаны негативные установки россиян к иммигрантам? что влияет на установки принимающего население к иммигрантам?

После осознания вопросов нужно читать подборку новостей на эту тематику, подмечая резонансные случаи, освещаемые в СМИ. Можно обратить внимание на то, что в СМИ практически отсутствуют статьи / репортажи о положительной роли иммигрантов, а превалируют новости о периодически возникающих драках, потасовках, где подчеркивается иная национальность нападавших. Уже тогда можно предположить, что СМИ являются фактором, увеличивающим негативные установки к иммигрантам, но это предположение требует эмпирической проверки.

Рекомендуем создать папку на рабочем столе, куда будут собираться все статьи, монографии на русском / английском языках, которые содержат теги: «установки по отношению к иммигрантам», «факторы, влияющие на установки по отношению к иммигрантам» и т. д.

Не стоит читать все сразу и подробно, на первом этапе просто достаточно просмотреть и скачать материалы, создавая свою электронную библиотеку по выбранной области. Кроме того, полезно просматривать список литературы в работах авторов, которые являются неоспоримыми специалистами в данной проблематике. Чтобы узнать, кто является таким специалистом, достаточно зайти на сайты известных научных институтов и просмотреть персональные страницы исследователей, занимающихся близкой темой к вашей проблематике. Следует избегать так называемых «мусорных журналов», которые публикуют любой текст за деньги без процедуры рецензирования, а также некачественных статей, где нет или практически нет ссылок на используемую литературу. Также следует понимать, что в мировой научной литературе тоже накоплен опыт изучения выбранной вами тематики и получены значимые результаты, поэтому не стоит ограничиваться только российскими исследователями.

После создания собственной библиотеки можно приступать к чтению литературы с целью выявить, что остается не изученным в данной области исследования. Можно сразу делать себе пометки, формулировать тезисы о том, что уже было сделано до вас в этой области. После этого следует приступить к формулировке проблемы исследования.

1.2. Проблема исследования

Существуют различные подходы к определению проблемы исследования, очень много методических рекомендаций о том, как ее сформулировать. Тем не менее считается, что сформулировать проблему – задача творческая, и крайне сложно давать какие-либо рекомендации, все очень индивидуально в каждом исследовании. Посещая семинары журнала «Социс» о том, как написать статью, можно сделать вывод, что нет никакого готового шаблона, по которому можно было бы со стопроцентной уверенностью точно сформулировать проблему исследования, однако если зайти в графу лучших публикаций[3] журнала[4] и почитать, как различные исследователи формулируют проблему, то можно обнаружить, что проблема исследования представляет собой некое противоречие. Это может быть противоречие в понимании социального явления, противоречие в интерпретации, противоречие в эмпирических результатах различных исследований. В. А. Ядов писал, что «предметная сторона проблемы социологического исследования – это некое социальное противоречие, требующее организации целенаправленных действий для его устранения или выбора одной из возможных альтернатив социального развития»[5]. Как справедливо отмечает В. В. Радаев, необходимо различать социальную проблему от исследовательской[6]. Автор приводит пример, что само по себе наличие безработицы относится к социальной проблеме, но не является исследовательской. Также не следует подменять проблему исследования отсутствием знания о чем-либо. Тот факт, что то или иное явление, на ваш взгляд, недостаточно изучено, не делает его исследовательской проблемой: «подменяя предмет (проблему) ссылкой на объект исследования (пусть даже он весь представляет сплошное белое пятно), мы облегчаем себе жизнь, но не продвигаемся к смыслу. И каждый раз нам придется отвечать на неумолимый и жесткий вопрос: белых пятен много, зачем нам изучать именно это?»[7].

Итак, пункт «Проблема исследования» является самым важным и трудоемким при написании научной работы. Если не получается сформулировать проблему исследования, не получится и построить общую логику исследования. Для того чтобы сформулировать проблему исследования, необходимо ознакомиться с большим количеством достоверных источников по выбранной теме. Это чтение должно содержать цель – поиск проблемы, то есть поиск противоречия между реальным положением дел и желаемой ситуацией для общества. Приведем пример формулировки проблемы из исследования цифрового неравенства[8]. Когда только создавалось такое технологическое средство, как Интернет, его потенциал положительно оценивался в плане расширения возможностей для традиционно подчиненных групп, однако современные исследования констатируют, что женщины оказываются в невыгодном положении. Мужчины по всему миру имеют больше доступа к Интернету. Возникает противоречие между ожидаемыми и реальными последствиями цифровизации.

Приведем еще один пример. Изучая установки по отношению к иммигрантам в России, мы выяснили, что большинство россиян (более 60 %) негативно оценивают изменения, которые иммигранты привносят в жизнь нашей страны (это реальное положение дел). Однако в нашей стране убыль населения превышает рождаемость, возникает проблема нехватки рабочей силы, эту проблемы государство, в частности, решает за счет привлечения иммигрантов. То есть государство заинтересовано в том, чтобы иммигранты приезжали на работу в Россию (это желаемая ситуация для общества). Противоречие в том, что при таких установках по отношению к иммигрантам население может быть против въезда иммигрантов в Россию, что может приводить к росту социальной напряженности, конфликтным ситуациям между принимающим населением и приезжими, следовательно, необходимо изучать факторы, которые влияют на установки по отношению к иммигрантам у россиян в динамике.

Для того чтобы было легче сформулировать проблему исследования на первых этапах научной деятельности, можно использовать технологию «рыбного скелета»[9] («Фишбоун»). Она состоит из четырех логически связанных частей (рисунок 1).


Рисунок 1. Схема «Фишбоун» для определения проблемы исследования

bannerbanner