1. Нахождение статистических характеристик.
К ним относятся - мода, медиана, дисперсия и другие. Формулы приводить не буду - их можно найти в любом учебные по социально-экономической статистике. Все эти показатели используются при одномерном анализе, то есть анализируется один вопрос (изучаем распределение по выборке).
2. Двумерный анализ.
Например, рассматриваем 2 признака:
- Пол (м/ж)
- Чаще всего с друзьями обсуждаю проблемы искусства (да/нет)
После первичной обработки получаем такую таблицу
Пол | Да | Нет | Итого |
Мужской | 1 | 2 | 3 |
Женский | 1 | 2 | 3 |
Итого | 2 | 4 | 6 |
Далее, находим % по строкам и получаем
Пол | Да | Нет | Итого |
Мужской | 33 | 67 | 100 |
Женский | 33 | 67 | 100 |
Итого | 33 | 67 | 100 |
Вывод: 33% мужчин (из числа опрошенных) обсуждают проблемы искусства;
33% женщин (из числа опрошенных) обсуждают проблемы искусства и т.д.
Найдем % по столбцам
Пол | Да | Нет | Итого |
Мужской | 50 | 50 | 50 |
Женский | 50 | 50 | 50 |
Итого | 100 | 100 | 100 |
Вывод: Из числа респондентов чаще всего обсуждающих проблемы искусства - 50% мужчин и 50% женщин.
Данные выводы показывают, что взятые признаки независимы.
ПРИМЕР 2. Рассмотрим:
- Возраст респондентов
- Чаще всего с друзьями беседуем о любви
Возраст | Да | Нет | Итого |
До 30 лет | 2 | 0 | 2 |
Старше 30 лет | 3 | 1 | 4 |
Итого | 5 | 1 | 6 |
Возраст | Да | Нет | Итого |
До 30 лет | 100 | 0 | 100 |
Старше 30 лет | 75 | 25 | 100 |
Итого | 83 | 17 | 100 |
Вывод: вся молодежь из числа опрошенных говорит о любви, и т.д.
Возраст | Да | Нет | Итого |
До 30 лет | 40 | 0 | 33 |
Старше 30 лет | 60 | 100 | 67 |
Итого | 100 | 100 | 100 |
Вывод: Интенсивность разговоров о любви (частота выбора этой темы при беседе) у тех, что старше 30 лет - выше.
Таким образом - изучаемые признаки зависимы, поэтому можем найти коэффициент корреляции (формулы в учебниках по социально-экономической статистике), который нам покажет тесноту этой связи.
Вот и все основные методы.
Спасибо за внимание
Надеюсь все понятно