1 Алгоритм вычисление основных показателей описательной статистики и критерия Стьюдента в Microsoft Office Excel
Задание:
1. Сравните площади фермерских хозяйств в Брестской и Гомельской областях с помощью описательных статистик. 2. Выполните анализ полученных описательных статистик. 3. Оцените различие выборок для Брестской и Гомельской областей с помощью дисперсионного анализа. 4. Сделайте общие выводы по работе (раздел Выводы).
2. Постройте задание для вычисление основных показателей описательной статистики в плане вашей научной работы (курсоввой, магистерской). Опишите исходные данные (количество факторов/строк, длина выборки по каждому фактору, единицы измерения), поясните ожидаемые результаты.
Рекомендации по выполнению работы:
Решение рассмотрим на примере двух выборок, в которых приведена площади фермерских хозяйств в Брестской и Гомельской областях. Первоначально набираем в ячейках А2-А3 названия областей, в В2–H2 и B3–H3 цифры площадей для каждой области (рис. 1).
Рис. 1. Исходные данные для расчетов
Основными статистические показатели, характеризующими данные выборки являются: среднее (М), медиану (Ме), наименьшее, наибольшее, коэффициент вариации (V), среднеквадратическое отклонение (σ), дисперсия (σ2). Среднее (М) находится следующим образом: выполняем команду Функция из меню Вставка (или нажимаем на иконку fx на панели инструментов), далее в категориях Статистические выбираем функцию СРЗНАЧ (рис. 2), сворачиваем появившееся окно нажатием на кнопку напротив поля Число 1. Выделяем ячейки со значениями площадей для первой области (B2:H2), разворачиваем окно, нажав на эту же кнопку и жмем [ОК]. Для второй области можно не делать описанную выше процедуру, а воспользоваться функцией автозаполнения: выделяем ячейку с найденным средним значением для первой области (I2), и наведя курсор на правый край клетки I2 до превращения курсора в «крестик»: , удерживая левую кнопку мыши растягиваем выделение на нижележащую клетку (I3), в которой появится значение для второй области.
Рис. 2. Окно выбора функции
Аналогичным способом находим медиану (команда МЕДИАНА(B2:H2)), наименьшее =МИН(B2:H2) и наибольшее =МАКС(B2:H2) значения, коэффициент вариации =СТАНДОТКЛОН(B2:H2)/СРЗНАЧ(B2:H2)*100, среднеквадратическое отклонение =СТАНДОТКЛОН(B2:H2) и дисперсию =ДИСП(B2:H2). При помощи автозаполнения производим расчет для второй области. MS Excel может производить вычисления при наборе функции вручную, при этом следует помнить, что команды набираются на русском языке, а буквенные обозначения ячеек – латинские.
Расчет базовых статистических показателей может производиться с использованием надстройки (опции) «Пакет анализа», которая позволяет оперативно получить значения показателей описательной статистики. По умолчанию эта опция не установлена, поэтому для ее активации необходимо с помощью команды Надстройки из меню Сервис открыть окно диалога «Надстройки» и в нем установить флажок для компоненты «Пакет анализа». После нажатия кнопки [ОК] меню Сервис будет дополнено командой Анализ данных.
Для расчета показателей выполняем последовательность команду Анализ данных из меню Сервис в диалоговом окне Анализ данных выбираем Описательная статистика, в поле «Входной интервал» указываем наш (клетки A2:H3), в поле группирование выбираем «по строкам», ставим галочку у «Метки в первом столбце» в «Параметрах вывода» выбираем «Выходной интервал» и указываем там ячейку B5 или другую свободную, отмечаем параметры «Итоговая статистика» и «Уровень надежности» (значение можно изменять, в нашем случае указываем 95%), нажимаем [OK].
Нахождение сходства или отличия между двумя выборками с помощью t-теста (критерия Стьюдента). Выбор конкретной команды зависит от типа выборки (зависимая/независимая и от величин дисперсий. Так, для независимой выборки с различными дисперсиями выполняются следующие действия: Сервис – Анализ данных – Двухвыборочный t-тест с различными дисперсиями – ОК. Для независимой выборки с одинаковыми дисперсиями алгоритм следующий: Сервис – Анализ данных – Двухвыборочный t-тест с одинаковыми дисперсиями – ОК, для сопряженной выборки: Сервис – Анализ данных – Парный двухвыборочный t-тест для средних – ОК.
В поле «интервал переменной 1» указываем интервал значений для первой области (A2:H2), в поле «интервал переменной 2» – интервал значений для второй области (A3:H3), ставим галочку у окна «Метки» далее выбираем «Выходной интервал» и указываем там ячейку G5 (или другую свободную), нажимаем [ОК].
В полученных данных df – число степеней свободы; t-статистика – критерий Стьюдента (фактический); t критическое двухстороннее – критерий Стьюдента (табличный). На основании соотношения t-статистики (берется по модулю) и t критического двухстороннего делается вывод об достоверности различия выборок.
- 7 Декабрь 2022, 11:42
- 7 Декабрь 2022, 11:42