§ библиотека мастерская Помощь Контакты Вход —

Татарова Г.Г. Методология анализа данных в социологии (введение) /Учебник для вузов

В каталоге: Разное
Прислано в библиотеку: Vsevolod
Стр. 126

И наконец, представляется важным следующее. Одномерное распределение можно анализировать на разных «языках». Первый основной ¾ язык математической статистики, статистического анализа. Огромное количество литературы описывает именно этот аспект. Основной постулат статистического подхода: одномерное распределение ¾ результат только одного наблюдения генеральной совокупности и, соответственно, подвержено влиянию случайных, неконтролируемых, факторов. Если выборка была «хорошей», то по ней можно с определенной точностью вычислить характеристики генеральной совокупности. Отсюда и возникает понятие доверительного интервала, интервала, в котором находится истинное (для генеральной совокупности) значение такого рода характеристики. На языке статистического анализа возможные значения признака называют вариантами, а их совокупность и соответствующие им частоты ¾ вариационным рядом. Этими терминами социологи практически не пользуются.

Второй «язык» опирается на информационный подход или понятия теории информации. Существует понятие единицы информации. Таковой является бит (от английского binary digit ¾ двоичная цифра). Любой поток информации (числа, буквы, фразы) можно закодировать нулями и единицами. Число нулей и единиц, необходимых для оптимального (самого короткого) кодирования этого потока, называется количеством информации.

Представим теперь ситуацию, когда нам надо что-то узнать. Например, кто-то из вас загадал кого-то из присутствующих. Какое число вопросов надо мне задать ему, чтобы узнать, «кого» он загадал. При этом только вопросы с вариантами ответа «да» и «нет». Для этого я составлю список из всех, например, 32 присутствующих студентов. Затем поделю этот список на две части и спрошу, указывая на первую часть списка, «есть ли загаданный в этой части». Тем самым определю 16 студентов, среди которых есть и загаданный. Повторю процедуру деления на две части и получу список из 8-ми студентов, среди которых есть и загаданный. Продолжение такой процедуры деления приводит к результату. Мне надо было задать всего пять вопросов. Пять и есть количество информации. Это количество можно было определить и по-другому. Каждому порядковому номеру студента поставлю в соответствие пятизначное двоичное число от 00000 до 11111 и спрошу, верно ли, что у задуманного студента первая, вторая, третья, четвертая и пятая цифры равны единице?

из 225
Предыдущая    Следующая
 
Реклама
Авторизуйтесь