Измерительные шкалы.
Прикладной системный анализ
Перейдем теперь к вопросу о допустимых операциях над данными, выраженными в номинальной шкале. Обозначения классов — это только символы. Если у одного спортсмена на майке номер 4, а у другого 8, то никаких других выводов, кроме того, что это разные участники соревнований, сделать нельзя. С номерами нельзя обращаться как с числами, за исключением определения их равенства или неравенства. Только… Читать ещё >
Измерительные шкалы. Прикладной системный анализ (реферат, курсовая, диплом, контрольная)
Измерение — это алгоритмизированная операция, которая данному наблюдаемому состоянию объекта, процесса, явления ставит в соответствие определенное обозначение: число или символ. Результаты измерений содержат информацию о наблюдавшемся объекте. Количество информации зависит от степени полноты этого соответствия и разнообразия вариантов. Нужная нам информация получается из результатов измерений с помощью их преобразований. Совершенно ясно, что чем теснее соответствие между состояниями и их обозначениями, тем больше информации можно извлечь в результате обработки данных. Менее очевидно, что степень этого соответствия зависит не только от организации измерений, но и от природы исследуемого явления, и что сама степень соответствия определяет допустимые и недопустимые способы обработки данных.
Здесь мы рассмотрим только такие объекты, про любые два состояния которых можно сказать, различимы они или нет, и только такие алгоритмы измерения, которые различным состояниям ставят в соответствие разные обозначения, а неразличимым состояниям — одинаковые обозначения. Это означает, что как состояния объекта, так и их обозначения удовлетворяют следующим аксиомам тождества:
- 10. Либо А=В, либо АВ
- 20. Если А=В, то В=А
- 30. Если А=В и В=С, то А=С
Шкалы наименований. Предположим, что число различных состояний конечно. Каждому классу эквивалентности поставим в соответствие обозначение, отличное от обозначений других классов. Тогда измерение будет состоять в том, чтобы, проведя эксперимент над объектом, определить принадлежность результата к тому или иному классу эквивалентности и записать это с помощью символа, обозначающего данный класс. Такое измерение называется измерением в шкале наименований.
Особенности шкалы наименований рассмотрим на примерах. Естественнее всего использовать шкалу наименований для классификации дискретных по своей природе явлений. Для обозначения классов могут быть использованы символы естественного языка (географические названия, имена), произвольные символы (гербы и флаги, эмблемы родов войск), номера (гос. номера автомобилей, исх. номера документов, номера на майках спортсменов), их различные модификации (почтовые адреса). При большом числе объектов их конкретизация упрощается, если обозначения вводятся иерархически (почтовые адреса).
Необходимость классификации возникает и в тех случаях, когда классифицируемые состояния образуют непрерывное множество. Задача сводится к предыдущей, если все множество разбить на конечное число подмножеств. Однако, условность введенных классов рано или поздно проявится на практике. Например, возникают трудности при точном переводе с одного языка на другой при описании цветовых оттенков (в английском языке голубой, лазоревый и синий цвета не различаются).
Перейдем теперь к вопросу о допустимых операциях над данными, выраженными в номинальной шкале. Обозначения классов — это только символы. Если у одного спортсмена на майке номер 4, а у другого 8, то никаких других выводов, кроме того, что это разные участники соревнований, сделать нельзя. С номерами нельзя обращаться как с числами, за исключением определения их равенства или неравенства. Только эти отношения определены между элементами номинальной шкалы. Поэтому при обработке экспериментальных данных, зафиксированных в номинальной шкале, непосредственно с самими данными можно выполнять только операцию проверки их совпадения или несовпадения.
Изобразим эту операцию с помощью символа Кронекера ij=1: xi=xj; 0: xixj, где xi и xj — записи разных измерений. С результатами этой операции можно выполнять более сложные преобразования: считать количества совпадений (например, число наблюдений kкласса равно.
n — общее число наблюдений); вычислять относительные частоты классов (например, частота kкласса есть); сравнивать эти частоты между собой, выполнять различные статистические процедуры, строго следя, чтобы в этих процедурах с исходными данными не выполнялось никаких действий, кроме операции проверки их на совпадение.
Порядковые шкалы. В тех случаях, когда измеряемый признак состояния имеет природу не только позволяющую отождествлять состояния с одним из классов эквивалентности, но и дающую возможность в каком-то отношении сравнивать разные классы, для измерений можно выбрать более сильную шкалу, чем номинальная. Следующей по силе за номинальной шкалой является порядковая (или ранговая) шкала. Этот класс шкал появляется, если кроме аксиом тождества 10 — 30 классы удовлетворяют следующим аксиомам упорядоченности:
- 40. Если А>В, то В<�А
- 50. Если А>В и В>С, то А>С
Обозначив такие классы символами и установив между этими символами те же отношения порядка, мы получим шкалу простого порядка. Примерами применения такой шкалы являются: нумерация очередности, воинские звания, призовые места на соревнованиях.
Иногда оказывается, что не каждую пару классов можно упорядочить по предпочтению: некоторые пары считаются равными. В этом случае аксиомы 40 и 50 видоизменяются.
- 41. Либо АВ, либо АВ
- 51. Если АВ и ВС, то АС
Шкала, соответствующая аксиомам 41 и 51 называется шкалой слабого порядка. Примером шкалы слабого порядка служит упорядочение по степени родства с конкретным лицом (мать=отец>сын=дочь) и т. д.
Иная ситуация возникает, когда имеются пары классов, несравнимые между собой, т. е. ни АВ, ни ВА. В этом случае говорят о шкале частичного порядка. Такие шкалы часто возникают в социологических исследованиях субъективных предпочтений. Например, при изучении покупательского спроса субъект часто не в состоянии оценить, какой именно из двух разнородных товаров ему больше нравится (клетчатые носки или фруктовые консервы).
Характерной особенностью порядковых шкал является то, что отношение порядка ничего не говорит о дистанции между сравниваемыми классами. Поэтому порядковые экспериментальные данные, даже если они изображены цифрами, нельзя рассматривать как числа, над ними нельзя выполнять действия, которые приводят к получению разных результатов при преобразовании шкалы, не нарушающей порядка. Например, нельзя вычислять выборочное среднее порядковых измерений, т. е.
.
так как переход к монотонно преобразованной шкале при усреднении даст.
Однако допустима операция, позволяющая установить, какое из двух наблюдений xi или xj предпочтительнее, хотя формально эту операцию мы можем выразить через разность xi — xj. Введем индикатор положительных чисел — функцию Тогда если xi xj и мы ввели цифровую шкалу порядка, то.
а ,.
что и позволяет установить предпочтительность xi перед xj. Число.
.
где n — число сравниваемых объектов, называется рангом i — го объекта. (Отсюда происходит другое название порядковых шкал — ранговые).
Итак, при измерениях в порядковых (в строгом смысле) шкалах обработка данных должна основываться только на допустимых для этих шкал операциях — вычисления ij=1: xi=xj; 0: xixj и С этими числами можно «работать» дальше уже произвольным образом: кроме нахождения частот и мод (как и для номинальной шкалы) появляется возможность определить выборочную медиану (т.е. наблюдение с рангом Ri, ближайшим к числу n/2); можно разбить всю выборку на части в любой пропорции, находя выборочные квантили любого уровня p, 0 < p < 1 (т.е. наблюдения с рангом Ri ближайшим к величине np); можно определить коэффициенты ранговой корреляции между двумя сериями порядковых наблюдений; строить с помощью полученных величин другие статистические процедуры.
Выше мы не без умысла к названию порядковой шкалы присоединили слова «в строгом смысле». Суть состоит в том, что порядковые в строгом смысле шкалы определяются только для заданного набора сравниваемых объектов, у этих шкал нет общепринятого, а тем более абсолютного стандарта. Поэтому при определенных условиях правомерно выражение «первый в мире, второй в Европе» — просто чемпион мира занял второе место на всеевропейских соревнованиях.
Модифицированные порядковые шкалы. Существуют и используются на практике порядковые шкалы, но не в таком строгом смысле, о котором мы говорили выше. При этом иногда с полученными данными начинают обращаться как с числами, даже если произведенная модификация не выводит шкалу из класса порядковых. Это сопряжено с ошибками и неправильными решениями. Рассмотрим некоторые из известных модификаций.
Шкала твердости по Моосу. В 1811 г. немецкий минералог Ф. Моос предложил установить шкалу твердости, установив 10 ее градаций. За эталон приняты следующие минералы с возрастающей твердостью: 1 — тальк, 2 — гипс, 3 — кальций, 4 — флюорит, 5 — апатит, 6 — ортоклаз, 7 — кварц, 8 — топаз, 9 — корунд, 10 — алмаз. Шкала Мооса устанавливает отношение слабого порядка, т.к. промежуточных градаций твердости она не имеет. Нельзя говорить, что алмаз в 2 раза тверже апатита, или что разница в твердости флюорита и гипса такая же, как у корунда и кварца.
Шкала силы ветра по Бофорту. В 1806 г. английский гидрограф и картограф адмирал Ф. Бофорт предложил балльную шкалу силы ветра, определяя ее по характеру волнения моря: 0 — штиль, 4 — умеренный ветер, 6 — сильный ветер, 10 — шторм, 12 — ураган. Кроме штиля градации силы ветра имеют условный, качественный характер.
Балльные шкалы оценки знаний учащихся. Потребность общества в официальном определении степени квалифицированности проходящих обучение, независимо от того, где, когда и как они получают образование, способствовала введению общепринятых балльных шкал: (2 — балльных, 5 — балльных, 30 — балльных). Мало кто понимает, что балльная шкала принадлежит к классу порядковых. Дело доходит до того, что выводится среднеарифметический балл — величина, не имеющая смысла в порядковой шкале.
Шкалы интервалов. Если упорядочивание объектов можно выполнить настолько точно, что известны расстояния между любыми двумя из них, то измерение окажется заметно сильнее, чем в шкале порядка. При этом равные интервалы измеряются одинаковыми по длине отрезками шкалы, где бы они на ней не располагались. Следовательно, отношение двух интервалов не зависит от того, в какой из шкал они измерены, и какое значение принято за начало отсчета. Построенные таким образом шкалы называются интервальными.
Примерами величин, которые по физической природе не имеют абсолютного нуля, или допускают свободу выбора начала отсчета и поэтому измеряются в интервальных шкалах, являются температура, время, высота местности. Начало летоисчисления у христиан установлено от рождества Христова, у мусульман — на 622 года позднее — от переезда Мухаммеда в Медину. В астрономии существует шесть определений года.
Название «шкала интервалов» подчеркивает, что в этой шкале только интервалы имеют смысл настоящих чисел и только над интервалами можно выполнять арифметические операции: если произвести арифметические операции над самими отсчетами по шкале, забыв об их относительности, то имеется риск получить бессмысленные результаты. Например, если сказать, что температура воды увеличилась в 2 раза при ее нагреве от 9° до 18° по шкале Цельсия, то для тех, кто привык пользоваться шкалой Фаренгейта, это будет звучать весьма странно, так как в этой шкале температура воды изменится от 37° до 42°.
Подобно тому, как определение значения символа Кронекера является единственной допустимой операцией над наблюдениями в номинальной шкале, а вычисление ранга наблюдения — в порядковой шкале, в интервальной шкале единственной новой допустимой операцией над наблюдениями является определение интервала между ними. Над интервалами же можно выполнять любые арифметические операции, а вместе с ними — использовать подходящие способы статистической и иной обработки данных.
Шкалы разностей. К таким шкалам относятся циклические или периодические шкалы. В таких шкалах измеряется направление из одной точки (шкала компаса, роза ветров), время суток, фаза колебаний. Циклические шкалы являются частным случаем интервальных шкал. Однако, соглашение о хотя и произвольном, но едином для нас начале шкалы, позволяет использовать показания в этой шкале как числа, применять к ним арифметические действия и т. д.
Шкалы отношений. Пусть наблюдаемые величины удовлетворяют не только аксиомам 40 и 50, но и аксиомам аддитивности:
- 60. Если А=Р и В>0, то А+В>Р
- 70. А+В=В+А
- 80. Если А=Р и В=Q, то А+В=Р+Q
- 90. (А+В)+С=А+(В+С)
Это существенное усиление шкалы: измерения в такой шкале являются «полноправными» числами, с ними можно выполнять любые арифметические действия. Введенная таким образом шкала называется шкалой отношений. Этот класс шкал обладает следующей особенностью: отношение двух наблюдаемых значений измеряемой величины не зависит от того, в какой из этих шкал произведены измерения. Величины, измеряемые в шкале отношений, имеют естественный абсолютный ноль, хотя остается свобода в выбор единиц. Примерами величин, природа которых соответствует шкале отношений, являются: длина, вес, электрическое сопротивление, деньги.
Абсолютная шкала. Рассмотрим такую шкалу, которая имеет и абсолютный ноль, и абсолютную единицу. Эта шкала уникальна. Именно такими качествами обладает числовая ось, которую естественно назвать абсолютной шкалой. Важной особенностью абсолютной шкалы по сравнению со всеми остальными является отвлеченность (безразмерность) и абсолютность ее единицы. Указанная особенность позволяет производить над показаниями абсолютной шкалы такие операции, которые недопустимы для показаний других шкал, — использовать их в качестве показателей степени и аргумента логарифма. Числовая ось используется при счете предметов и как вспомогательное средство присутствует во всех остальных шкалах. Некоторые безразмерные числовые отношения, обнаруживаемые в природе, вызывают восхищение (явления резонанса, гармоническое отношение размеров, звуков; законы теории подобия и размерностей, квантование энергии элементарных частиц и т. д.).
В таблице приведены основные сведения обо всех рассмотренных шкалах. Можно сказать, что чем сильнее шкала, в которой производятся измерения, тем больше сведений об изучаемом объекте дают эти измерения. Однако, важно иметь в виду, что выбор шкалы должен ориентироваться на объективные отношения, которым подчинена наблюдаемая величина. Можно измерять в шкале более слабой, но измерять в более сильной шкале — опасно.