Шкала

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Шкала — это знаковая система, для которой задано отображение, ставящее в соответствие реальным объектам тот или иной количественный элемент шкалы. Формально шкалой называют кортеж, <X, φ, Y>, где X — реальный объект, φ — отображение, Y — знаковая система[1].

Различные типы измерительных шкал широко используются в теоретической и практической человеческой деятельности, в науке и технике — в том числе во многих гуманитарных научных областях, таких как экономика, психометрия, социология и др.[2][3]

Типы шкал[править | править вики-текст]

Шкалы измерений принято классифицировать по типам измеряемых данных, которые определяют допустимые для данной шкалы математические преобразования, а также типы отношений, отображаемых соответствующей шкалой[1],[4]. Современная классификация шкал была предложена в 1946 году Стэнли Смитом Стивенсом.

Шкала наименований (номинальная, классификационная)
Используется для измерения значений качественных признаков. Значением такого признака является наименование класса эквивалентности, к которому принадлежит рассматриваемый объект. Примерами значений качественных признаков являются названия государств, цвета, марки автомобилей и т. п. Такие признаки удовлетворяют аксиомам тождества:
  • Либо А = В, либо А ≠ В;
  • Если А = В, то В = А;
  • Если А = В и В = С, то А = С.
При большом числе классов используют иерархические шкалы наименований. Наиболее известными примерами таких шкал являются[5] шкалы, используемые для классификации животных и растений.
С величинами, измеряемыми в шкале наименований, можно выполнять только одну операцию — проверку их совпадения или несовпадения. По результатам такой проверки можно дополнительно вычислять частоты заполнения (вероятности) для различных классов, которые могут использоваться для применения различных методов статистического анализа[5] — критерия согласия Хи-квадрат, критерия Крамера для проверки гипотезы о связи качественных признаков и др.
Порядковая шкала (или ранговая)
Строится на отношении тождества и порядка. Субъекты в данной шкале ранжированы. Но не все объекты можно подчинить отношению порядка. Например, нельзя сказать, что больше круг или треугольник, но можно выделить в этих объектах общее свойство-площадь, и таким образом становится легче установить порядковые отношения. Для данной шкалы допустимо монотонное преобразование. Такая шкала груба, потому что не учитывает разность между субъектами шкалы. Пример такой шкалы: балльные оценки успеваемости (неудовлетворительно, удовлетворительно, хорошо, отлично), шкала Мооса.
Интервальная шкала (она же Шкала разностей)
Здесь происходит сравнение с эталоном. Построение такой шкалы позволяет большую часть свойств существующих числовых систем приписывать числам, полученным на основе субъективных оценок. Например, построение шкалы интервалов для реакций. Для данной шкалы допустимым является линейное преобразование. Это позволяет приводить результаты тестирования к общим шкалам и осуществлять, таким образом сравнение показателей. Пример: шкала Цельсия.
Начало отсчёта произвольно, единица измерения задана. Допустимые преобразования — сдвиги. Пример: измерение времени.
Абсолютная шкала (она же Шкала отношений)
это интервальная шкала, в которой присутствует дополнительное свойство — естественное и однозначное присутствие нулевой точки. Пример: число людей в аудитории. В шкале отношений действует отношение «во столько-то раз больше». Это единственная из четырёх шкал имеющая абсолютный ноль. Нулевая точка характеризует отсутствие измеряемого качества. Данная шкала допускает преобразование подобия (умножение на константу). Определение нулевой точки — сложная задача для психологических исследований, накладывающая ограничение на использование данной шкалы. С помощью таких шкал могут быть измерены масса, длина, сила, стоимость (цена). Пример: шкала Кельвина (температур, отсчитанных от абсолютного нуля, с выбранной по соглашению специалистов единицей измерения — Кельвин).

Из рассмотренных шкал первые две являются неметрическими, а остальные — метрическими.

С вопросом о типе шкалы непосредственно связана проблема адекватности методов математической обработки результатов измерения. В общем случае адекватными являются те статистики, которые инвариантны относительно допустимых преобразований используемой шкалы измерений.

Типы шкал и их свойства согласно классификации Стэнли Смита Стивенса

Номинальная
шкала

Порядковая
шкала

Интервальная
шкала

шкала
Отношений

Логические/
математические
операции


×
÷

No
No
No
Yes

+
-

No
No
Yes
Yes

<
>

No
Yes
Yes
Yes

=

Yes
Yes
Yes
Yes
Примеры:
Дихотомические и
недихотомические

переменные
Дихотомические:

Пол
(мужской vs. женский)

Недихотомические:

Национальность
(американец/китаец/ и т.д)
Дихотомические:

Состояние здоровья
(здоровый vs. больной),

Красота
(красивый vs.уродливый)

Недихотомические:

Мнение
('полностью согласен'/
'скорее согласен'/
'скорее несогласен'/
'полностью несогласен')
Дата
(с 1457 до н. э.
до 2013 н.э)

Широта
(от +90° до −90°)

Температура
(от 10 °C до 20 °C)
Возраст
(от 0 до 99 лет)
Мера центральной тенденции

Мода

Медиана

Среднее арифметическое

Среднее геометрическое

Метрическая или
нет

Неметрическая (качественная)

Неметрическая (качественная)

Метрическая (количественная)

Метрическая (количественная)

Критика типологии Стивенса[править | править вики-текст]

Анализируя различные типы шкал Ф. Н. Ильясов приходит к выводу, что номинальная и интервальная шкала являются исследовательскими артефактами[6][прояснить].

Хотя типология Стивенса все еще широко применима, она до сих пор является объектом критики теоретиков, в частности в случае с номинальной и порядковой шкалой.[7]

Основные моменты критики шкал Стивенсона:

  • Сведéние выбора только к тем статистическим методам, которые «демонстрируют инвариантность, подходящую для данного типа шкалы», представляется опасным для анализа данных практикой.
  • Его таксономия слишком строга, чтобы ее возможно было применять для реальных данных.
  • Стивенсовские ограничения часто ведут к понижению уровня данных через их преобразование в ранги и последующее ненужное обращение к непараметрическим методам.

Лорд критиковал аргументы Стивенса, показав, что выбор допустимых статистических тестов для некоторого набора данных не зависит от проблем репрезентации или единственности, а зависит от осмысленности.[8]

Бейкер, Хардик и Петринович,а также Боргатта и Борнштедт подчеркнули тот факт, что следование Стивенсовским ограничениям часто заставляет исследователей прибегать к ранговому упорядочению данных и тем самым отказываться от использования параметрических тестов. К сожалению, их аргументация носила скорее ad hoc характер и завершалась предложением использовать стандартные параметрические процедуры вместо того, чтобы связываться с проблемой робастности.[9][10]

Гуттман в более общем смысле доказывал, что статистическая интерпретация данных зависит от того, какой вопрос обращен к данным и какое доказательство мы готовы принять в ответ на этот вопрос. Он определил это доказательство в терминах функции потерь, выбранной для проверки качества модели.[11]

Джон Тьюки также критиковал стивенсовские ограничения как опасные для хорошего статистического анализа. Подобно Лорду и Гуттману, Тьюки отметил важность смысла данных при определении и шкалы, и подходящего способа анализа. Поскольку шкальные типы Стивенса абсолютны, в ситуации когда, например, данные нельзя считать полностью интервальными, их следует понизить в ранге до ординальных.

Даже сам Стивенс оговаривался, замечая: «Фактически большая часть шкал, широко и эффективно применяемых психологами, – это шкалы порядка. Обычные статистики, включая средние и стандартные отклонения, при строгом подходе не должны использоваться при работе с этим шкалами, однако такому неправомочному использованию может быть дано известное прагматическое оправдание: во многих случаях оно приводит к плодотворным результатам»

Дункан (1986) возразил против употребления слова “измерение” в описании номинальной шкалы, но Стивенс (1975) после дал собственное определения “измерения” которое звучит, как “приписывание признака по какому-либо правилу. Единственное правило, которое не может быть использовано для этих целей - случайность приписывания”. Однако, так называемое “номинальное измерение” включает оценочное суждение исследователя, а возможные трансформации этого измерения бесконечны. Это одно из замечаний, сделанных Лордом в 1953 году в сатиристической статье On the Statistical Treatment of Football Numbers[12]

Использование "среднего" в качестве меры центральной тенденции для порядкового типа по-прежнему спорно среди тех, кто принимает типологию Стивенса. Не смотря на это, многие ученые, занимающиеся поведенческими исследованиями, используют среднее для порядковых данных. Обычно это оправдывают тем, что порядковый тип в поведенческих науках находится где-то между истинным порядковым и интервальным типами. Хотя разница интервалов между двумя порядковыми разрядами не является постоянной, она зачастую имеет тот же порядок.

К примеру, применение измерительных моделей в образовательном контексте показывает, что общие оценки имеют довольно линейную зависимость с измерениями в пределах диапазона оценки. Таким образом, некоторые утверждают, что пока разница интервалов между порядковыми разрядами не очень большая, статистические данные интервальных шкал (к примеру "средняя") может иметь значимый результат для порядковых шкал. Программное обеспечение для статистического анализа (например SPSS) требует от пользователя указание соответствующего класса измерений для каждой переменной. Это гарантирует, что непреднамеренные ошибки пользователя не приведут к бессмысленному анализу (пример: анализ корреляции с номинальной переменной).

Терстоун добился прогресса в разработке обоснования для получения интервального типа, основанного на законе сравнительного суждения. Общим применением закона является аналитический процесс иерархии. Геогр Раш (англ.) достиг дальнейшего прогресса, разработав вероятностную модель Rasch model (англ.), которая дает теоретическую основу и обоснование для получения интервальных измерений из подсчета наблюдений (например общее количество баллов по оценкам).

Несмотря на всю критику, в широком диапазоне ситуаций опыт показывает, что применение запрещенных статистик к данным приводит к научно значимым результатам, важным при принятии решений и ценным для дальнейших исследований.

Другие предложенные типологии[править | править вики-текст]

Существуют иные типологии, отличные от Стивенса. К примеру: Mostller Mosteller и Tukey (1977), Nelder (1990) создали описание непрерывного отсчета, непрерывных отношений и категориальных моделях данных. См. также: Chrisman (1998), van den Berg (1991).

Типология Мостеллера и Тьюки (1977)[править | править вики-текст]

Mosteller and Tukey заметили, что 4 уровня недостаточно и предложили следующее деление:[13]

  1. Имена
  2. Оценочные суждения (e.g. новичок, второкурсник etc.)
  3. Оценки ограниченные 0 и 1
  4. Счетные (положительные целые числа)
  5. Натуральные (положительные вещественные числа)
  6. Сбалансированные (любые вещественные числа)

Например, проценты (вариант фракций в терминах Мостлера-Тьюки) не подходят к теории Стивенса, так как не существует полностью допустимых трансформаций.[7]

Типология Крисмана (1998)[править | править вики-текст]

Николас Крисман предложил расширенный поиск уровней измерения для учета разных измерений, которые не обязательно соответствуют традиционным представлениям уровней измерения. Измерения, связанные с диапазоном и повторением (к примеру радиальные градусы по кругу, часы и тд), градуированные категории членства и другие типа измерений, не соответствуют оригинальной работе Стивена, приводящие к внедрению 6-ти новых уровней измерения к существующим 10-ти:

  1. Номинальная
  2. Градуированное членство
  3. Порядковая
  4. Интервальная
  5. Интервальная логарифмическая
  6. Экстенсивное отношение
  7. Циклическое отношение
  8. Производное отношение
  9. Счетная
  10. Абсолютная

Расширенные уровни измерений редко используются вне академической географии.[14]

Типы шкал и “операционная теория измерения” Стивенса[править | править вики-текст]

Теория типов шкал это своебразная "интеллектуальная служанка" операционной теории измерения Стивенса, которая стала окончательной в психологии и поведенческих науках, несмотря на критику Мичелла за противоречивость с измерениями в естественных науках (Michell, 1999). На самом деле, операционная теория измерения была реакцией на выводы комитета, созданного British Association for the Advancement of Science (англ.) в 1932 для изучения возможности подлинных научных измерений в психологических и поведенческих науках. Этот комитет, который стал известен как "Комитет Фергюсона", опубликовал окончательный отчет (Ferguson, et al., 1940, p. 245), в котором шкала Стивенса сон (Stevens & Davis, 1938) была объектом критики.

« …любо закон имеющий целью выразить количественное отношение между интенсивностью ощущения и интенсивностью стимула не только ложный, но и фактически не имеющий смысла до тех пор, пока смысл не обретет понятие сложения, примененное к ощущению. »

Значит, если шкала сонов Стивенса действительно измеряет интенсивность ощущений аудитории, должно быть произведено доказательство того, что эти ощущения являются количественными атрибутами. Необходимым доказательством было присутствие “аддитивных структур” – концепт, разработанный немецким математиком Отто Холдером (Hölder, 1901). В условиях доминации физика и теоретика измерений Нормана Роберта Кампбелла (англ.) в обсуждении фергюсонского комитета, было постановлено, что измерения в социальных науках невозможны из-за отсутствия операции конкатенации. Впоследствии это решение было признано неверным после разработки теории совместных измерений Дебрю, а также независимо Люсом и Тьюки. Однако Стивенс хотел не введения дополнительных экспериментов для обнаружения аддитивных структур, а признания решения фергюсонского комитета полностью недействительным путем предложения новой теории измерений.

« Перефразируя Н.Р. Кампбела (Final Report, p.340), можно сказать что измерение, в самом широком смысле, определяется как присваивание чисел объектам и события согласно некоторому правилу (Стивенс, 1946, p.677). »

Огромное влияние на Стивенса оказали идеи другого гарвардского академика, лауреата нобелевской премии, физика Перси Бриджмена (1927), чью доктрину “Операционизм” Стивенс использовал для определения термина “измерение”. К примеру, в определении Стивенса используется рулетка, которая определяет длину (объект измерения) как измеримую (следовательно количественную). Критики операционализма возражают, что он смешивает отношения между двумя объектами или событиями для свойств одного из объектов или событий (Hardcastle, 1995; Michell, 1999; Moyer, 1981a,b; Rogers, 1989).

Канадский исследователь измерительных теорий William Rozeboom (1966) был одним из первых критиков, резко высказавшихся против теории типов шкал Стивенса

Тип переменной зависит от контекста[править | править вики-текст]

Еще одна проблема может заключаться в том, что одна и та же переменная может иметь разные типы шкал в зависимости от способа её измерения и целей анализа. Например, цвет волос обычно считается номинальной переменной, так как не имеет определенного порядка.[15] Тем не менее, расположить цвета в определенном порядке возможно несколькими способами, в том числе и по оттенкам, с помощью колориметрии.


Использование в психометрии[править | править вики-текст]

Используя различные шкалы, можно производить различные психологические измерения[16]. Самые первые методы психологических измерений были разработаны в психофизике. Основной задачей психофизиков являлось то, каким образом определить, как соотносятся физические параметры стимуляции и соответствующие им субъективные оценки ощущений. Зная эту связь, можно понять, какое ощущение соответствует тому или иному признаку. Психофизическая функция устанавливает связь между числовым значением шкалы физического измерения стимула и числовым значением психологической или субъективной реакцией на этот стимул.

Некоторые распространённые шкалы[править | править вики-текст]

См. также[править | править вики-текст]

Логотип Викисловаря
В Викисловаре есть статья «шкала»

Примечания[править | править вики-текст]

  1. 1 2 Анфилатов В. С., Емельянов А. А., Кукушкин А. А. Системный анализ в управлении. — М. Финансы и статистика, 2002. — 368 с.
  2. Экономика и менеджмент — Высокие статистические технологии
  3. Статистические методы — Высокие статистические технологии
  4. Перегудов Ф. И., Тарасевич Ф. П. Введение в системный анализ. — М.: Высшая школа, 1989. — 367 с.
  5. 1 2 Бахрушин В.Є. Методи аналізу даних. — Запоріжжя, КПУ, 2011
  6. Ильясов Ф. Н. Шкалы и специфика социологического измерения // Мониторинг общественного мнения: экономические и социальные перемены. 2014. № 1. С. 3-16.
  7. 1 2 (1993) «Nominal, ordinal, interval, and ratio typologies are misleading». The American Statistician (American Statistical Association) 47: 65–72. DOI:10.2307/2684788.
  8. Scaling : a sourcebook for behavioral scientists. — AldineTransaction, [2007]. — ISBN 9780202361758.
  9. Bela O. Baker, Curtis D. Hardyck, Lewis F. Petrinovich Weak Measurements vs. Strong Statistics: An Empirical Critique of S. S. Stevens' Proscriptions nn Statistics (англ.) // Educational and Psychological Measurement. — 1966-07-01. — Vol. 26, iss. 2. — P. 291–309. — ISSN 0013-1644. — DOI:10.1177/001316446602600204.
  10. Edgar F. Borgatta, George W. Bohrnstedt Level of Measurement: Once Over Again (англ.) // Sociological Methods & Research. — 1980-11-01. — Vol. 9, iss. 2. — P. 147–160. — ISSN 0049-1241. — DOI:10.1177/004912418000900202.
  11. Louis Guttman What is Not What in Statistics // Journal of the Royal Statistical Society. Series D (The Statistician). — 1977. — Т. 26, вып. 2. — С. 81–107. — DOI:10.2307/2987957.
  12. (December 1953) «On the Statistical Treatment of Football Numbers». American Psychologist 8: 750–751. DOI:10.1037/h0063675.
  13. Mosteller Frederick. Data analysis and regression : a second course in statistics. — Reading, Mass: Addison-Wesley Pub. Co, 1977. — ISBN 978-0201048544.
  14. Wolman, Abel G (2006). «Measurement and meaningfulness in conservation science». Conservation biology.
  15. What is the difference between categorical, ordinal and interval variables?. Institute for Digital Research and Education. University of California, Los Angeles.
  16. Суппес П.[en], Зиннес Д. Основы теории измерений // Психологические измерения. М.: 1967. С. 9-110.