Случай одинаковых рангов. Коэффициенты корреляции рангов

Коэффициенты корреляции рангов – это менее точные, но более простые по расчету непараметрические показатели для измерения тесноты связи между двумя коррелируемыми признаками. К ним относятся коэффициенты Спирмэна (ρ) и Кендэла (τ), основанные на корреляции не самих значений коррелируемых признаков, а их рангов – порядковых номеров, присваиваемых каждому индивидуальному значению х и у (отдельно) в ранжированном ряду. Оба признака необходимо ранжировать (нумеровать) в одном и том же порядке: от меньших значений к большим и наоборот. Если встречается несколько значений х (или у ), то каждому из них присваивается ранг, равный частному от деления суммы рангов (мест в ряду), приходящихся на эти значения, на число равных значений. Ранги признаков х и у обозначают символами Rx и Ry (иногда Nx и Ny ). Суждение о связи между изменениями значений х и у основано на сравнении поведения рангов по двум признакам параллельно. Если у каждой пары х и у ранги совпадают, это характеризует максимально тесную связь. Если же наблюдается полная противоположность рангов, т.е. в одном ряду ранги возрастают от 1 до n , а в другом – убывают от n до 1, это максимально возможная обратная связь. Подходы для оценки тесноты связи у Спирмэна и Кендэла несколько различаются. Для расчета коэффициента Спирмэна значения признаков х и у нумеруют (отдельно) в порядке возрастания от 1 до n , т.е. им присваивают определенный ранг (Rx и Ry ) – порядковый номер в ранжированном ряду. Затем для каждой пары рангов находят их разность (обозначается как d = Rx Ry ), и квадраты этой разности суммируют.

где d – разность рангов х и у ;

n – число наблюдаемых пар значений х и у .

Коэффициент ρ может принимать значения от 0 до ±1. Следует иметь в виду, что, поскольку коэффициент Спирмэна учитывает разность только рангов, а не самих значений х и у, он менее точен по сравнению с линейным коэффициентом. Поэто-му его крайние значения (1 или 0) нельзя безоговорочно расцени-вать как свидетельство функциональной связи или полного от-сутствия зависимости между х и у. Во всех других случаях, т.е. когда ρ не принимает крайних зна-чений, он довольно близок к r.

Формула (147) применима строго теоретически только тогда, когда отдельные значения х у), а следовательно, и их ранги не повторяются. Для случая повторяющихся (связанных) рангов есть другая, более сложная формула, скорректированная на число по-вторяющихся рангов. Однако опыт показывает, что результаты расчетов по скорректированной формуле для связанных рангов мало отличаются от результатов, полученных по формуле для не-повторяющихся рангов. Поэтому на практике формула (147) ус-пешно применяется как для неповторяющихся, так и для повто-ряющихся рангов.

Коэффициент корреляции рангов Кендэла τ строится несколь-ко по-другому, хотя его расчет также начинается с ранжирования значений признаков х и у. Ранги х (Rx ) располагают строго в порядке возрастания и па-раллельно записывают соответствующее каждому Rx значение Ry . Поскольку Rx записаны строго по возрастанию, то ставится задача определить меру соответствия последовательности Ry «пра-вильному» следованию Rx. При этом для каждого Ry последо-вательно определяют число следующих за ним рангов, превыша-ющих его значение, и число рангов, меньших по значению. Первые («правильное» следование) учитываются как баллы со знаком «+», и их сумма обозначается буквой Р. Вторые («непра-вильное» следование) учитываются как баллы со знаком «–», и их сумма обозначается буквой Q. Очевидно, что максимальное значение Р достигается в том слу-чае, если ранги y (Ry) совпадают с рангами х (Rx) и в каждом ряду представляют ряд натуральных чисел от 1 до п. Тогда после первой пары значений Rx = 1 и Ry = 1 число превышения данных значений рангов составит (n – 1), после второй пары, где Rx = 2 и Ry = 2, соответственно (п – 2) и т.д. Таким образом, если ранги х и у совпадают и число пар рангов равно n , то

Если же последовательность рангов х и у имеет обратную тенденцию по отношению к последовательности рангов х , то Q будет такое же максимальное значение по модулю:

.

Если же ранги у не совпадают с рангами х , то суммируются все положительные и отрицательные баллы (S=P+Q ); отношение этой суммы S к максимальному значению одного из слагаемых и представляет собой коэффициент корреляции рангов Кендэла τ, т.е.:

. (148)

Формула коэффициента корреляции рангов Кендэла (148) применяется для случаев, когда отдельные значения признака (как х, так и у) не повторяются и, следовательно, их ранги не объе-динены. Если же встречается несколько одинаковых значений х (или у), т.е. ранги повторяются, становятся связанными , коэффици-ент корреляции рангов Кендэла определяется по формуле:

, (149)

где S – фактическая общая сумма баллов при оценке +1 каж-дой пары рангов с одинаковым порядком изменения и –1 каждой пары рангов с обратным порядком изме-нения;

– число баллов, корректирующих (уменьшающих) максимальную сумму баллов за счет повторений (объединений) t рангов в каждом ряду.

Отметим, что случаи следования одинаковых повторяющихся рангов (в любом ряду) оцениваются баллом 0, т.е. они не учиты-ваются при расчете ни со знаком «+», ни со знаком «–».

Преимущества ранговых коэффициентов корреля-ции Спирмэна и Кендэла: они легко вычисляются, с их помощью можно изучать и измерять связь не только между количественны-ми, но и между качественными (описательными) признаками, ранжированными определенным образом. Кроме того, при ис-пользовании ранговых коэффициентов корреляции не требуется знать форму связи изучаемых явлений.

Если число ранжируемых признаков (факторов) больше двух, то для измерения тесноты связи между ними можно использовать предложенный М. Кендэлом и Б. Смитом коэффициент конкордации (множественный коэффициент ранговой корреляции):

, (150)

где S - сумма квадратов отклонений суммы т рангов от их средней величины;

т - число ранжируемых признаков;

п - число ранжируемых единиц (число наблюдений).

Формула (150) применяется для случая, кода ранги по каж-дому признаку не повторяются. Если же есть связанные ран-ги, то коэффициент конкордации рассчитывается с учетом числа таких повторяющихся (связанных) рангов по каждому фактору:

, (151)

где t – число одинаковых рангов по каждому признаку.

Коэффициент конкордации W может принимать значения от 0 до 1. Однако, необходимо проверить его на существенность (значимость) с помощью критерия χ2 при отсутствии связанных рангов по формуле (152), а при их наличии – по формуле (153):

, (152) . (153)

Фактическое значение χ2 сравнивается с табличным, соответ-ствующим принятому уровню значимости α (0,05 или 0,01) и числу степеней свободы v = п – 1. Если χ2факт > χ2табл, то W – существенен (значим).

Коэффициент конкордации особенно часто используется в экспертных оценках, например, для того, чтобы определить сте-пень согласованности мнений экспертов о важности того или иного оцениваемого показателя или составить рейтинг отдельных единиц по какому-либо признаку. В формуле (150) в этих случаях т означает число экспертов, а n - число ранжируемых единиц (или признаков).

При изучении общественного здоровья и здравоохранения в научных и практических целях исследователю часто приходится проводить статистический анализ связей между факторными и результативными признаками статистический совокупности (причинно-следственная связь) или определение зависимости параллельных изменений нескольких признаков этой совокупности от какой либо третьей величины (от общей их причины). Необходимо уметь изучать особенности этой связи, определять ее размеры и направление, а также оценивать ее достоверность. Для этого используются методы корреляции.

  1. Виды проявления количественных связей между признаками
    • функциональная связь
    • корреляционная связь
  2. Определения функциональной и корреляционной связи

    Функциональная связь - такой вид соотношения между двумя признаками, когда каждому значению одного из них соответствует строго определенное значение другого (площадь круга зависит от радиуса круга и т.д.). Функциональная связь характерна для физико-математических процессов.

    Корреляционная связь - такая связь, при которой каждому определенному значению одного признака соответствует несколько значений другого взаимосвязанного с ним признака (связь между ростом и массой тела человека; связь между температурой тела и частотой пульса и др.). Корреляционная связь характерна для медико-биологических процессов.

  3. Практическое значение установления корреляционной связи . Выявление причинно-следственной между факторными и результативными признаками (при оценке физического развития, для определения связи между условиями труда, быта и состоянием здоровья, при определении зависимости частоты случаев болезни от возраста, стажа, наличия производственных вредностей и др.)

    Зависимость параллельных изменений нескольких признаков от какой-то третьей величины. Например, под воздействием высокой температуры в цехе происходят изменения кровяного давления, вязкости крови, частоты пульса и др.

  4. Величина, характеризующая направление и силу связи между признаками . Коэффициент корреляции, который одним числом дает представление о направлении и силе связи между признаками (явлениями), пределы его колебаний от 0 до ± 1
  5. Способы представления корреляционной связи
    • график (диаграмма рассеяния)
    • коэффициент корреляции
  6. Направление корреляционной связи
    • прямая
    • oбратная
  7. Сила корреляционной связи
    • сильная: ±0,7 до ±1
    • средняя: ±0,3 до ±0,699
    • слабая: 0 до ±0,299
  8. Методы определения коэффициента корреляции и формулы
    • метод квадратов (метод Пирсона)
    • ранговый метод (метод Спирмена)
  9. Методические требования к использованию коэффициента корреляции
    • измерение связи возможно только в качественно однородных совокупностях (например, измерение связи между ростом и весом в совокупностях, однородных по полу и возрасту)
    • расчет может производиться с использованием абсолютных или производных величин
    • для вычисления коэффициента корреляции используются не сгруппированные вариационные ряды (это требование применяется только при вычислении коэффициента корреляции по методу квадратов)
    • число наблюдений не менее 30
  10. Рекомендации по применению метода ранговой корреляции (метод Спирмена)
    • когда нет необходимости в точном установлении силы связи, а достаточно ориентировочных данных
    • когда признаки представлены не только количественными, но и атрибутивными значениями
    • когда ряды распределения признаков имеют открытые варианты (например, стаж работы до 1 года и др.)
  11. Рекомендации к применению метода квадратов (метод Пирсона)
    • когда требуется точное установление силы связи между признаками
    • когда признаки имеют только количественное выражение
  12. Методика и порядок вычисления коэффициента корреляции

    1) Метод квадратов

    2) Ранговый метод

  13. Схема оценки корреляционной связи по коэффициенту корреляции
  14. Вычисление ошибки коэффициента корреляции
  15. Оценка достоверности коэффициента корреляции,полученного методом ранговой корреляции и методом квадратов

    Способ 1
    Достоверность определяется по формуле:

    Критерий t оценивается по таблице значений t с учетом числа степеней свободы (n - 2), где n - число парных вариант. Критерий t должен быть равен или больше табличного, соответствующего вероятности р ≥99%.

    Способ 2
    Достоверность оценивается по специальной таблице стандартных коэффициентов корреляции. При этом достоверным считается такой коэффициент корреляции, когда при определенном числе степеней свободы (n - 2), он равен или более табличного, соответствующего степени безошибочного прогноза р ≥95%.

на применение метода квадратов

Задание: вычислить коэффициент корреляции, определить направление и силу связи между количеством кальция в воде и жесткостью воды, если известны следующие данные (табл. 1). Оценить достоверность связи. Сделать вывод.

Таблица 1

Обоснование выбора метода. Для решения задачи выбран метод квадратов (Пирсона), т.к. каждый из признаков (жесткость воды и количество кальция) имеет числовое выражение; нет открытых вариант.

Решение .
Последовательность расчетов изложена в тексте, результаты представлены в таблице. Построив ряды из парных сопоставляемых признаков, обозначить их через х (жесткость воды в градусах) и через у (количество кальция в воде в мг/л).

Жесткость воды
(в градусах)
Количество кальция в воде
(в мг/л)
d х d у d х х d у d x 2 d y 2
4
8
11
27
34
37
28
56
77
191
241
262
-16
-12
-9
+7
+14
+16
-114
-86
-66
+48
+98
+120
1824
1032
594
336
1372
1920
256
144
81
49
196
256
12996
7396
4356
2304
9604
14400
М х =Σ х / n М у =Σ у / n Σ d х x d у =7078 Σ d х 2 =982 Σ d y 2 =51056
М х =120/6=20 М y =852/6=142
  1. Определить средние величины M x ряду вариант "х" и М у в ряду вариант "у" по формулам:
    М х = Σх/n (графа 1) и
    М у = Σу/n (графа 2)
  2. Найти отклонение (d х и d у) каждой варианты от величины вычисленной средней в ряду "x" и в ряду "у"
    d х = х - М х (графа 3) и d y = у - М у (графа4).
  3. Найти произведение отклонений d x х d y и суммировать их: Σ d х х d у (графа 5)
  4. Каждое отклонение d x и d у возвести в квадрат и суммировать их значения по ряду "х" и по ряду "у": Σ d x 2 = 982 (графа 6) и Σ d y 2 = 51056 (графа 7).
  5. Определить произведение Σ d x 2 х Σ d y 2 и из этого произведения извлечь квадратный корень
  6. Полученные величины Σ (d x x d y) и √(Σd x 2 x Σd y 2) подставляем в формулу расчета коэффициента корреляции:
  7. Определить достоверность коэффициента корреляции:
    1-й способ. Найти ошибку коэффициента корреляции (mr xy) и критерий t по формулам:

    Критерий t = 14,1, что соответствует вероятности безошибочного прогноза р > 99,9%.

    2-й способ. Достоверность коэффициента корреляции оценивается по таблице "Стандартные коэффициенты корреляции" (см. приложение 1). При числе степеней свободы (n - 2)=6 - 2=4, наш расчетный коэффициент корреляции r xу = + 0,99 больше табличного (r табл = + 0,917 при р = 99%).

    Вывод. Чем больше кальция в воде, тем она более жесткая (связь прямая, сильная и достоверная : r ху = + 0,99, р > 99,9%).

    на применение рангового метода

    Задание: методом рангов установить направление и силу связи между стажем работы в годах и частотой травм, если получены следующие данные:

    Обоснование выбора метода: для решения задачи может быть выбран только метод ранговой корреляции, т.к. первый ряд признака "стаж работы в годах" имеет открытые варианты (стаж работы до 1 года и 7 и более лет), что не позволяет использовать для установления связи между сопоставляемыми признаками более точный метод - метод квадратов.

    Решение . Последовательность расчетов изложена в тексте, результаты представлены в табл. 2.

    Таблица 2

    Стаж работы в годах Число травм Порядковые номера (ранги) Разность рангов Квадрат разности рангов
    X Y d(х-у) d 2
    До 1 года 24 1 5 -4 16
    1-2 16 2 4 -2 4
    3-4 12 3 2,5 +0,5 0,25
    5-6 12 4 2,5 +1,5 2,25
    7 и более 6 5 1 +4 16
    Σ d 2 = 38,5

    Стандартные коэффициенты корреляции, которые считаются достоверными (по Л.С. Каминскому)

    Число степеней свободы - 2 Уровень вероятности р (%)
    95% 98% 99%
    1 0,997 0,999 0,999
    2 0,950 0,980 0,990
    3 0,878 0,934 0,959
    4 0,811 0,882 0,917
    5 0,754 0,833 0,874
    6 0,707 0,789 0,834
    7 0,666 0,750 0,798
    8 0,632 0,716 0,765
    9 0,602 0,885 0,735
    10 0,576 0,858 0,708
    11 0,553 0,634 0,684
    12 0,532 0,612 0,661
    13 0,514 0,592 0,641
    14 0,497 0,574 0,623
    15 0,482 0,558 0,606
    16 0,468 0,542 0,590
    17 0,456 0,528 0,575
    18 0,444 0,516 0,561
    19 0,433 0,503 0,549
    20 0,423 0,492 0,537
    25 0,381 0,445 0,487
    30 0,349 0,409 0,449

    1. Власов В.В. Эпидемиология. - М.: ГЭОТАР-МЕД, 2004. - 464 с.
    2. Лисицын Ю.П. Общественное здоровье и здравоохранение. Учебник для вузов. - М.: ГЭОТАР-МЕД, 2007. - 512 с.
    3. Медик В.А., Юрьев В.К. Курс лекций по общественному здоровью и здравоохранению: Часть 1. Общественное здоровье. - М.: Медицина, 2003. - 368 с.
    4. Миняев В.А., Вишняков Н.И. и др. Социальная медицина и организация здравоохранения (Руководство в 2 томах). - СПб, 1998. -528 с.
    5. Кучеренко В.З., Агарков Н.М. и др.Социальная гигиена и организация здравоохранения (Учебное пособие) - Москва, 2000. - 432 с.
    6. С. Гланц. Медико-биологическая статистика. Пер с англ. - М., Практика, 1998. - 459 с.

Использование порядковой шкалы позволяет присваивать ранги объектам по какому-либо признаку. Таким образом, метрические значения переводятся в ранговые. При этом фиксируются различия в степени выраженности свойств. В процессе ранжирования следует придерживаться 2 правил.

Правило порядка ранжирования. Надо решить, кто получает первый ранг: объект с самой большей степенью выраженности какого-либо качества или наоборот. Чаще всего это абсолютно безразлично и не отражается на конечном результате. Традиционно принято первый ранг приписывать объектам с большей степенью выраженности качества (большему значению – меньший ранг). Например, чемпиону присуждают первое место, а не наоборот. Хотя, и здесь если бы был принят обратный порядок, то результаты от этого не изменились бы. Так что порядок ранжирования каждый исследователь вправе определять сам. Например, Е. В. Сидоренко рекомендует меньшему значению приписывать меньший ранг. В некоторых случаях это удобнее, но непривычнее.

Например: имеется неупорядоченная выборка, данные которой необходимо проранжировать. {2, 7, 6, 8, 11, 15, 9}. После упорядочивания выборки ранжируем ее.

Метрические данные

Альтернативный вариант:

Метрические данные

Отдельно следует сказать следующее. Существует группа редко используемых непараметрических критериев (Т-критерий Вилкоксона, U-критерий Манна-Уитни,Q-критерий Розенбаума и др.), при работе с которыми всегда надо меньшему значению приписывать меньший ранг.

Правило связанных рангов. Объектам с одинаковой выраженностью свойств приписывается один и тот же ранг. Этот ранг представляет собой среднее значение тех рангов, которые они получили бы, если бы не были равны. Например, надо проранжировать выборку, содержащую ряд одинаковых метрических данных: {4, 5, 9, 2, 6, 5, 9, 7, 5, 12}. После упорядочивания выборки следует вычислить среднее арифметическое значение связанных рангов.

Метрические данные

Предварительное ранжирование

Окончательное ранжирование

Задания для самостоятельной работы.

    Проранжировать выборку по правилу «большему значению – меньший ранг»: {111, 104, 115, 107, 95, 104, 104}.

    Проранжировать выборку по правилу «меньшему значению – меньший ранг» {20, 25, 8, 7, 20, 14, 27}.

    Объединить две предыдущие выборки и провести ранжирование по правилу «большему значению – меньший ранг»

    Показатели каких признаков из Таблицы Iявляются номинативными, каких – метрическими?

    Перевести показатели осведомленности из Таблицы IПриложения в ранговую шкалу. Выделить уровни выраженности показателей посредством их перевода в номинативную шкалу.

      Таблица I Данные для обработки

учащиеся

профиль ВУЗа

осведомленность

скрытые фигуры

пропущенные

арифметика

понятливость

исключение

изображений

аналогии

числовые ряды

умозаключения

геометрическое сложение

заучивание слов

средний IQ

экстраверсия-

интроверсия

нейротизм

средняя отметка

Профиль ВУЗа: 0 - выбор учеником гуманитарного профиля;

1 - выбор учеником математического или естественно-научного профиля

В анализе социально-экономических явлений часто приходится прибегать к различным условным оценкам с помощью рангов, а взаимосвязь между отдельными признаками измерять с помощью непараметрических коэффициентов связи.

Ранжирование - это процедура упорядочения объектов изучения, которая выполняется на основе предпочтения.

Ранг - это порядковый номер значений признака, расположенных в порядке возрастания или убывания их величин. Если значения признака имеют одинаковую количественную оценку, то ранг всех этих значений принимается равным средней арифметической из соответствующих номеров мест, которые они определяют. Данные ранги называются связными.

Среди непараметрических методов оценки тесноты связи наибольшее значение имеют ранговые коэффициенты корреляции Спирмена (р1?/) и Кендалла (т^). Эти коэффициенты могут быть использованы для определения тесноты связи между как количественными, так и качественными признаками.

Коэффициент корреляции рангов (коэффициент Спирмена) рассчитывают по формуле

где (11 - квадраты разности рангов; п - число наблюдений (число пар рангов).

Коэффициент Спирмена принимает любые значения в интервале [-1; 1].

Пример. 11о данным о покупке и продаже гражданами субъектов Приволжского федерального округа РФ валюты через кредитные организации в 2010 г. определим зависимость между этими признаками с помощью коэффициента Спирмена (табл. 7.14).

Таблица 7.14. Расчет коэффициента Спирмена

Субъект

Покупка валюты х, млн руб.

Продажа валюты у, млн руб.

Ранг

поп а рангов

Квадрат разности рангов

$

К

Ry

1. Республика Башкортостан

2. Республика Марий Эл

3. Республика Мордовия

4. Республика Татарстан

5. Удмуртская Республика

6. Чувашская

Республики

7. Пермский край

8. Кировская область

9. Нижегородская область

10. Оренбургская область

11. Пензенская область

12. Самарская область

13. Саратовская область

14. Ульяновская область

Рассчитаем коэффициент корреляции рангов Спирмена:

В результате расчета мы определили, что связь между покупкой и продажей валюты гражданами субъектов Приволжского федерального округа РФ через кредитные организации в 2010 г. сильная, близкая к функциональной.

Ранговый коэффициент корреляции Кендалла также используют для измерения степени тесноты и направления связи между качественными и количественными признаками, характеризующими однородные объекты и ранжированными по одному принципу. Расчет рангового коэффициента Кендалла осуществляют но формуле

где 5 - сумма разностей между числом последовательностей и числом инверсий по второму признаку; п - число наблюдений.

Расчет данного коэффициента выполняется в такой последовательности.

  • 1. Значения х ранжируются в порядке возрастания или убывания.
  • 2. Значения у располагаются в порядке, соответствующем значениям х.
  • 3. Для каждого ранга у определяется число следующих за ним значений рангов, превышающих его величину. Таким образом, путем сложения чисел определяется величина Р как мера соответствия последовательностей рангов пох и у, которая учитывается со знаком "+".
  • 4. Для каждого ранга у определяется число следующих за ним значений рангов, меньших его величины. Суммарная величина обозначается через (2 и фиксируется со знаком "-".
  • 5. Определяется сумма баллов по всем членам ряда.

Связь между признаками признается статистически значимой, если коэффициенты ранговой корреляции Спирмена и Кендалла больше 0,5.

По данным табл. 7.14 получены результаты, представленные в табл. 7.15.

Таким образом, ранговый коэффициент корреляции Кендалла составит

Таблица 7.15.

что также свидетельствует о сильной связи между покупкой и продажей валюты гражданами субъектов Приволжского федерального округа РФ через кредитные организации в 2009 г.

Множественный коэффициент ранговой корреляции (коэффициент конкордации) применяют для определения тесноты связи между произвольным числом ранжированных признаков. Его вычисляют по формуле

где 5 - отклонение суммы квадратов рангов от средней квадратов рангов; т - количество факторов; п - число наблюдений.

Пример. Определим степень тесноты связи между такими основными показателями торговли технологиями со странами СНГ в 2010 г., как число экспортных соглашений, стоимость предмета соглашения и поступление средств (табл. 7.16).

Таблица 7.16. Расчет коэффициента конкордации

Страна

Число соглашений

X

Стоимость предмета соглашения у, млн долл.

Поступление средств за год г, млн долл.

К

Сумма строк

Квадрат суммы

1. Азербайджан

2. Армения

3. Беларусь

4. Казахстан

5. Киргизия

6. Республика Молдова

Рангом элемента выборки называется порядковый номер этого элемента в вариационном ряду или, другими словами, число элементов выборки меньших или равных

Следовательно, выборочному значению соответствует порядковая статистика вариационного ряда.

Ранговым вектором выборки называется перестановка чисел 1, 2, которая получается при замене элементов выборки их рангами. Ранговой статистикой называется произвольная функция от рангового вектора. Ранговый алгоритм предписывает сравнение некоторой ранговой статистики с порогом.

Исходную выборку можно восстановить, если известен вектор порядковых статистик и ранговый вектор R. Отдельно любой из этих двух векторов представляет необратимое нелинейное преобразование исходной выборки. Для однородной независимой выборки случайные векторы и R независимы.

Ранг элемента выборки размером при помощи функции единичного скачка или знаковой функции можно представить следующим образом:

(13.168 а)

Из (13.168 a и б) следует, что ранги являются знаковыми статистиками от разностей выборочных значений.

Для однородной независимой выборки функция правдоподобия инвариантна к группе перестановок аргументов. Отсюда следует, что для указанной выборки все ранговые векторы равновероятны, каково бы ни было распределение, которому принадлежит выборка. Общее число возможных ранговых векторов, соответствующих выборке размером , равно числу перестановок чисел, т. е. Следовательно, выборочное пространство ранговых векторов состоит из дискретных точек -мерного эвклидового пространства. Вероятность попадания рангового вектора R наблюдаемой выборки в любую точку этого дискретного множества равна , т. е. для любого распределения однородной независимой выборки

Таким образом, ранговый алгоритм - непараметрический по отношению гипотезе Н о том, что выборка из произвольного распределения однородная и независимая. Для альтернативы К о том, что независимая выборка неоднородная, ранги перестают быть равновероятными. Для определения функции распределения рангового вектора при альтернативе К необходимо вычислить интеграл

где область включает те точки выборочного пространства, которым при упорядочивании соответствует заданный вектор

Этот интеграл

(13.170)

Практическое использование формулы (13.170), за исключением специальных случаев, сопряжено с трудно выполнимыми вычислениями. Из-за сложности распределения (13.170) синтез оптимального по критерию Неймана - Пирсона рангового алгоритма проверки гипотез при конечном размере выборки практически нереализуем. Это также одна из причин того, что указанный синтез осуществляют на эвристической основе (см. п. 13.7.4).

Отметим, что ранговый вектор однородной независимой выборки инвариантен к безынерционному преобразованию выборки

так как такое преобразование не изменяет относительного расположения элементов выборки . Из (13.171) следует, что ранговый алгоритм сохраняет непараметрическое свойство и после указанного нелинейного преобразования.