Спосіб виявлення центральної однорідної підмножини у масиві рангованих даних (спосіб “слабкої ланки”)

Номер патенту: 55177

Опубліковано: 17.03.2003

Автор: Луцик Володимир Леонідович

Завантажити PDF файл.

Формула / Реферат

Спосіб виявлення центральної однорідної підмножини у масиві рангованих даних шляхом покрокового відсіювання тих спостережень без яких вибірковий коефіцієнт множинної рангової кореляції одержує максимальний позитивний приріст.

Текст

Спосіб виявлення центральної однорідної підмножини у масиві рангованих даних шляхом покрокового відсіювання тих спостережень без яких вибірковий коефіцієнт множинної рангової кореляції одержує максимальний позитивний приріст Винахід відноситься до психологи, а саме до психодіагностики У групових, лонптюдних, психосемантичних дослідженнях, при стандартизації та валідізацм нових психодіагностичних технік виникає задача укрупнення, «конденсації» (Л Терстоун, 1931) масиву даних у декілька однорідних груп (факторів), доступних для маркерування та змістовної інтерпретації У загальному випадку такі задачі дуже складні та розв'язуються із застосуванням спеціально розроблених методів математичної статистики (Харман Г Современный факторный анализ — М «Статистика» — 1972, Суходольский Г В Основы математической статистики для психологов — Л, Изд-воЛГУ —1972, Бурлачук Л Ф , Морозов С М Словарь-справочник по психодиагностике — СПб «Питер Ком» —1999) Е В Методы математической обработки в психологии — СПб «Речь» — 2001 — С 19) Крім того, методи факторного аналізу « слишком сложны и запутанны, чтобы каждый исследователь мог точно понимать, какие преобразования стоят за ними» (там же, — С 7) Вищевказані причини найчастіше приводять до недостатньо обґрунтованого, доцільного та коректного застосування розрахункових технологій Враховуючи, що кінцева інтерпретація їх результатів залишається суто суб'єктивною та цілком залежить від наукових поглядів дослідника, велика ймовірність одержання артефактних, абстрактних висновків, не наповнених реальним психологічним змістом (46) 17 03 2003, Бюл № 3, 2003 р (72) Луцик Володимир Леонідович (73) Луцик Володимир Леонідович До основних недоліків аналогів належить таке Дотепер є дискусійною принципова застосовність факторно-аналітичних методів, що базуються на обчисленні кореляцій, для розв'язування гуманітарних задач (Юревич А В Методологический либерализм в психологи // Вопросы психологии — 2001, №5, С 3 - 18) 3 іншого боку, подібні методи « не сопровождаются, как правило, скольконибудь убедительным математико-статистическим анализом их свойств, но основаны на вычислительных рекомендациях эвристического или полуэвристического характера» (Математическая энциклопедия — Москва «Советская энциклопедия», 1984 — Т 5 — С 595) Важливою проблемою є й те, що більшість класичних способів факторизацм належать до параметричних методів, тобто суттєво залежать від параметрів розподілу результатів вимірів розподіл повинен підкорятися «нормальному», дзвоноподібному законові, що в ДІЙСНОСТІ Є скоріше виключенням, ніж правилом (Сидоренко В основу винаходу поставлена задача розробити надійний, оптимізований за складністю, точністю та ЗМІСТОВНІСТЮ спосіб виявлення високо узгоджених підмножин у загальному масиві даних — шляхом ітераційного відсіювання неоднорідних елементів, — що забезпечить групування психодіагностичних результатів за їх однорідністю Спосіб побудовано на обчисленні та покроковій конденсації коефіцієнта конкордацм W, інакше званому коефіцієнтом множинної рангової кореляції (Суходольский Г В Основы математической статистики для психологов — Л Изд-во ЛГУ — 1972, Рабочая книга социолога, — М «Наука» — 1977, Петренко ВФ Основы психосемантики — М Изд-во МГУ — 1997) Коефіцієнт конкордацм є мірою однотипності, узгодженості рангування декількох об'єктів у деякій вибірці Об'єкти можуть зіставлятися за номінативною, порядковою чи рівноштервальною чисельною шкалою, але обов'язково повинні піддаватися рангуванню (впорядкуванню за зростанням, убуванням, черговостю переваги та ш) Не є принциповою перешкодою різнорідність даних, що рангуються — напр , результати ю ю 55177 декількох тестів у діагностичній батареї легко мобез якого W одержує максимальний приріст Потім жуть бути приведені до єдиної відносної форми весь алгоритм «виключення слабкої ланки» повто(шляхом ділення реально отриманого показника рюється для вибірки з m - 1 спостережень — доти, на максимально можливий для даного тесту) та в коли на деякому h-ому кроці (при h ВІДСІЯНИХ спотакому вигляді проранговані в кожного з п випростереженнях) буде досягнуто заданий рівень мнобуваних Обов'язкова лише ідентичність набору жинної рангової кореляції — якщо він взагалі дооб'єктів (чи змінних) у ВСІХ спостереженнях та одсяжний при наявних вихідних даних носпрямованість рангування У випадку, якщо два Цілком аналогічний ітераційний цикл допустичи більш об'єкти в деякому спостереженні примий і у відношенні ВІДСІЯНОГО масиву спостережень ймають однакові значення (що можливо при чисе(це доцільно, якщо рівень конкордації в залишку льному типі об'єктів), для присвоєння їм рангів вище випадкового, тобто якщо залишок також слід дотримуватися відомих правил (Сидоренко включає деяку однорідну групу) — у такий спосіб Е В Методы математической обработки в психобуде виявлено другий «тип» рангування, свідомо логии — СПб «Речь» —2001) ВІДМІННИЙ від першого, «центрального», основного для вибірки, потім третій і т д , доки це можливо та Коефіцієнт множинної рангової кореляції W необхідно для конкретного дослідження відбиває ступінь подібності в рятуванні об'єктів по усій вибірці в цілому Змінюється В межах від нуля Відносним недоліком пропонованого способу є (коли рангування абсолютно випадкове, тобто койого трудомісткість (непорівнянна, утім, із громізджен об'єкт із рівною ймовірністю попадає на будькосте традиційних факторно-аналітичних процеяку позицію) ДО ОДИНИЦІ (КОЛИ В КОЖНІМ спостередур), отже на увазі первісне мається комп'ютерна женні рангова позиція кожного об'єкта в точності реалізація Однак, при сучасному рівні поширення повторюється) Розрахункова формула персональної обчислювальної техніки та доступності мов програмування реалізація алгоритму «відсіювання слабкої ланки» є елементарною задачею не лише для професійного програміста, але 1=1 w = 2 3 і для досвідченого користувача m (n -n) Переваги ж пропонованого способу полягають де W — коефіцієнт конкордації, m — обсяг виу наступному По-перше, уже на початковому етапі бірки, п — число об'єктів рангування, конденсується саме та група даних, яка для даної , „ m(n +1) _ d. = S. - — , S, — сума рангів кожного j-ro вибірки складає найбільш типову тенденцію рангування та найбільшою мірою «навантажує» коефіоб'єкта Статистична значимість коефіцієнта W цієнт W По-друге, покрокове відсіювання забезпе2 визначається за критерієм % , що обчислюється за чує дуже високу (до сотих та тисячних часток) 2 формулою % = Wm(n - 1) з числом ступенів своборозрішаючу здатність, що дозволяє виділяти групи ди п - 1 (критичні значення для різних рівнів доз будь-яким довільно заданим ступенем конкордастовірності знаходяться за існуючими таблицями ції По-третє, обчислювальна множинно— див 5 напр , Гмурман В Е Теория вероятностей кореляційна технологія, що лежить в основі прои математическая статистика — М «Высшая понованого способу, належить до непараметричшкола», 2001) них методів, тобто не пред'являє суворих вимог Рангові суми Sj, що входять до розрахункової ані до характеру даних, ані до статистичних параформули, самі по собі є досить інформативними метрів їхнього розподілу неважко бачити, що чим менше набрана у m споНеобхідно відзначити, що перевірка статистистереженнях j-та об'єктом рангова сума, тим сильчної значимості коефіцієнта W (див вище) засноніше наближення цього об'єкта до початку ряду, і вана на властивостях розподілу хі-квадрат Власнавпаки, це дозволяє побудувати для досліджуване, метод розрахунку множинної рангової ної вибірки найбільш типовий, найбільш ймовірний кореляції є зворотним до заснованого на тих же порядок розташування об'єктів (напр , черговість властивостях методу обчислення критерію %г2 Фріпереваги колірних стимулів) — у порядку зростандмана — для випадку, коли формулюється гіпотеня рангових сум за про не випадковість рангового розподілу сукупСпосіб виконується таким чином На першому ності об'єктів у всій вибірці (Сидоренко Е В етапі обчислюється коефіцієнт конкордації для Методы математической обработки в психологии усієї вибірки взагалі Ставиться задача виявити — СПб «Речь» — 2001) Інакше кажучи, суть підмножину, що складає «центральне ядро» вибірпропонованого способу не зміниться, якщо в розки, тобто деяку групу спостережень, більш подібрахунковому алгоритмі коректно замінити коефіціних за досліджуваним рангуванням, чим вибірка в єнт W коефіцієнтом у/ Фрідмана, модифікованим цілому (при цьому ступінь конкордації підмножини, коефіцієнтом р Спірмена або ш (Суходольский що виявляється, задається дослідником та може Г В Основы математической статистики для псибути будь-якою у межах від W до 1, де W — коефіхологов — Л Изд-воЛГУ —1972) цієнт у загальній вибірці) Необхідно установити, Приклад у вибірці з 86 випробуваних провевиключення якого з m спостережень найбільшою дено тест Люшера (рангування 8 кольорів за їхмірою підвищить вибірковий коефіцієнт W Для ньою зоровою привабливостю) Необхідно виявити цього розрахункова процедура повторюється m в загальній вибірці підгрупи респондентів з подібразів (на першому кроці виключається 1-ий з ранними емоційними особливостями (на підставі погованих рядів, потім він повертається та виключадібного віддання переваги кольорам) Для обчисється 2-ий — і так далі) Усякий раз фіксується лень застосовувалася нескладна макросзміна W Остаточно з вибірки відсівається той ряд, програма, написана в офісному редакторі Microsoft® Word 2000 Коефіцієнт множинної рангової кореляції результатів тесту Люшера в цілому по вибірці склав W = 0,21 (р < 0,01), найбільш ймовірна чи типова ПОСЛІДОВНІСТЬ переваги кольорів — 2 5 4 3 1 6 0 7 (тут і далі будувалася за зростанням рангових сум) Отримане значення коефіцієнта W приблизно відповідає «фоновому» рівню узгодженості рангування кольорів для різнорідних вибірок популяції норми (Петренко В Ф Основы психосемантики — М Изд-во МГУ, 1997) та, незважаючи на статистичну значимість, не є достатнім для змістовної інтерпретації Методом «слабкої ланки» у загальному масиві спостережень виявлена перша група (23чол), W = 0,801 (р < 0,001), середньо груповий профіль віддання переваги кольорам — 3 4 5 2 1 6 0 7 У залишку (53спост) коефіцієнт конкордацм W = 0 149, р < 0,015 тобто дані також суттєво узгоджені, тому процедуру продовжено Виділено другу групу (14чол), W = 0,715, р < 0,001, характерна ПОСЛІДОВНІСТЬ віддання переваги — 5 2 55177 1 6 4 0 3 7 У залишку (39чол) W = 0,092, р < 0,01, 6 процедуру продовжено Виявлено третю групу (13чол), W = 0,706, р 0,05, тобто рівень множинної рангової кореляції не відрізняється значимо від випадкового, процедуру припинено Таким чином, у досліджуваній вибірці виявлено три досить великі для аналізу підмножини, котрі високо узгоджені за типом рангуванням кольорів та суттєво відрізняються за цією ознакою як одна від одної, так і від загальної вибіркової тенденції Виявлені підгрупи охоплюють 69% усього масиву колірних виборів, ІНШІ дані статистичне випадкові чи різнорідні Дуже висока конкордація у відданні переваги кольорам в кожній з виявлених підгруп може бути легко інтерпретована (у рамках теорії Люшера) як детермінована дією загальних афективно-мотиваційних факторів, стійких особистісних особливостей тощо Поставлена задача вирішена Підписано до друку 03 04 2003 р Тираж 39 прим ТОВ "Міжнародний науковий комітет" вул Артема, 77, м Київ, 04050, Україна (044)236-47-24

Дивитися

Додаткова інформація

Назва патенту англійською

Method for discerning central homogeneous subset within array of ranked data ("weak link" technique)

Назва патенту російською

Способ выявления центрального однородного подмножества в массиве ранжированных данных (способ "слабого звена")

МПК / Мітки

МПК: A61B 5/16

Мітки: масиві, виявлення, ланки, центральної, підмножини, спосіб, слабкої, даних, однорідної, рангованих

Код посилання

<a href="https://ua.patents.su/3-55177-sposib-viyavlennya-centralno-odnoridno-pidmnozhini-u-masivi-rangovanikh-danikh-sposib-slabko-lanki.html" target="_blank" rel="follow" title="База патентів України">Спосіб виявлення центральної однорідної підмножини у масиві рангованих даних (спосіб “слабкої ланки”)</a>

Подібні патенти