Оутлиер Формула | Корак по корак израчунавање одступања (са примером)

Формула Оутлиер пружа графички алат за израчунавање података који се налазе изван датог скупа расподеле, а који могу бити унутрашња или спољна страна у зависности од променљивих.

Шта је Оутлиер формула?

Изузетак је тачка података датог узорка или датог посматрања или у дистрибуцији која лежи изван укупног обрасца. Уобичајено правило које каже да ће се тачка података сматрати одступањем ако има више од 1,5 ИКР испод првог квартила или изнад трећег квартила.

Речено другачије, ниски одступања леже испод К1-1,5 ИКР, а високи одступају К3 + 1,5ИКР

Треба израчунати медијану, квартиле укључујући ИКР, К1 и К3.

Формула са изузетком представљена је на следећи начин,

Формула за К1 = ¼ (н + 1) тх чланФормула за К3 = ¾ (н + 1) тх чланФормула за К2 = К3 - К1

Корак по корак израчунавање одступања

Да би се израчунао Оутлиер потребно је следити доње кораке.

  • Корак 1: Прво израчунајте квартиле, тј. К1, К2 и интерквартил
  • Корак 2: Сада израчунајте вредност К2 * 1,5
  • Корак 3: Сада од вредности К1 одузмите вредност израчунату у кораку 2
  • Корак 4: Овде додајте К3 са вредношћу израчунатом у кораку 2
  • Корак 5: Креирајте опсег вредности израчунатих у Корак 3 и Корак 4
  • Корак 6: Подесите податке у растућем редоследу
  • Корак 7: Проверите да ли постоје вредности које су испод или веће од опсега створеног у кораку 5

Пример

Узмите у обзир скуп података следећих бројева: 10, 2, 4, 7, 8, 5, 11, 3, 12. Потребно је да израчунате све одступања.

Решење:

Прво треба да поређамо податке у растућем редоследу да бисмо пронашли медијану која ће за нас бити К2.

2, 3, 4, 5, 7, 8, 10, 11, 12

Сада, будући да је број запажања непаран, који је 9, медијана би лежала на петом положају који је 7, а исти ће бити К2 за овај пример.

Према томе, израчунавање К1 је следеће -

К1 = ¼ (9 + 1)

= ¼ (10)

К1 ће бити -

К1 = 2,5 члана

То значи да је К1 просек 2. и 3. позиције посматрања која је овде 3 и 4, а просек истих је (3 + 4) / 2 = 3.5

Према томе, израчунавање К3 је следеће -

К3 = ¾ (9 + 1)

= ¾ (10)

К3 ће бити -

К3 = 7,5 члана

То значи да је К3 просек седмог и осмог места посматрања који је овде 10 и 11 и просек истог је (10 + 11) / 2 = 10,5

Сада ће нижи одступања лежати испод К1-1.5ИКР, а високи од К3 + 1.5ИКР

Дакле, вредности су 3,5 - (1,5 * 7) = -7, а већи опсег је 10,5 + (1,5 * 7) = 110,25.

Будући да нема запажања која су изнад или испод 110,25 и -7, у овом узорку немамо никаквих одступања.

Пример необичне формуле у Екцелу (са Екцел предлошком)

Овде можете преузети овај предложак Екцел формуле Екцел - Екцел образац формуле Екцел

Часови креативног подучавања разматрају могућност награђивања ученика који су у топ 25%. Међутим, они желе да избегну било какве разлике. Подаци су за 25 ученика. Помоћу једначине Оутлиер одредите да ли постоји оутлиер?

Решење:

Испод су дати подаци за израчунавање одступања

Број запажања овде је 25 и наш први корак би био претварање горњих података у растућем редоследу.

Медијан ће бити -

Средња вредност = ½ (н + 1)

= ½ = ½ (26)

= 13. мандат

К2 или медијана је 68,00

Што је 50% становништва.

К1 ће бити -

К1 = ¼ (н + 1) тх члан

= ¼ (25+1)

= ¼ (26)

= 6,5-ти појам који је еквивалентан 7-том члану

К1 је 56,00 што је најнижих 25%

К3 ће бити -

Коначно, К3 = ¾ (н + 1) тх члан

= ¾ (26)

= 19.50 термин

Овде треба узети просек који се састоји од 19. и 20. члана који су 77 и 77 и просек истог је (77 + 77) / 2 = 77.00

 К3 је 77, што је топ 25%

Мали опсег

Сада ће нижи одступања лежати испод К1-1.5ИКР, а високи од К3 + 1.5ИКР

Хигх Ранге -

Дакле, вредности су 56 - (1,5 * 68) = -46, а већи опсег је 77 + (1,5 * 68) = 179.

Нема истицања.

Релевантност и употреба

Формулу оутлиерс је веома важно знати, јер могу постојати подаци који би се искривили због такве вредности. Узмимо пример запажања 2, 4, 6, 101 и сада, ако неко узме просек ових вредности, то ће бити 28,25, али 75% запажања лежи испод 7, па би стога била нетачна одлука у вези са запажањима овог узорка.

Овде се може приметити да се чини да се 101 јасно оцртава и ако се то уклони, просек би био 4, што говори о вредностима или запажањима да леже у опсегу 4. Стога је врло важно спровести овај прорачун како би се избегло било какве погрешне информације које воде податке. Њих широко користе статистичари широм света кад год врше неко истраживање.