Nápady.  Zajímavý.  Veřejné stravování.  Výroba.  Řízení.  Zemědělství

Rozdělení pracovníků podle profesí a kategorií. Školení personálu průmyslového podniku (na příkladu JSC Vologda Optical-Mechanical Plant). Výběr režimu práce a odpočinku

Mzdy výrobních dělníků jsou stanoveny na základě hodinových mzdových sazeb v závislosti na pracovních podmínkách, kvalifikační kategorii a formách odměňování. Přesné rozdělení pracovníků podle kategorií a pracovních podmínek závisí na vlastnostech konkrétní výroby. U strojírenských podniků je pozorováno přibližně toto rozdělení:

  • 1) asi 80 % průměrných výrobních pracovníků pracuje ve studených zaměstnáních s normálními pracovními podmínkami a 20 % pracuje v horkých a těžkých zaměstnáních;
  • 2) ze všech výrobních pracovníků přibližně 65 % pracuje na základě kusové sazby a zbytek - na základě času;
  • 3) každá skupina pracovníků je mezi sebou obvykle rozdělena v procentech podle kvalifikačních kategorií (příklad rozdělení je uveden ve spodních řádcích tabulky 2)

Vzhledem k tomu, že tento projekt vyžaduje především stanovení základních mezd hlavních pracovníků, je třeba rozdělit jejich počet (Chor) podle pracovních podmínek a kvalifikačních kategorií. Pro výpočet odpovídajícího čísla je vhodné použít diagram (strom) znázorněný na Obr. 1. Používají se následující označení: Chn - počet lidí pracujících za normálních podmínek; Chn - počet lidí pracujících v obtížných podmínkách; Chsd - počet lidí pracujících v systému mzdových tarifů za kus; Chpv - počet lidí pracujících v časovém mzdovém systému; Chsd a Chvp - počet pracovníků s i-tou kategorií; a1 je koeficient, který zohledňuje podíl pracovníků s i-tou kategorií v odpovídající skupině.

Zlomkové hodnoty ukazatelů Chnd, Chnvp- atd. by měly být zaokrouhleny na celá čísla tak, aby se jejich výsledný součet rovnal celkové hodnotě - Chor. Předpokládá se, že počet pomocných pracovníků je rozdělen podle pracovních podmínek a kategorií stejně jako u hlavních.

Hodinové tarify, rub.

Při studených pracích s normálními pracovními podmínkami

(Chn):. Kusoví dělníci (Chnsd)

Znsd3 = = 5,12

pracovníci s časem (Chnpv)

Znpv3 = = 4,78

Znpv4 = = 5,36

Znpv5 = = 6,10

Při horké a těžké práci (Ht):

Kusoví dělníci (Ch tsd)

pracovníci s časem (Chtpv)

Rozdělení pracovníků podle kategorií, %

Koeficient bi, zohlednění

počet pracovníků odpovídající kategorie

Chor=360111, osob Chn=0,8*360=288, osob Ht = 0,2 x 360 = 72, os.

Chnsd=0,65*288=187, os. Htsd = 0,65 x 72 = 46, os.

Chnsd1 =187*0,05=9, os. Htsd1 = 46 x 0,05 = 2, os.

Chnsd2 =187*0,12=22, os. Htsd2=46*0,12=5, os.

Chnsd3 =187*0,5=93, os. Htsd3=46*0,5=23, os.

Chnsd4 =187*0,2=37, os. Htsd4=46*0,2=9, os.

Chnsd5 =187*0,1=18, os. Htsd5=46*0,1=4, os.

Chnsd6 =187*0,03=5, os. Htsd6=46*0,03=1, os.

Chnpv=0,35*288=100, osob. H tpv = 0,35 x 72 = 25, os.

Chnpv1 =100*0,05= 5 osob. H tpv1=25*0,05=1, os.

Chnpv2=100*0,12=12, osob. H tpv2=25*0,12=3, os.

Chnpv3=100*0,5=50, osob. H tpv3=25*0,5=12, os.

Chnpv4=100*0,2=20, os. H tpv4=25*0,2=5, os.

Chnpv5 =100*0,1=10, osob. H tpv5=25*0,1=2, os.

Chnpv6 =100*0,03=3, os. H tpv6=25*0,03=1, os.

Fond pracovní doby jednoho pracovníka je určen vzorcem:

kde jsou kalendářní dny, 365 dní;

Volné dny v roce, 54 dní;

Svátky za rok, 13 dní;

Dny dovolené, 24 dní;

Dny nepřítomnosti v práci z důvodu nemoci, 2 dny;

Dny nepřítomnosti v práci z důvodu vládních povinností, 1 den;

Délka pracovního dne, 8 hodin;

Doba zkrácení pracovního dne před víkendy a svátky je 1 hodina.

Počet opravářů

Počet opravářů je určen vzorcem:

kde je koeficient plnění výrobních norem pro pracovníky oprav v rozmezí 1,06-1,1.

Rozdělení pracovníků podle profesí a kategorií

Rozdělení počtu pracovníků oprav podle kategorií a profesí je provedeno s přihlédnutím k objemu výroby podle druhu práce na základě tabulky 4.

Tabulka 4 - Rozdělení pracovníků podle kategorie a druhu práce

Výpočet průměrné mzdové kategorie pracovníka

Průměrná mzdová kategorie pracovníka se vypočítá podle vzorce:

pořadí, (32)

kde 4,5,6 jsou kategorie zaměstnání;

Počet opravářů odpovídající kategorie, osob.

Získaný výsledek je nejčastěji zlomková hodnota a nelze jej zaokrouhlit na celá čísla. Průměrnou tarifní kategorii se doporučuje psát jako desetinný zlomek, přičemž celá čísla označují římskými číslicemi a zlomková čísla arabskými číslicemi, například III, 5.

Výběr režimu práce a odpočinku

Pracovní dobu a dobu odpočinku zaměstnanců podniku upravuje pracovněprávní legislativa. Režim práce a odpočinku je optimální, pokud umožňuje prodloužit dobu stabilní výkonnosti. Toho je do značné míry dosaženo výběrem správného času pro přestávku na oběd a také načasováním dalších přestávek.

Nejlepší čas na polední přestávku je uprostřed směny. Četnost a trvání regulovaných krátkých přestávek by měly být nastaveny v závislosti na zatížení a tempu práce na místě výroby. Při lehké zátěži a pracovním tempu se doporučují 2-4 pětiminutové přestávky, při velké zátěži a vysokém pracovním tempu 4-5 desetiminutových přestávek, při vysokém nervovém napětí 4 patnáctiminutové přestávky na 7- 8hodinové pracovní směny.


Pro konstrukci řady rozdělení pracovníků podle kvalifikační úrovně v ní rozlišíme tři skupiny pracovníků: s nízkou kvalifikací (2. tarifní kategorie), střední kvalifikací (s 3. a 4. tarifní kategorií) a vysokou kvalifikací (5. a 6. tarifní kategorie). ) a poté vytvořte tabulku .

Rozdělení pracovníků podle kvalifikační úrovně

Řada rozdělení pracovníků podle tarifní kategorie je variační diskrétní řada, protože atribut, který je základem její konstrukce, je kvantitativní, tj. vyjádřeno jako číslo. Série rozdělení pracovníků podle úrovně dovedností je atributivní, protože atribut, který je základem jeho konstrukce, je kvalitativní, tj. nemá žádné kvantitativní měřítko a lze jej vyjádřit pouze slovy.

Typický problém 2

Následující údaje jsou známy o platech zaměstnanců jednoho z podniků, rublech. v roce 2005:

Stavět série rozdělení zaměstnanců podniku podle úrovně mezd, zdůrazňující čtyři skupiny pracovníků ve stejných intervalech.

Upřesněte, podle jakého seskupovacího kritéria je distribuční řada konstruována: atributivní nebo kvantitativní.

Jako studovanou charakteristiku vezmeme plat pracovníků a na jeho základě sestrojíme distribuční řadu se stejnými uzavřenými intervaly. Velikost intervalu je v tomto případě určena vzorcem:

Kde
A
– maximální a minimální hodnotu mzdy zaměstnance;

n– počet skupin.

Čitatel se jinak nazývá variační rozsah.

Tvoříme čtyři skupiny pracovníků. Potom bude hodnota intervalu rovna:

Nyní tvoříme skupiny pracovníků, které se od sebe liší platem o tuto částku. První skupina bude mít plat od 1300 do 1525 rublů, druhá od 1525 do 1750 rublů atd.

V důsledku toho dostaneme tabulku:

Rozdělení zaměstnanců podle platu, rub.

Tato distribuční řada je postavena na kvantitativním základě, prezentovaná v intervalové formě, jedná se tedy o intervalovou variační řadu.

Jak je z tabulky patrné, distribuční řadu tvoří dva prvky: a) hodnota atributu, b) absolutní počet jednotek atributu (četnosti).

Pro větší přehlednost lze absolutní hodnoty doplnit o relativní ukazatele (četnosti) vyjádřené v procentech. Zobecnění dat ve formě seskupení tedy umožňuje studovat složení populace podle studované charakteristiky, posuzovat míru její variace a porovnávat skupiny mezi sebou.

Poznámka. Konstruované distribuční řady jsou skupinové tabulky, protože jejich konstrukce je založena na jedné seskupovací charakteristice.

Modální úroveň (volba) – 5, protože má nejvyšší frekvenci ( f=55).

Medián () je hodnota proměnné charakteristiky, která rozděluje populaci na polovinu, tzn. leží uprostřed hodnocené řady.

Místo mediánu v sérii:

a) s lichým počtem jednotek:

;

b) se sudým počtem jednotek:

V našem příkladu je medián 4. pozice.

Vzorce pro výpočet strukturálních průměrů na základě seskupených dat (s intervaly):

, (6.21)

kde je spodní mez modálního intervalu (interval s nejvyšší frekvencí); i– velikost intervalu; – frekvence modálních, premodálních a postmodálních intervalů.

, (6.22)

kde je spodní hranice středního intervalu, ve kterém se nachází polovina jednotek objemu populace; i– velikost intervalu; – součet všech frekvencí; – součet četností předcházejících střednímu intervalu; – frekvence středního intervalu.

Příklad 8. V tabulce jsou uvedeny údaje o pracovních zkušenostech 30 pracovníků v dílně.

Řešení:

Modální interval s pracovní zkušeností od 6 do 12 let má frekvenci 12. Pak je režim roven:

let.

Módní přehlídka ukazuje, že pracovníci obchodů mají nejčastěji praxi 8,5 roku.

Medián intervalu (který obsahuje poloviční frekvence populace, tj. 15 osob) bude také se zkušeností 6 až 12 let.

Medián je:

let.

Medián ukazuje, že polovina pracovníků má praxi do 10 let, polovina více než 10 let.

Strukturální průměry lze určit nejen pomocí vzorců, ale také graficky: modus histogramem, medián kumulací.

Pro grafické určení režimu v histogramu se používají tři pruhy: nejvyšší a dva k němu přiléhající - vlevo a vpravo. Uvnitř sloupce s největší výškou jsou nakresleny dvě čáry: první spojuje jeho pravý horní roh s pravým horním rohem předchozího sloupce a levá jej spojuje s levým horním rohem následujícího. Na úsečce průsečíku těchto čar je způsob rozdělení prezentovaný ve formě histogramu (obr. 6.1).

Obrázek 6.1 Grafické znázornění módu v distribučním histogramu

Pro grafické určení mediánu se sestrojí kumulace a poslední pořadnice kumulace se rozdělí na polovinu. Výsledným bodem je vedena přímka rovnoběžná s osou úsečky, dokud se neprotne s kumulací. Úsečka průsečíku je mediánem graficky znázorněného rozdělení (obr. 6.2).

Obrázek 6.2 Grafické znázornění mediánu na kumulaci rozdělení

Je třeba určit s pravděpodobností 0,997 meze, ve kterých se nachází průměrná kategorie pracovníků ve strojírně.

Pojďme určit vzorové průměry pro týmy a celkový průměr:

Pojďme určit mezisériový rozptyl:

Vypočítejme průměrnou vzorkovací chybu:

Vypočítejme maximální výběrovou chybu s pravděpodobností 0,997: .

S pravděpodobností 0,997 lze konstatovat, že průměrná kategorie pracovníků ve strojírně je do .◄

Na opakovaný výběr série Průměrná výběrová chyba pro podíl je určena vzorcem:

kde je meziběhový rozptyl podílu.

Příklad.

200 krabic dílů je baleno po 40 kusech. ve všech. Pro kontrolu kvality dílů byla prováděna průběžná kontrola dílů ve 20 boxech (neopakované odběry). Výsledkem kontroly bylo zjištěno, že podíl vadných dílů je 15 %. Mezišaržový rozptyl je 49. S pravděpodobností 0,997 určíme meze, ve kterých leží podíl vadných výrobků v šarži krabic.

Stanovme průměrnou výběrovou chybu pro podíl: .

Maximální výběrová chyba pro podíl s pravděpodobností 0,997 je: .

S pravděpodobností 0,997 lze konstatovat, že podíl vadných dílů v dávce se bude pohybovat od 10,59 % do 19,41 %.

Příklad

Pro zjištění rychlosti vypořádání s věřiteli bylo mechanickým vzorkováním vybráno 50 platebních dokladů, u kterých vyšla průměrná doba převodu peněz 28,2 dne se směrodatnou odchylkou 5,4 dne. Je třeba určit průměrnou dobu všech plateb během daného roku s pravděpodobností 0,95.

Řešení. Mezní výběrová chyba

Pak s pravděpodobností 0,95 lze konstatovat, že průměrná délka vypořádání u podniku tohoto trustu je minimálně 26,7 dne (28,2 - 1,49) a maximálně 29,7 dne (28,2 + 1,49). ◄

Příklad

Obecná populace N se skládá ze 100 000 jednotek, rozdělených do 200 sérií stejného objemu. Bylo provedeno neopakující se vzorkování (m) 50 % série a 20 % jednotek z každé série. Průměr sériových rozptylů se ukázal být roven 12 a mezisériový rozptyl byl 5. Je nutné určit průměrnou výběrovou chybu.

Zjistíme celkový počet sériově vybraných jednotek: . Počet jednotek, které tvoří jednotlivý vzorek: Pomocí vzorce pro průměrnou chybu pro neopakující se výběr zjistíme:

Můžete vytvořit vzorek o stejné velikosti 100 000 jednotek výběrem 20 % série a 50 % jednotek z každé série. Při stejných hodnotách průměru sériových rozptylů a meziběhového rozptylu by se průměrná chyba tohoto vzorku zdvojnásobila.

Rozdělení středních hodnot vzorku má vždy normální distribuční zákon (nebo se mu blíží) v , bez ohledu na povahu rozdělení obecné populace. V případě malých vzorků však platí jiný distribuční zákon - Studentská distribuce. V tomto případě se koeficient spolehlivosti zjistí ze Studentových tabulek t-rozdělení v závislosti na hladině spolehlivosti a velikosti vzorku. Pro jednotlivé hodnoty je pravděpodobnost spolehlivosti malého vzorku stanovena pomocí speciálních Studentových tabulek (Tabulka 9), které uvádějí rozložení standardizovaných odchylek:

Tabulka 9.

n t
0,5 1,0 1,5 2,0 3,0
0,347 0,609 0,769 0,861 0,942
0,362 0,637 0,806 0,898 0,970
0,368 0,649 0,823 0,914 0,980
0,371 0,657 0,832 0,923 0,985
0,376 0,666 0,846 0,936 0,992
0,377 0,670 0,850 0,940 0,993

Protože při provádění malého vzorku je jako pravděpodobnost spolehlivosti prakticky akceptována hodnota 0,95 nebo 0,99, jsou pro stanovení maximální chyby malého vzorku použity následující hodnoty Studentova rozdělení (Tabulka 10)

Tabulka 10.

n
0,95 0,99
3,183 5,841
2,777 4,604
2,571 4,032
2,447 3,707
2,364 3,500
2,307 3,356
2,263 3,250
2,119 2,921
2,078 2,832

Příklad.

Při kontrolní kontrole kvality uzenin dodávaných do prodeje byly získány údaje o obsahu kuchyňské soli ve vzorcích. Podle údajů výběrového šetření je nutné s pravděpodobností 0,95 stanovit hranici, ve které se nachází průměrné procento obsahu kuchyňské soli v dané šarži zboží.

Sestavíme výpočtovou tabulku a na základě jejích výsledků určíme průměrný vzorek malého vzorku (tab. 11).

Tabulka 11.

Vzorky
4,3 0,2 0,04
4,2 0,1 0,01
3,8 0,3 0,09
4,3 0,2 0,04
3,7 - 0,4 0,16
3,9 - 0,2 0,04
4,5 0,4 0,16
4,4 0,3 0,09
4,0 - 0,1 0,01
3,9 - 0,2 0,04
41,0 - 0,68

Zjistíme rozptyl malého vzorku:

Určíme průměrnou chybu malého vzorku:

Na základě velikosti vzorku (n=10) a zadané pravděpodobnosti =0,95 je pomocí Studentova rozdělení stanovena hodnota koeficientu spolehlivosti t=2,263 (viz tabulka 10).

Mezní chyba malého vzorku bude:

S pravděpodobností 0,95 lze tedy konstatovat, že v celé šarži uzeniny je obsah kuchyňské soli v mezích:

Tito. od 4,1 % - 0,2 % = 3,9 % do 4,1 % + 0,2 % = 4,3 %.◄

Příklad

Je nutné sestrojit 99% interval spolehlivosti pro odhad obecného průměrného průměru výrobku na základě vzorku 10 dílů zpracovaných na automatickém soustruhu, pokud se ukázaly odchylky rozměrů těchto dílů od středu tolerančního pole. bude následující (tabulka 12):

Tabulka 12.

Ukázkový průměr mikro. Vzorový rozptyl je 5,2:

Střední kvadratická chyba vzorku bude 0,76 mikronů: mk.

Při P = 0,99 a počtu stupňů volnosti k = 9 zjistíme z tabulky, že hodnota t je 3,25. Pak s pravděpodobností 0,99 můžeme předpokládat, že chyba průměru vzorku nebude větší než 2,47 μm (3,25 x 0,76) a přijatelné hodnoty parametru populace leží v rozmezí od – 0,47 do + 4,47 kg (2,0 ± 2,47).◄

4. Stanovení požadované velikosti vzorku. Před přímým provedením výběrového pozorování je vždy vyřešena otázka, kolik jednotek zkoumané populace musí být pro průzkum vybráno. Velikost vzorku lze určit v souladu s ustanoveními:

· typ zamýšleného vzorku;

· způsob výběru (opakovaný nebo neopakující se);

· výběr hodnoceného parametru (průměrná hodnota charakteristiky nebo podílu).

Kromě toho je nutné předem určit hodnotu pravděpodobnosti spolehlivosti, která vyhovuje spotřebiteli informace, a velikost přípustné maximální výběrové chyby.

Tyto problémy jsou řešeny na základě teorémů P. Čebyševa a A. Ljapunova. Hodnota maximální výběrové chyby pro čistě náhodný, mechanický vzorek se stanoví takto:

Pro čistě náhodné a mechanické odběry s neopakovatelnou metodou výběru se požadovaná velikost vzorku pro průměrnou kvantitativní charakteristiku vypočítá pomocí vzorce

Při určování ze vzorových materiálů podíl charakteristiky, a nikoli jeho průměrnou hodnotu, velikost výběrového souboru bude určena pomocí následujících vzorců.

Pro opětovný výběr:

Pro neopakující se výběr:

Veličina charakterizující rozptyl v populaci je často neznámá. V matematické statistice bylo prokázáno, že vztah mezi obecným a výběrovým rozptylem je určen rovností

Protože pro dostatečně velké hodnoty je hodnota blízká jednotce, můžeme předpokládat, že . Proto se v praxi výběrový rozptyl používá jako odhad obecného rozptylu. Všimněte si, že na začátku pozorování vzorku jsou variační indikátory neznámé, proto je určení požadované velikosti vzorku často vážným problémem spojeným s určením variačního indikátoru studované charakteristiky. Přibližně variační index se určuje jedním z následujících způsobů:

· převzato z předchozích studií;

· jsou-li struktura a podmínky vývoje dostatečně stabilní, nebo se znalostí přibližné hodnoty průměru, zjistí se rozptyl ze vztahu;

· jestliže a jsou známy, pak lze směrodatnou odchylku určit v souladu s pravidlem „tři sigma“: , protože v normálním rozdělení se rozsah odchylky vejde do . Pokud je rozdělení zjevně asymetrické, pak ;

při studiu alternativní charakteristiky pro případ, kdy je frekvence i přibližně neznámá, můžete vzít maximální hodnotu rozptylu podílu rovnou 0,25, tzn. . V tomto případě máme pro opakovaný výběr, pro neopakující se výběr;

· provést „testovací“ vzorek, ze kterého se vypočítá variační index, použitý jako odhad obecné populace.

Vzhledem k tomu, že obecný rozptyl se odhaduje přibližně, velikost vzorku se zaokrouhluje nahoru jak u opakovaného, ​​tak u neopakovaného výběru, protože v počtu zkoumaných jednotek musí být vždy nějaká „rezerva“, aby byla zajištěna požadovaná přesnost výsledků.

V praxi často není specifikována hodnota absolutní maximální chyby, ale hodnota relativní chyby vyjádřená jako procento průměru:

kde .

Dosazením hodnoty vyjádřené pomocí relativní chyby do vzorce pro stanovení získáme následující výraz pro určení požadované velikosti vzorku:

Jak je známo, poměr je variační koeficient , kde

Při neopakujícím se vzorkování se velikost vzorku vypočítá pomocí vzorce

Pokud je uvedena maximální výběrová chyba a velikost vzorku, můžete určit hodnotu koeficientu, pokud víte, můžete určit pravděpodobnost z tabulky.

Příklad

Kolik cestovních kanceláří je třeba zjišťovat v podnicích cestovního ruchu v regionu, aby bylo možné získat charakteristiku průměrné úrovně odměn pro tuto kategorii pracovníků v regionu? Je známo, že rozdíl mezi nejvyšší a nejnižší úrovní odměn pro cestovní kanceláře v regionu je 300 tisíc rublů.

Pro normální rozdělení v intervalu ± 3s zahrnuje 99,7 % všech variant hodnot atributů, což ve vztahu k uvažovanému problému znamená, že 300 tisíc rublů. přibližně rovna šesti směrodatným odchylkám (300 » 6s). Proto bude přibližný odhad směrodatné odchylky mezd v běžné populaci cestovních kanceláří v regionu činit 50 tisíc rublů. (). Pro další výpočty stačí, aby s pravděpodobností 0,954 nepřesáhla maximální výběrová chyba 10 tisíc rublů. Poté, s vědomím, že s = 50 tisíc rublů, a t = 2 a pomocí vzorce (5.6) pro určení požadované velikosti vzorku získáme: lidé

Za daných podmínek je tedy nutné zjišťovat platy 100 cestovních kanceláří v regionu.◄

Příklad

Jak velký by měl být vzorek z populace, která zahrnuje 8 000 mladých investorů, aby s pravděpodobností 0,954 nebyla relativní mezní chyba větší než 1 %, pokud je známo, že variační koeficient atributu pro celou populaci je 0,125 , tedy 12,5 %?

S V=12,5 %, =1 %, t=2 máme lidi◄

Příklad

Na základě výběrového šetření určité skupiny obyvatel (N = 5 000) je třeba zjistit podíl rodin, které v současné době nemají auto z dovozu. Maximální výběrová chyba by neměla být větší než 0,01 s pravděpodobností 0,954. Lze předpokládat, že podíl v populaci je menší než 0,2. Jaká by měla být velikost vzorku?

Domácnost

Podíl domácností, které nemají auto z dovozu, je . Pokud v tomto příkladu nebereme v úvahu objem populace, pak výpočty vedou k nesmyslnému výsledku:

Příklad

Ve vzorku 1000 kusů byl podíl vadných výrobků 2 %. Jaká je pravděpodobnost, že v celé dávce výrobků (10 000 kusů) bude podíl vadných výrobků v rozmezí od 1,5 do 2,5 %?

Pravděpodobnost spolehlivosti, kterou je třeba určit, je funkce t. Ten se zjistí ze vzorce pro maximální výběrovou chybu , kde . Hodnotu maximální výběrové chyby lze definovat jako rozdíl mezi maximálním přípustným obecným podílem (podle podmínky je roven 2,5 %) a podílem vadných výrobků ve vzorku (podle podmínky 2 %). .

Tedy = 0,5 % (2,5 % – 2,0 %). Protože je vzorek náhodný, neopakující se, je hodnota průměrné výběrové chyby zjištěna vzorcem

Zjistíme hodnotu koeficientu spolehlivosti:.

Podle tabulek Laplaceovy integrální funkce pravděpodobnost odpovídající dané hodnotě koeficientu t, rovná 0,76595. ◄

5. Metody šíření výběrových dat obecné populaci. Metoda výběru se nejčastěji používá k získání charakteristik populace podle odpovídajících výběrových ukazatelů. V závislosti na účelu výzkumu dva metoda rozšíření pozorování vzorku na běžnou populaci: přímý přepočet výběrových ukazatelů pro běžnou populaci nebo výpočtem korekčních faktorů.

Metoda přímé konverze spočívá v tom, že ukazatele podílu nebo průměru vzorku jsou rozšířeny na obecnou populaci s přihlédnutím k výběrové chybě. V tomto případě je obecný průměr definován jako , a obecný podíl je .

V obchodě se tedy zjišťuje počet přijatých nestandardních produktů v zásilce. K tomu (s přihlédnutím k přijaté míře pravděpodobnosti) se ukazatele podílu nestandardních výrobků ve vzorku vynásobí počtem výrobků v celé dávce zboží.

Příklad.

Při namátkové kontrole šarže nakrájených bochníků 2000 kusů. podíl nestandardních produktů ve vzorku je: 0,1 (10:100) s maximální výběrovou chybou stanovenou s pravděpodobností =0,954.

Na základě těchto údajů bude podíl nestandardních produktů v celé dávce: nebo od 0,04 do 0,16.

Metodou přímého přepočtu je možné stanovit limity absolutního počtu nestandardních výrobků v celé dávce: minimální počet - 2 000: 0,04 = 80 ks; maximální počet - 2 000: 0,16 = 320 ks.

Metoda korekčních faktorů používá se v případech, kdy účelem metody odběru vzorků je objasnění výsledků průběžného pozorování.

Ve statistické praxi se tato metoda používá pro zpřesnění údajů z ročních cenzů hospodářských zvířat ve vlastnictví obyvatelstva. K tomu se po zobecnění dat z kompletního sčítání používá 10% výběrové šetření ke stanovení tzv. „procenta podpočtu“.

Pokud tedy například podle 10% vzorku bylo na farmách vesnického obyvatelstva registrováno 52 kusů hospodářských zvířat a podle úplných údajů ze sčítání je v tomto poli uvedeno 50 kusů, pak faktor podpočtu je 4 % [(2x50):100]. S přihlédnutím k získanému koeficientu je provedena úprava celkového počtu hospodářských zvířat ve vlastnictví obyvatel dané obce.

6. Statistické testování hypotéz. Hypotéza- jedná se o vědecký předpoklad o vlastnostech jevů, které je určují, vyžadující ověření a důkaz.

Statistická hypotéza- jedná se o určitý předpoklad ohledně parametrů či tvaru rozložení populace, který lze ověřit na základě výsledků výběrového pozorování. Podstatou testování hypotéz je ověřit, zda jsou výsledky vzorku v souladu s hypotézou nebo zda jsou nesrovnalosti mezi hypotézou a daty vzorku náhodné či nenáhodné.

Lze předpokládat, že normální, binomické, Poissonovo rozdělení atd. . Důvodem častého odkazování na normální rozdělení je, že tento typ rozdělení vyjadřuje vzorec, který vzniká interakcí mnoha náhodných příčin, kdy žádná z nich nemá převládající vliv. V socioekonomické statistice je normální rozdělení vzácné, ale srovnání s ním je důležité pro určení rozsahu a povahy odchylky skutečného rozdělení od něj. Při testování hypotéz je možné udělat dva typy chyb:

A) Chyba typu I– testovaná hypotéza (obvykle nazývaná nulová hypotéza) je skutečně pravdivá, ale výsledky testu vedou k jejímu zamítnutí;

b) Chyba typu II– testovaná hypotéza je ve skutečnosti chybná, ale výsledky testu vedou k jejímu přijetí.

Nejčastěji je hypotéza, kterou je třeba testovat, formulována jako nepřítomnost nesrovnalostí mezi neznámým populačním parametrem a danou hodnotou (nulová hypotéza), označená . Obsah hypotézy se píše například za dvojtečkou.

Statistické kritérium je pravidlo, podle kterého se nulová hypotéza přijímá nebo zamítá. Pro každý typ testované hypotézy byla vyvinuta speciální kritéria, mezi nimiž se nejčastěji používají test normálního rozdělení a Studentovo rozdělení, Fisherův test, Pearsonovo rozdělení („chí-kvadrát“) a další.

Chcete-li sestavit statistické kritérium, které vám umožní testovat určitou hypotézu, potřebujete následující:

1) Formulujte testovatelnou hypotézu. Spolu s testovanou hypotézou je formulována i hypotéza konkurenční (alternativní);

2) vybrat hladinu významnosti, která řídí přípustnou pravděpodobnost chyby typu I;

3) určit rozsah přijatelných hodnot a takzvanou kritickou oblast;

4) učinit to či ono rozhodnutí na základě srovnání skutečných a kritických hodnot kritéria.

Úroveň významnosti() je tak malá hodnota pravděpodobnosti spadání kritéria do kritické oblasti, pokud je hypotéza platná, že výskyt této události lze považovat za důsledek významného nesouladu mezi předloženou hypotézou a výsledky vzorku. . Obvykle se hladina významnosti považuje za 0,05 nebo 0,01.

Síla testu je pravděpodobnost zamítnutí testované nulové hypotézy, když je alternativní hypotéza správná. To znamená, že síla kritéria je pravděpodobnost, že nedojde k žádné chybě. Samozřejmě je žádoucí mít výkonnější kritérium, protože to zajistí minimální pravděpodobnost vzniku chyby typu II.

Statistické testy používané k testování hypotéz jsou dvou typů:

1) Parametrické Nazývám kritéria, která jsou založena na předpokladu: rozdělení náhodné veličiny v agregátu se řídí nějakým známým zákonem (například normální, binomické, Poissonovo). Tato kritéria zahrnují kritéria.

2) Neparametrické(ordinální) jsou kritéria, jejichž použití nesouvisí se znalostí zákona o rozdělení náhodné veličiny. Lze je použít, když se rozložení výrazně liší od normálního. Tato kritéria zahrnují testy Wilcoxon, White a Mann-Whitney.

Oproti parametrickým testům má neparametrické testování následující výhody a nevýhody.

výhody:

1. Méně předpokladů o populaci. Nejdůležitější z nich je, že populace by neměla být normálně distribuovaná nebo přibližně normální.

2. Neparametrické testovací metody lze použít i tehdy, když je vzorek velmi malý.

3. Lze použít data prezentovaná v jakékoli měřící stupnici (nominální, ordinální).

4. Jednoduchost výpočtů, které lze provádět na mikrokalkulátoru. Je to způsobeno především malým počtem pozorování, na která jsou aplikovány neparametrické testy.

nedostatky:

1. Datové informace jsou využívány méně efektivně a síla testů je nižší než u parametrických.

Neparametrické testování se více spoléhá na statistické tabulky, pokud není použit speciální softwarový balík.

Etapy práce na testování statistické hypotézy:

1) posouzení vstupních informací a popis statistického modelu výběrové populace;

2) vytvoření nulové a alternativní hypotézy;

3) stanovení úrovně významnosti, se kterou se má kontrolovat chyba prvního typu;

4) výběr účinného kritéria pro testování nulové hypotézy (to umožňuje kontrolovat výskyt chyby typu II);

5) výpočet skutečné hodnoty kritéria pomocí určitého algoritmu;

6) určení kritické oblasti a oblasti shody s nulovou hypotézou, tj. stanovení tabulkové hodnoty kritéria;

7) porovnání skutečných a tabulkových hodnot kritéria a vyvození závěrů na základě výsledků testování nulové hypotézy.

Počet pozorování, ze kterého je empirická distribuce konstruována, je malý a představuje vzorek ze studované populace. Empirická data jsou spojena s náhodnými chybami, jejichž velikost není známa. S nárůstem počtu pozorování a současně s poklesem hodnoty intervalu se začnou klikatosti polygonu vyhlazovat a v limitu přecházejí do hladké křivky - distribuční křivky.

Distribuční křivka charakterizuje teoretické rozdělení, to znamená, které by bylo získáno, kdyby byly zcela potlačeny všechny náhodné příčiny, které zakrývají hlavní vzorec.

Studium vzoru (tvaru) distribuce zahrnuje:

· objasnění obecné povahy distribuce;

· vyrovnání empirického rozdělení, tj. na základě empirického rozdělení se sestrojí křivka s daným tvarem;

· kontrola shody zjištěného teoretického rozdělení s empirickým.

Homogenní populace jsou charakterizovány distribuce s jedním vrcholem. Multivertex označuje heterogenita studovaná populace. V tomto případě je nutné data přeskupit, aby bylo možné identifikovat více homogenní skupiny.

Určení obecné povahy rozdělení zahrnuje posouzení stupně homogenity a také výpočet ukazatelů asymetrie a špičatosti.

Symetrický je rozdělení, ve kterém jsou frekvence libovolných dvou možností stejně vzdálených od středu rozdělení navzájem stejné. Pro symetrické rozdělení.

Pro srovnávací analýzu asymetrie několika rozdělení, relativní index asymetrie:

Hodnota může být kladná nebo záporná. Kladná hodnota ukazuje na přítomnost pravostranné asymetrie (pravá větev je více protáhlá vzhledem k maximální ordinátě než levá) (obr. 1):

Obr. 1. Mo<Ме<

Záporné znaménko indikátoru asymetrie indikuje přítomnost levostranné asymetrie (obr. 2).

Obr.2. Mo>Já>

Nejběžnější je ukazatel asymetrie, vypočítaný podle vzorce

kde je centrální moment třetího řádu.

Použití tohoto ukazatele umožňuje určit nejen míru asymetrie, ale také přítomnost či nepřítomnost asymetrie v rozložení charakteristiky v obecné populaci. Odhad se provádí pomocí střední kvadratické chyby:

kde n je počet pozorování.

Je-li >3, je asymetrie významná a distribuce znaku v populaci není symetrická. Li<3, асимметрия несущественна и ее наличие может объясняться влиянием случайных обстоятельств.

Kritérium dohody nazval kritériem pro testování hypotézy o očekávaném zákonu neznámého rozložení v populaci. Existuje řada kritérií shody: Pearson, Kolmogorov, Smirnov, Yastremsky. Tato kritéria umožňují zjistit, zda experimentální rozdělení souhlasí či nikoli s teoretickými, a také jak významné jsou nesrovnalosti mezi rozděleními.

Jedním z nejpoužívanějších testů dobré shody je test K. Pearsona („Chí-kvadrát“):

kde jsou četnosti empirického a teoretického rozdělení v intervalu, resp.

Čím větší je rozdíl mezi pozorovanou a teoretickou četností, tím větší je hodnota Pearsonova kritéria. Pro rozlišení významných hodnot od hodnot, které mohou vzniknout jako výsledek náhodného výběru, je vypočtená hodnota kritéria porovnána s tabulkovou hodnotou při příslušném počtu stupňů volnosti a dané hladině významnosti.

Po určení hodnoty Pearsonova kritéria na základě dat z konkrétního vzorku se můžete setkat s následujícími možnostmi:

1), to znamená, že spadá do kritické oblasti. To znamená, že nesoulad mezi empirickými a teoretickými četnostmi je významný a nelze jej vysvětlit náhodnými fluktuacemi ve výběrových datech. V tomto případě je zamítnuta hypotéza, že empirické rozdělení je blízké normálu.

2), to znamená, že vypočtené kritérium nepřekračuje maximální možný nesoulad mezi empirickými a teoretickými četnostmi, který může vzniknout v důsledku náhodných fluktuací ve výběrových datech. V tomto případě není zamítnuta hypotéza, že empirické rozdělení je blízké normálu.

Tabulková hodnota Pearsonova kritéria je určena na pevné hladině významnosti a odpovídajícímu počtu stupňů volnosti.

Počet stupňů volnosti = , kde je počet podmínek, o kterých se předpokládá, že jsou splněny při výpočtu teoretických četností, je počet skupin. Pojem počtu stupňů volnosti je dán tím, že ve statistických agregátech je nutné brát v úvahu lineární vztahy, které omezují volnost změny náhodných veličin. Například při výpočtu rozptylu v agregátu máme stupně volnosti, protože můžeme určit jakoukoli hodnotu charakteristiky tím, že známe hodnoty a aritmetický průměr.

Při výpočtu Pearsonova kritéria musí být splněny následující podmínky:

1. Počet pozorování musí být dostatečně velký

2. Pokud jsou teoretické četnosti v některých intervalech menší než 5, pak se takové intervaly spojí tak, aby četnosti byly větší než 5.

Příklad

Pomocí kritéria je třeba ověřit, zda rozdělení regionálních podniků podle průměrné ceny dlouhodobého majetku odpovídá běžnému zákonu o rozdělení.

Je nutné ověřit hypotézu, že vzorek je získán z normálně rozložené populace (v této populaci 30,3; 8,44).

Pro zodpovězení otázky sestavíme pomocnou tabulku 13.

Tabulka 13

Skupiny stavebních podniků podle objemu provedených smluvních prací, miliony rublů. Pozorovaná frekvence Zaokrouhlené frekvence
10–15 15–20 20–25 25–30 30–35 35–40 40–45 45–50 50–55 -2,41 -1,81 -1,22 -0,63 -0,04 0,56 1,15 1,74 2,33 -1,81 -1,22 -0,63 -0,04 0,56 1,15 1,74 2,33 2,93 -0,984 -0,930 -0,778 -0,471 -0,032 0,425 0,750 0,918 0,980 -0,930 -0,778 -0,471 -0,032 0,425 0,750 0,918 0,980 0,997 0,027 0,076 0,153 0,220 0,228 0,163 0,084 0,031 0,008 3,9 10,9 21,9 31,4 32,6 23,3 12,0 4,4 1,2
0,18 3,226 1,48 0,173 0,333
0,2
Celkový - - - - - - 5,512

Pro první interval

143*0,027 = 3,9 ≈ 4.

Počet skupin po spojení malých byl 7. Kritická hodnota se 7 – 3 = 4 stupni volnosti a významností 0,05 bude 9,49. To znamená, že pravděpodobnost odchylky rozdělení od normálního je menší než 0,05 a pravděpodobnost jeho souladu s normálním zákonem je větší než 0,95. při α = 0,1 se rovná 7,78, což je také více než skutečná hodnota. Hypotézu, že rozložení dané populace odpovídá normálnímu zákonu, nelze zamítnout.

Pomocí kritéria můžete ověřit nejen hypotézu o shodě empirického rozdělení s normálním, ale také s jakýmkoli jiným známým distribučním zákonem, např. Poissonovo rozdělení. K tomuto rozdělení dochází při zvažování událostí s nízkou pravděpodobností, ke kterým došlo ve velké sérii nezávislých studií. Pravděpodobnost výskytu těchto vzácných událostí

kde je průměrný počet výskytů události A PROTI n identické nezávislé testy, tzn. R– pravděpodobnost události během jednoho pokusu; E = 2,71828; m– četnost této akce.

Například pro provádění interní kontroly kvality zpracování žádostí o platbu bylo náhodně vybráno 100 dokumentů. Průměrný počet chyb byl . Pomocí kritéria je nutné zkontrolovat shodu empirického rozdělení s Poissonovým rozdělením (tabulka 14).

Tabulka 14

Počet chyb Počet ověřených dokumentů
0,6771 0,2641 0,0515 0,0067 0,0007 67,7 26,4 5,15 0,7 0,1 0,7859 0,4100 0,0043 8,1148 13,3877
Celkový 1,0000 26,400

Hodnota = 26,4. Počet stupňů volnosti df = 5 – 1 = 4. (Pro Poissonovo rozdělení: df = k – 1 – r, kde r = 1 nebo r = 0, pokud je odhad založen na vzorku.) Tabulkové hodnoty; . Protože je hypotéza Poissonova rozdělení zamítnuta.

Pro posouzení míry shody mezi empirickým a teoretickým rozdělením podle tohoto kritéria se používají speciální tabulky.

Při absenci speciálních tabulek může být kritérium „chí-kvadrát“ nahrazeno kritériem V.I. Romanovského:

kde je počet stupňů volnosti.

Pro normální rozdělení, Charlierovo rozdělení, kde je počet intervalů (skupin).

Rozdíly mezi empirickými a teoretickými četnostmi jsou považovány za náhodné, pokud je hodnota menší než tři.

Kromě těchto kritérií zvažte neparametrické kritérium a význam jejich použití neustále roste.

Wilcoxonův podepsaný test– počet pozorování, pro které ).

Oblast odchylky H 0 může být buď na jedné straně, nebo na obou stranách v závislosti na tom, která nulová hypotéza je testována. Při absenci speciálních tabulek W-statistiky lze použít standardní normální rozdělení, tedy Z-statistiku zohledňující P.

Příklad

Pomocí Wilcoxonova testu se znaménkem je nutné vyřešit problém významnosti překročení střední hodnoty zisku ve studované populaci firem zabývajících se transakcemi s nemovitostmi, nulové hodnoty (5% hladina významnosti). Nulová a alternativní hypotéza budou zapsány takto: Ale: m< 0; H 1: m > 0.

Tabulka 16

Výpočet Wilcoxonova testu

Firma Pozorované hodnoty (zisk jako procento z prodeje) Hodnost
-5 -5 9,5 9,5 9,5 15,5 9,5 2,0 15,5 9,5 13,5 13,5 9,5 9,5 9,5 9,5 15,5 9,5 2,0 15,5 9,5 13,5 - 9,5 13,5
Celkový - - - - 139,5 13,5

Pro společnosti s hodnosti jsou umístěny v samostatném sloupci R+. Součet hodnot v tomto sloupci udává Wilcoxonovu statistiku: W= 139,5. (Sloupec R– není zahrnut do analýzy, ale je vypočítán, aby se předešlo chybám.)

Hodnota kritického kritéria W lze zjistit z tabulek.

Pro 17 nenulových rozdílů a α = 0,05 je dolní kritická hodnota W= 42, horní – 111. Skutečná hodnota = 139,5 není v rozsahu tabulkových hodnot. Nulová hypotéza tedy může být zamítnuta na 5% hladině významnosti.

Wilcoxonův podepsaný testporovnat dva vzorky lze použít jako neparametrické kritérium pro řešení problému, pro který se dříve používal parametrický t-test. Jsou určeny charakteristiky jedné populace X 1 a druhý y 1 . Metoda výpočtu je podobná použití kritéria na jeden vzorek.

Příklad

Každému členu 17členného analytického týmu byly zobrazeny dvě reklamy. Subjekty hodnotili kreativní úroveň každé reklamy na škále od 1 do 5. Kreativní úroveň každé reklamy hodnotili na 5% hladině významnosti.

H 0: , tedy střední hodnota v populaci rovné nule (kreativní úrovně reklamy jsou stejné);

21,5 spadá do těchto mezí, proto je přijata nulová hypotéza. Závěr: srovnávané reklamní produkty mají stejnou míru kreativity , pořadí pro data ze vzorku 2 jsou zapsány ve sloupci R2. Pozorovaná (skutečná) hodnota Wilcoxonova testu se vypočítá pomocí vzorce W = .

Příklad. Firma čelí žalobě za údajnou diskriminaci zaměstnanců na základě pohlaví. Na 5% hladině významnosti je nutné pomocí prezentovaných mzdových dat (tabulka 19) určit, zda mají obě rozdělení stejný medián.

Tabulka 19

Údaje o genderové diskriminaci zaměstnanců

Měsíční plat, tisíc rublů.
Ženy 11,2 10,5 8,3 10,2 14,4 8,5 5,0
7,5 = 43,5
Muži 9,1 18,3 14,1 21,9 10,5 13,8 14,6 8,6 13,4 10,6
7,5

Protože není důvod se domnívat, že měsíční mzdy jedné skupiny zaměstnanců jsou vyšší než jiné, nulová a alternativní hypotéza jsou formulovány jako dvoustranné.

Načítání...