ไอเดีย  น่าสนใจ.  การจัดเลี้ยงสาธารณะ  การผลิต.  การจัดการ.  เกษตรกรรม

การกระจายตัวของคนงานตามอาชีพและประเภท การฝึกอบรมบุคลากรขององค์กรอุตสาหกรรม (โดยใช้ตัวอย่างของ JSC Vologda Optical-Mechanical Plant) การเลือกโหมดการทำงานและการพักผ่อน

ค่าจ้างของพนักงานฝ่ายผลิตจะกำหนดตามอัตราค่าจ้างรายชั่วโมง ขึ้นอยู่กับสภาพการทำงาน ประเภทคุณสมบัติ และรูปแบบของค่าตอบแทน การกระจายคนงานตามประเภทและสภาพการทำงานที่แน่นอนขึ้นอยู่กับลักษณะของการผลิตเฉพาะ สำหรับองค์กรวิศวกรรมเครื่องกลจะมีการสังเกตการกระจายดังต่อไปนี้โดยประมาณ:

  • 1) ประมาณ 80% ของคนงานฝ่ายผลิตโดยเฉลี่ยทำงานในงานเย็นที่มีสภาพการทำงานปกติ และ 20% ทำงานในงานที่ร้อนและงานหนัก
  • 2) ของพนักงานฝ่ายผลิตทั้งหมด ประมาณ 65% ​​ทำงานตามอัตราชิ้น และส่วนที่เหลือ - ตามเวลา
  • 3) โดยทั่วไปคนงานแต่ละกลุ่มจะแบ่งกันเองเป็นเปอร์เซ็นต์ตามประเภทคุณสมบัติ (ตัวอย่างการกระจายแสดงไว้ในบรรทัดล่างสุดของตารางที่ 2)

เนื่องจากโครงการนี้ต้องการสิ่งแรกสุดในการกำหนดค่าจ้างพื้นฐานของคนงานหลัก จึงเป็นจำนวน (ช) ที่ควรกระจายตามสภาพการทำงานและประเภทคุณสมบัติ ในการคำนวณตัวเลขที่เกี่ยวข้อง ขอแนะนำให้ใช้แผนภาพ (ต้นไม้) ที่แสดงในรูปที่ 1 1. มีการใช้การกำหนดดังต่อไปนี้: Chn - จำนวนคนที่ทำงานภายใต้สภาวะปกติ Chn - จำนวนคนที่ทำงานในสภาวะที่ยากลำบาก Chsd - จำนวนคนที่ทำงานในระบบค่าจ้างแบบชิ้น Chpv - จำนวนคนที่ทำงานในระบบค่าจ้างตามเวลา Chsd และ Chvp - จำนวนคนงานที่มีหมวดหมู่ i-th a1 คือสัมประสิทธิ์ที่คำนึงถึงส่วนแบ่งของคนงานที่มีหมวดหมู่ i-th ในกลุ่มที่เกี่ยวข้อง

ค่าเศษส่วนของตัวบ่งชี้ Chnd, Chnvp- ฯลฯ ควรปัดเศษให้เป็นจำนวนเต็มเพื่อให้ผลรวมสุดท้ายเท่ากับมูลค่ารวม - ช. สันนิษฐานว่าจำนวนคนงานเสริมมีการกระจายตามเงื่อนไขการทำงานและประเภทในลักษณะเดียวกับจำนวนคนงานหลัก

อัตราภาษีรายชั่วโมงถู

ในงานเย็นที่มีสภาพการทำงานปกติ

(ชน์):. คนงานเป็นชิ้น (Chnsd)

Znsd3 = =5.12

คนทำงานตามเวลา (Chnpv)

แซดเอ็นพีวี3 = =4.78

แซดเอ็นพีวี4 = =5.36

Znpv5 = =6.10

ระหว่างการทำงานที่ร้อนและหนัก (Ht):

คนงานเป็นชิ้น (Ch tsd)

คนทำงานตามเวลา (Chtpv)

การกระจายตัวของคนงานตามประเภท, %

สัมประสิทธิ์ bi โดยคำนึงถึง

จำนวนคนงานในหมวดหมู่ที่เกี่ยวข้อง

ช=360111 คน Chn=0.8*360=288 คน H t=0.2*360=72, ต่อ

Chnsd=0.65*288=187 ต่อ H tsd=0.65*72=46, ต่อ

Chnsd1 =187*0.05=9 ต่อ H tsd1=46*0.05=2, ต่อ

Chnsd2 =187*0.12=22 ต่อ H tsd2=46*0.12=5, ต่อ

Chnsd3 =187*0.5=93 ต่อ H tsd3=46*0.5=23 ต่อ

Chnsd4 =187*0.2=37 ต่อ H tsd4=46*0.2=9, ต่อ

Chnsd5 =187*0.1=18 ต่อ H tsd5=46*0.1=4, ต่อ

Chnsd6 =187*0.03=5 ต่อ H tsd6=46*0.03=1, ต่อ

Chnpv=0.35*288=100 คน H tpv =0.35*72=25, ต่อ

Chnpv1 =100*0.05= 5 คน H tpv1=25*0.05=1, ต่อ

Chnpv2=100*0.12=12 คน H tpv2=25*0.12=3 ต่อ

Chnpv3=100*0.5=50 คน H tpv3=25*0.5=12 ต่อ

Chnpv4=100*0.2=20 ต่อ H tpv4=25*0.2=5 ต่อ

Chnpv5 =100*0.1=10 คน H tpv5=25*0.1=2, ต่อ

Chnpv6 =100*0.03=3 ต่อ H tpv6=25*0.03=1, ต่อ

กองทุนเวลาทำงานของคนงานหนึ่งคนถูกกำหนดโดยสูตร:

วันตามปฏิทินอยู่ที่ไหน 365 วัน;

วันหยุดประจำปี 54 วัน;

วันหยุดประจำปี 13 วัน;

วันหยุดพักร้อน 24 วัน;

วันลาหยุดงานเนื่องจากเจ็บป่วย 2 วัน

วันที่หยุดงานเนื่องจากหน้าที่ราชการ 1 วัน

ระยะเวลาของวันทำงาน 8 ชั่วโมง

วันทำงานลดเวลาก่อนวันหยุดสุดสัปดาห์และวันหยุดคือ 1 ชั่วโมง

จำนวนพนักงานซ่อม

จำนวนพนักงานซ่อมถูกกำหนดโดยสูตร:

โดยที่คือค่าสัมประสิทธิ์การปฏิบัติตามมาตรฐานการผลิตสำหรับพนักงานซ่อมซึ่งอยู่ในช่วง 1.06-1.1

การกระจายตัวของคนงานตามอาชีพและประเภท

การกระจายจำนวนพนักงานซ่อมตามประเภทและอาชีพโดยคำนึงถึงปริมาณการผลิตตามประเภทงานตามตารางที่ 4

ตารางที่ 4 - การกระจายตัวของคนงานตามประเภทและประเภทของงาน

การคำนวณหมวดหมู่ค่าจ้างเฉลี่ยของคนงาน

หมวดหมู่ค่าจ้างเฉลี่ยของคนงานคำนวณโดยใช้สูตร:

อันดับ (32)

โดยที่ 4,5,6 เป็นประเภทงาน

จำนวนพนักงานซ่อมในประเภทที่เกี่ยวข้อง คน

ผลลัพธ์ที่ได้ส่วนใหญ่มักเป็นค่าเศษส่วนและไม่สามารถปัดเศษเป็นจำนวนเต็มได้ ขอแนะนำให้เขียนหมวดหมู่ภาษีเฉลี่ยเป็นเศษส่วนทศนิยม โดยตัวเลขทั้งหมดแสดงด้วยเลขโรมันและตัวเลขเศษส่วนด้วยเลขอารบิค เช่น III, 5

การเลือกโหมดการทำงานและการพักผ่อน

เวลาทำงานและเวลาพักของพนักงานองค์กรได้รับการควบคุมโดยกฎหมายแรงงาน ระบบการพักงานจะเหมาะสมที่สุดหากช่วยให้คุณเพิ่มระยะเวลาการทำงานที่มั่นคงได้ ซึ่งส่วนใหญ่ทำได้โดยการเลือกเวลาที่เหมาะสมสำหรับช่วงพักกลางวัน รวมถึงเวลาพักเพิ่มเติมด้วย

เวลาที่ดีที่สุดสำหรับการพักกลางวันคือช่วงกลางกะ ควรกำหนดความถี่และระยะเวลาของการหยุดพักระยะสั้นที่มีการควบคุมโดยขึ้นอยู่กับปริมาณงานและจังหวะการทำงานของไซต์การผลิต สำหรับงานที่เบาและมีจังหวะการทำงาน แนะนำให้พัก 5 นาที 2-4 ครั้ง สำหรับงานที่หนักและมีจังหวะการทำงานสูง แนะนำให้พัก 10 นาที 4-5 นาที สำหรับความตึงเครียดทางประสาทสูง แนะนำให้พัก 15 นาที 4 ครั้ง สำหรับ 7- กะการทำงาน 8 ชั่วโมง


ในการสร้างชุดการกระจายคนงานตามระดับทักษะ เราจะแยกกลุ่มคนงานออกเป็นสามกลุ่ม: มีคุณสมบัติต่ำ (ประเภทภาษีที่ 2) คุณสมบัติปานกลาง (พร้อมหมวดหมู่ภาษีที่ 3 และ 4) และคุณสมบัติสูง (หมวดหมู่ภาษีที่ 5 และ 6) ) จากนั้นจึงสร้างตาราง

การกระจายตัวของคนงานตามระดับฝีมือ

ชุดการกระจายคนงานตามหมวดหมู่ภาษีเป็นชุดแบบไม่ต่อเนื่องแบบแปรผัน เนื่องจากคุณลักษณะที่เป็นรากฐานของการก่อสร้างนั้นเป็นเชิงปริมาณ เช่น แสดงเป็นตัวเลข ชุดการกระจายตัวของคนงานตามระดับทักษะนั้นมีสาเหตุมาจากคุณลักษณะที่เป็นรากฐานของการก่อสร้างนั้นมีคุณภาพเช่น ไม่มีการวัดเชิงปริมาณและสามารถแสดงออกมาเป็นคำพูดเท่านั้น

ปัญหาทั่วไป2

ข้อมูลต่อไปนี้เป็นที่ทราบเกี่ยวกับเงินเดือนของพนักงานของหนึ่งในองค์กรรูเบิล ในปี 2548:

สร้างชุดการกระจายของพนักงานในองค์กรตามระดับเงินเดือน โดยเน้นกลุ่มคนงานสี่กลุ่มในช่วงเวลาที่เท่ากัน

ระบุตามเกณฑ์การจัดกลุ่มชุดการแจกแจงจะถูกสร้างขึ้น: การระบุแหล่งที่มาหรือเชิงปริมาณ

เมื่อพิจารณาคุณลักษณะที่กำลังศึกษา เราจะนำเงินเดือนของคนงานมาสร้างชุดการแจกแจงตามคุณลักษณะนั้นโดยมีช่วงปิดที่เท่ากัน ขนาดของช่วงเวลาในกรณีนี้ถูกกำหนดโดยสูตร:

ที่ไหน
และ
– ตามลำดับมูลค่าสูงสุดและต่ำสุดของเงินเดือนของพนักงาน

n– จำนวนกลุ่ม

ตัวเศษจะเรียกว่าช่วงการเปลี่ยนแปลง

เราก่อตั้งกลุ่มคนงานสี่กลุ่ม จากนั้นค่าช่วงเวลาจะเท่ากับ:

ตอนนี้เราสร้างกลุ่มคนงานที่มีเงินเดือนต่างกันตามจำนวนนี้ กลุ่มแรกจะมีเงินเดือนตั้งแต่ 1,300 ถึง 1,525 รูเบิล กลุ่มที่สองจาก 1,525 ถึง 1,750 รูเบิล เป็นต้น

ผลลัพธ์ที่ได้คือตาราง:

การกระจายตัวของพนักงานตามเงินเดือนถู

ชุดการแจกจ่ายนี้สร้างขึ้นบนพื้นฐานเชิงปริมาณ โดยนำเสนอในรูปแบบช่วงเวลา ดังนั้นจึงเป็นชุดการแปรผันตามช่วงเวลา

ดังที่เห็นได้จากตาราง อนุกรมการแจกแจงประกอบด้วยสององค์ประกอบ: ก) ค่าของคุณลักษณะ b) จำนวนหน่วยสัมบูรณ์ของคุณลักษณะ (ความถี่)

เพื่อความชัดเจนยิ่งขึ้น สามารถเสริมค่าสัมบูรณ์ด้วยตัวบ่งชี้สัมพัทธ์ (ความถี่) ที่แสดงเป็นเปอร์เซ็นต์ ดังนั้นการสรุปข้อมูลในรูปแบบของการจัดกลุ่มทำให้สามารถศึกษาองค์ประกอบของประชากรตามลักษณะที่กำลังศึกษา ประเมินระดับของความแปรผัน และเปรียบเทียบกลุ่มระหว่างกัน

บันทึก. ชุดการแจกจ่ายที่สร้างขึ้นคือตารางกลุ่ม เนื่องจากการก่อสร้างจะขึ้นอยู่กับลักษณะการจัดกลุ่มเดียว

ระดับกิริยาช่วย (ตัวเลือก) – 5 เพราะ มีความถี่สูงสุด ( ฉ=55).

ค่ามัธยฐาน () คือค่าของคุณลักษณะที่แตกต่างกันซึ่งแบ่งประชากรออกเป็นครึ่งหนึ่ง กล่าวคือ อยู่ตรงกลางของซีรีย์จัดอันดับ

ตำแหน่งมัธยฐานในชุด:

ก) ด้วยจำนวนหน่วยคี่:

;

b) ด้วยจำนวนหน่วยคู่:

ในตัวอย่างของเรา ค่ามัธยฐานคืออันดับที่ 4

สูตรคำนวณค่าเฉลี่ยโครงสร้างตามข้อมูลที่จัดกลุ่ม (พร้อมช่วงเวลา):

, (6.21)

โดยที่ขีด จำกัด ล่างของช่วงโมดอล (ช่วงที่มีความถี่สูงสุด) ฉัน– ขนาดช่วง; – ความถี่ของช่วงโมดอล พรีโมดัล และหลังโมดัล ตามลำดับ

, (6.22)

โดยที่ขีด จำกัด ล่างของช่วงค่ามัธยฐานซึ่งครึ่งหนึ่งของหน่วยปริมาตรประชากรตั้งอยู่ ฉัน– ขนาดช่วง; – ผลรวมของความถี่ทั้งหมด – ผลรวมของความถี่ที่อยู่ก่อนช่วงค่ามัธยฐาน – ความถี่ของช่วงมัธยฐาน

ตัวอย่างที่ 8ตารางแสดงข้อมูลประสบการณ์การทำงานของพนักงาน 30 คนในโรงงาน

สารละลาย:

ช่วงเวลากิริยาที่มีประสบการณ์การทำงานตั้งแต่ 6 ถึง 12 ปีมีความถี่ 12 จากนั้นโหมดจะเท่ากับ:

ปี.

แฟชั่นโชว์ที่พนักงานร้านค้าส่วนใหญ่มีประสบการณ์ 8.5 ปี

ช่วงค่ามัธยฐาน (ซึ่งประกอบด้วยครึ่งหนึ่งของความถี่ของประชากร เช่น 15 คน) จะต้องมีประสบการณ์ 6 ถึง 12 ปีด้วย

ค่ามัธยฐานคือ:

ปี.

ค่ามัธยฐานแสดงให้เห็นว่าคนงานครึ่งหนึ่งมีประสบการณ์ไม่เกิน 10 ปี และครึ่งหนึ่งมีประสบการณ์มากกว่า 10 ปี

ค่าเฉลี่ยโครงสร้างสามารถกำหนดได้ไม่เพียงแต่โดยสูตรเท่านั้น แต่ยังกำหนดในรูปแบบกราฟิกด้วย: โหมดตามฮิสโตแกรม ค่ามัธยฐานโดยการสะสม

ในการกำหนดโหมดในฮิสโตแกรมแบบกราฟิกจะใช้แท่งสามแท่ง: แท่งสูงสุดและสองแท่งที่อยู่ติดกัน - ทางด้านซ้ายและด้านขวา ภายในคอลัมน์ที่มีความสูงมากที่สุดจะมีการลากเส้นสองเส้น: เส้นแรกเชื่อมต่อมุมขวาบนกับมุมขวาบนของคอลัมน์ก่อนหน้าและเส้นด้านซ้ายเชื่อมต่อกับมุมซ้ายบนของเส้นถัดไป จุดตัดของเส้นเหล่านี้คือโหมดของการแจกแจงซึ่งนำเสนอในรูปแบบของฮิสโตแกรม (รูปที่ 6.1)

รูปที่ 6.1 การแสดงโหมดแบบกราฟิกในฮิสโตแกรมการแจกแจง

เพื่อกำหนดค่ามัธยฐานแบบกราฟิก จะมีการสร้างสะสมและลำดับสุดท้ายของสะสมจะถูกแบ่งครึ่ง เส้นตรงถูกลากผ่านจุดผลลัพธ์ขนานกับแกน abscissa จนกระทั่งตัดกับจุดสะสม จุดตัดของจุดตัดคือค่ามัธยฐานของการแจกแจงแบบกราฟิก (รูปที่ 6.2)

รูปที่ 6.2 การแสดงค่ามัธยฐานสะสมของการแจกแจงแบบกราฟิก

มีความจำเป็นต้องกำหนดด้วยความน่าจะเป็นที่ 0.997 ขีด จำกัด ภายในประเภทคนงานโดยเฉลี่ยในร้านขายเครื่องจักร

ให้เราพิจารณาค่าเฉลี่ยตัวอย่างสำหรับทีมและค่าเฉลี่ยโดยรวม:

ให้เราพิจารณาความแปรปรวนระหว่างอนุกรม:

มาคำนวณข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย:

ลองคำนวณข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดด้วยความน่าจะเป็น 0.997:

ด้วยความน่าจะเป็นที่ 0.997 สามารถระบุได้ว่าหมวดหมู่คนงานโดยเฉลี่ยในร้านขายเครื่องจักรอยู่ภายใน .◄

ที่ การเลือกอนุกรมซ้ำข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยสำหรับการแชร์ถูกกำหนดโดยสูตร:

การกระจายตัวของส่วนแบ่งระหว่างการดำเนินการอยู่ที่ไหน

ตัวอย่าง.

ชิ้นส่วน 200 กล่องบรรจุใน 40 ชิ้น ในทุกคน เพื่อตรวจสอบคุณภาพของชิ้นส่วน ได้มีการตรวจสอบชิ้นส่วนอย่างต่อเนื่องในกล่อง 20 กล่อง (การสุ่มตัวอย่างแบบไม่ซ้ำกัน) จากการควบคุมพบว่าสัดส่วนชิ้นส่วนที่ชำรุดอยู่ที่ 15% ความแปรปรวนระหว่างชุดงานคือ 49 ด้วยความน่าจะเป็นที่ 0.997 เราจะกำหนดขีดจำกัดภายในสัดส่วนของผลิตภัณฑ์ที่มีข้อบกพร่องในชุดกล่อง

เรามาพิจารณาข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยสำหรับการแชร์:

ข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดสำหรับสัดส่วนที่มีความน่าจะเป็น 0.997 คือ:

ด้วยความน่าจะเป็นที่ 0.997 สามารถระบุได้ว่าสัดส่วนชิ้นส่วนที่ชำรุดในชุดงานจะอยู่ในช่วงตั้งแต่ 10.59% ถึง 19.41%

ตัวอย่าง

เพื่อกำหนดความเร็วของการชำระหนี้กับเจ้าหนี้ ได้มีการเลือกเอกสารการชำระเงิน 50 ฉบับโดยการสุ่มตัวอย่างทางกล ซึ่งเวลาเฉลี่ยในการโอนเงินคือ 28.2 วัน โดยมีค่าเบี่ยงเบนมาตรฐาน 5.4 วัน จำเป็นต้องกำหนดระยะเวลาเฉลี่ยของการชำระเงินทั้งหมดในระหว่างปีที่กำหนดโดยมีความน่าจะเป็น 0.95

สารละลาย.ข้อผิดพลาดในการสุ่มตัวอย่างเล็กน้อย

จากนั้นด้วยความน่าจะเป็น 0.95 สามารถระบุได้ว่าระยะเวลาเฉลี่ยของการชำระหนี้สำหรับองค์กรของทรัสต์นี้คือไม่น้อยกว่า 26.7 วัน (28.2 - 1.49) และไม่เกิน 29.7 วัน (28.2 + 1.49) ◄

ตัวอย่าง

ประชากรทั่วไป N ประกอบด้วย 100,000 หน่วย แบ่งออกเป็น 200 ชุดซึ่งมีปริมาตรเท่ากัน มีการสุ่มตัวอย่างแบบไม่ทำซ้ำ (m) 50% ของซีรีส์และ 20% ของหน่วยจากแต่ละซีรีส์ ค่าเฉลี่ยของความแปรปรวนแบบอนุกรมกลายเป็น 12 และความแปรปรวนระหว่างอนุกรมคือ 5 มีความจำเป็นต้องกำหนดข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย

เรากำหนดจำนวนหน่วยทั้งหมดที่เลือกตามลำดับ: จำนวนหน่วยที่ประกอบขึ้นเป็นหนึ่งตัวอย่าง: เมื่อใช้สูตรสำหรับค่าความคลาดเคลื่อนโดยเฉลี่ยสำหรับการสุ่มตัวอย่างแบบไม่ซ้ำ เราจะพบว่า:

คุณสามารถสร้างตัวอย่างขนาดเท่ากันได้ 100,000 หน่วย โดยเลือก 20% ของซีรีส์ และ 50% ของยูนิตจากแต่ละซีรีส์ ด้วยค่าเดียวกันของค่าเฉลี่ยของความแปรปรวนแบบอนุกรมและความแปรปรวนระหว่างการทำงาน ข้อผิดพลาดโดยเฉลี่ยของตัวอย่างนี้จะเพิ่มเป็นสองเท่า

การแจกแจงค่าเฉลี่ยตัวอย่างมักจะมีกฎการแจกแจงแบบปกติ (หรือเข้าใกล้) เสมอ โดยไม่คำนึงถึงลักษณะของการกระจายตัวของประชากรทั่วไป อย่างไรก็ตาม ในกรณีของตัวอย่างขนาดเล็ก จะมีการบังคับใช้กฎหมายการจำหน่ายที่แตกต่างออกไป - การกระจายตัวของนักเรียน. ในกรณีนี้ ค่าสัมประสิทธิ์ความเชื่อมั่นจะพบได้จากตารางการแจกแจงแบบ t ของนักเรียน ขึ้นอยู่กับระดับความเชื่อมั่นและขนาดตัวอย่าง สำหรับค่าแต่ละค่า ความน่าจะเป็นของความเชื่อมั่นของกลุ่มตัวอย่างขนาดเล็กจะถูกกำหนดโดยใช้ตารางนักเรียนพิเศษ (ตารางที่ 9) ซึ่งให้การกระจายตัวของส่วนเบี่ยงเบนมาตรฐาน:

ตารางที่ 9.

n ที
0,5 1,0 1,5 2,0 3,0
0,347 0,609 0,769 0,861 0,942
0,362 0,637 0,806 0,898 0,970
0,368 0,649 0,823 0,914 0,980
0,371 0,657 0,832 0,923 0,985
0,376 0,666 0,846 0,936 0,992
0,377 0,670 0,850 0,940 0,993

เนื่องจากเมื่อดำเนินการตัวอย่างขนาดเล็ก ค่า 0.95 หรือ 0.99 เป็นที่ยอมรับในทางปฏิบัติว่าเป็นความน่าจะเป็นความเชื่อมั่น การอ่านค่าการแจกแจงของนักเรียนต่อไปนี้จึงถูกนำมาใช้เพื่อกำหนดข้อผิดพลาดสูงสุดของตัวอย่างขนาดเล็ก (ตารางที่ 10)

ตารางที่ 10.

n
0,95 0,99
3,183 5,841
2,777 4,604
2,571 4,032
2,447 3,707
2,364 3,500
2,307 3,356
2,263 3,250
2,119 2,921
2,078 2,832

ตัวอย่าง.

ในระหว่างการตรวจสอบควบคุมคุณภาพของไส้กรอกที่จำหน่าย ข้อมูลเกี่ยวกับปริมาณเกลือแกงในตัวอย่างได้รับ จากข้อมูลการสำรวจตัวอย่าง มีความจำเป็นต้องกำหนดขีด จำกัด ภายในเปอร์เซ็นต์เฉลี่ยของปริมาณเกลือแกงในชุดสินค้าที่กำหนดโดยมีความน่าจะเป็น 0.95

เราจัดทำตารางการคำนวณและพิจารณาตัวอย่างเฉลี่ยของกลุ่มตัวอย่างขนาดเล็ก (ตารางที่ 11) ตามผลลัพธ์

ตารางที่ 11.

ตัวอย่าง
4,3 0,2 0,04
4,2 0,1 0,01
3,8 0,3 0,09
4,3 0,2 0,04
3,7 - 0,4 0,16
3,9 - 0,2 0,04
4,5 0,4 0,16
4,4 0,3 0,09
4,0 - 0,1 0,01
3,9 - 0,2 0,04
41,0 - 0,68

เราพิจารณาความแปรปรวนของกลุ่มตัวอย่างขนาดเล็ก:

เราพิจารณาข้อผิดพลาดโดยเฉลี่ยของกลุ่มตัวอย่างขนาดเล็ก:

จากขนาดกลุ่มตัวอย่าง (n=10) และความน่าจะเป็นที่ระบุ =0.95 ค่าของสัมประสิทธิ์ความเชื่อมั่น t=2.263 จะถูกกำหนดโดยใช้การแจกแจงของนักเรียน (ดูตารางที่ 10)

ข้อผิดพลาดเล็กน้อยของกลุ่มตัวอย่างขนาดเล็กจะเป็น:

ดังนั้นด้วยความน่าจะเป็นที่ 0.95 จึงสามารถระบุได้ว่าในไส้กรอกทั้งชุดปริมาณเกลือแกงอยู่ในขอบเขต:

เหล่านั้น. จาก 4.1% - 0.2%=3.9% ถึง 4.1%+0.2%=4.3%.◄

ตัวอย่าง

จำเป็นต้องสร้างช่วงความเชื่อมั่น 99% สำหรับการประมาณเส้นผ่านศูนย์กลางเฉลี่ยทั่วไปของผลิตภัณฑ์โดยอิงจากตัวอย่างชิ้นส่วน 10 ชิ้นที่ประมวลผลด้วยเครื่องกลึงอัตโนมัติ หากการเบี่ยงเบนของขนาดของชิ้นส่วนเหล่านี้จากจุดกึ่งกลางของสนามความคลาดเคลื่อนปรากฏออกมา ให้เป็นดังนี้ (ตารางที่ 12)

ตารางที่ 12.

ตัวอย่างไมโครเฉลี่ย ความแปรปรวนตัวอย่างคือ 5.2:

ค่าคลาดเคลื่อนกำลังสองเฉลี่ยของตัวอย่างคือ 0.76 ไมครอน: ม.ค.

ด้วย P = 0.99 และจำนวนองศาอิสระ k = 9 เราพบจากตารางว่าค่า t คือ 3.25 จากนั้นด้วยความน่าจะเป็น 0.99 เราสามารถสรุปได้ว่าข้อผิดพลาดของค่าเฉลี่ยตัวอย่างจะไม่เกิน 2.47 μm (3.25 x 0.76) และค่าที่ยอมรับได้ของพารามิเตอร์ประชากรจะอยู่ในช่วงตั้งแต่ – 0.47 ถึง + 4.47 กก. (2.0 ± 2.47).◄

4. การกำหนดขนาดตัวอย่างที่ต้องการก่อนที่จะดำเนินการสังเกตตัวอย่างโดยตรง คำถามที่ว่าจะต้องเลือกจำนวนประชากรที่อยู่ระหว่างการศึกษาจำนวนเท่าใดสำหรับการสำรวจจะได้รับการแก้ไขเสมอ ขนาดตัวอย่างอาจกำหนดได้ตามบทบัญญัติ:

· ประเภทของตัวอย่างที่ต้องการ

· วิธีการเลือก (ซ้ำหรือไม่ซ้ำกัน);

· การเลือกพารามิเตอร์ที่จะประเมิน (ค่าเฉลี่ยของคุณลักษณะหรือสัดส่วน)

นอกจากนี้ มีความจำเป็นต้องกำหนดค่าล่วงหน้าของความน่าจะเป็นของความเชื่อมั่นที่เหมาะสมกับผู้บริโภคข้อมูล และขนาดของข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดที่อนุญาต

ปัญหาเหล่านี้ได้รับการแก้ไขบนพื้นฐานของทฤษฎีบทของ P. Chebyshev และ A. Lyapunov ค่าของข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดสำหรับตัวอย่างเชิงกลแบบสุ่มล้วนๆ ถูกกำหนดดังนี้:

สำหรับการสุ่มตัวอย่างแบบสุ่มและการสุ่มตัวอย่างเชิงกลด้วยวิธีการเลือกแบบไม่ซ้ำ ขนาดตัวอย่างที่ต้องการสำหรับคุณลักษณะเชิงปริมาณโดยเฉลี่ยจะคำนวณโดยใช้สูตร

เมื่อพิจารณาจากวัสดุตัวอย่าง ส่วนแบ่งของลักษณะและไม่ใช่ค่าเฉลี่ย ขนาดของประชากรตัวอย่างจะถูกกำหนดโดยสูตรต่อไปนี้

สำหรับการเลือกใหม่:

สำหรับการเลือกแบบไม่ซ้ำกัน:

มักไม่ทราบปริมาณที่แสดงถึงการกระจายตัวของประชากร ในสถิติทางคณิตศาสตร์ ได้รับการพิสูจน์แล้วว่าความสัมพันธ์ระหว่างความแปรปรวนทั่วไปและความแปรปรวนตัวอย่างถูกกำหนดโดยความเท่าเทียมกัน

เนื่องจากค่าที่มากเพียงพอค่าจะใกล้เคียงกับความสามัคคี เราจึงสามารถสรุปได้ว่า . ดังนั้นในทางปฏิบัติ ความแปรปรวนตัวอย่างจึงถูกใช้เป็นค่าประมาณของความแปรปรวนทั่วไป โปรดทราบว่าในช่วงเริ่มต้นของการสังเกตตัวอย่าง ไม่ทราบตัวบ่งชี้ความแปรผัน ดังนั้น การกำหนดขนาดตัวอย่างที่ต้องการจึงมักเป็นปัญหาร้ายแรงที่เกี่ยวข้องกับการพิจารณาตัวบ่งชี้ความแปรผันของคุณลักษณะที่กำลังศึกษา ประมาณดัชนีความผันแปรถูกกำหนดด้วยวิธีใดวิธีหนึ่งต่อไปนี้:

· นำมาจากการศึกษาครั้งก่อน;

· หากโครงสร้างและเงื่อนไขการพัฒนามีเสถียรภาพเพียงพอ หรือทราบค่าประมาณของค่าเฉลี่ย จะพบการกระจายตัวจากความสัมพันธ์

· ถ้า และ ทราบ ค่าเบี่ยงเบนมาตรฐานก็สามารถกำหนดได้ตามกฎ "สามซิกมา": เนื่องจากในการแจกแจงแบบปกติ ช่วงของการแปรผันจะพอดีภายใน หากการกระจายตัวไม่สมมาตรอย่างเห็นได้ชัด ดังนั้น ;

เมื่อศึกษาคุณลักษณะทางเลือกในกรณีที่ไม่ทราบความถี่โดยประมาณ คุณสามารถใช้ค่าสูงสุดของการกระจายตัวของส่วนแบ่งเท่ากับ 0.25 กล่าวคือ . ในกรณีนี้เรามีสำหรับการเลือกซ้ำ สำหรับการเลือกที่ไม่ซ้ำ

· ดำเนินการตัวอย่าง "ทดสอบ" ซึ่งใช้คำนวณดัชนีความแปรปรวน ซึ่งใช้เป็นค่าประมาณของประชากรทั่วไป

เนื่องจากมีการประเมินความแปรปรวนทั่วไปโดยประมาณ ขนาดตัวอย่างจึงถูกปัดเศษขึ้นทั้งสำหรับการสุ่มตัวอย่างซ้ำและไม่ซ้ำ เนื่องจากจะต้องมี "สำรอง" บางส่วนในจำนวนหน่วยที่สำรวจเสมอเพื่อให้แน่ใจว่าผลลัพธ์มีความแม่นยำตามที่กำหนด

บ่อยครั้งในทางปฏิบัติ ค่าของข้อผิดพลาดสูงสุดที่ระบุไม่ใช่ค่าของข้อผิดพลาดสัมพัทธ์ แต่เป็นค่าของข้อผิดพลาดสัมพัทธ์ ซึ่งแสดงเป็นเปอร์เซ็นต์ของค่าเฉลี่ย:

ที่ไหน .

เมื่อแทนค่าที่แสดงผ่านข้อผิดพลาดสัมพัทธ์ลงในสูตรในการพิจารณา เราจะได้นิพจน์ต่อไปนี้เพื่อกำหนดขนาดตัวอย่างที่ต้องการ:

ดังที่ทราบกันดีว่าอัตราส่วนคือค่าสัมประสิทธิ์ของการแปรผัน , ที่ไหน

เมื่อใช้การสุ่มตัวอย่างแบบไม่ทำซ้ำ ขนาดตัวอย่างจะคำนวณโดยใช้สูตร

หากระบุข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดและขนาดตัวอย่าง คุณสามารถกำหนดค่าของสัมประสิทธิ์ได้ โดยรู้ว่าค่าใดที่คุณสามารถกำหนดความน่าจะเป็นได้จากตาราง

ตัวอย่าง

ต้องมีการสำรวจตัวแทนการท่องเที่ยวกี่รายในองค์กรการท่องเที่ยวในภูมิภาคเพื่อให้ได้ลักษณะของค่าตอบแทนเฉลี่ยสำหรับคนงานประเภทนี้ในภูมิภาค เป็นที่ทราบกันดีว่าความแตกต่างระหว่างค่าตอบแทนสูงสุดและต่ำสุดสำหรับตัวแทนการท่องเที่ยวในภูมิภาคคือ 300,000 รูเบิล

สำหรับการแจกแจงแบบปกติในช่วงเวลา ± 3s รวม 99.7% ของค่าแอตทริบิวต์ตัวแปรทั้งหมดซึ่งหมายความว่า 300,000 รูเบิลที่เกี่ยวข้องกับปัญหาที่กำลังพิจารณา ประมาณเท่ากับค่าเบี่ยงเบนมาตรฐานหกค่า (300 » 6 วินาที) ดังนั้นค่าประมาณโดยประมาณของค่าเบี่ยงเบนมาตรฐานของค่าจ้างในประชากรทั่วไปของตัวแทนการท่องเที่ยวในภูมิภาคจะอยู่ที่ 50,000 รูเบิล () สำหรับการคำนวณเพิ่มเติมก็เพียงพอแล้วที่ความน่าจะเป็น 0.954 ข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดจะต้องไม่เกิน 10,000 รูเบิล จากนั้นเมื่อรู้ว่า s = 50,000 รูเบิล, a เสื้อ = 2 และการใช้สูตร (5.6) เพื่อกำหนดขนาดตัวอย่างที่ต้องการ เราได้รับ: ประชากร

ดังนั้นภายใต้เงื่อนไขที่กำหนด จึงจำเป็นต้องสำรวจเงินเดือนของตัวแทนการท่องเที่ยว 100 รายในภูมิภาค◄

ตัวอย่าง

กลุ่มตัวอย่างควรมีขนาดเท่าใดจากประชากรที่รวมนักลงทุนรุ่นเยาว์จำนวน 8,000 คน โดยความน่าจะเป็น 0.954 ข้อผิดพลาดส่วนเพิ่มสัมพัทธ์จะไม่เกิน 1% หากทราบว่าค่าสัมประสิทธิ์การเปลี่ยนแปลงของคุณลักษณะสำหรับประชากรทั้งหมดคือ 0.125 นั่นคือ 12.5%?

โดย V=12.5%, =1%, t=2 เรามีคน◄

ตัวอย่าง

จากการสำรวจตัวอย่างกลุ่มประชากรบางกลุ่ม (N = 5,000) จำเป็นต้องกำหนดสัดส่วนของครอบครัวที่ปัจจุบันไม่มีรถยนต์นำเข้า ค่าความผิดพลาดในการสุ่มตัวอย่างสูงสุดไม่ควรเกิน 0.01 โดยมีความน่าจะเป็น 0.954 สันนิษฐานได้ว่าสัดส่วนประชากรน้อยกว่า 0.2 ขนาดตัวอย่างควรเป็นเท่าใด?

ครัวเรือน

สัดส่วนครัวเรือนที่ไม่มีรถยนต์นำเข้าคือ หากในตัวอย่างนี้ เราไม่คำนึงถึงปริมาณประชากร การคำนวณจะนำไปสู่ผลลัพธ์ที่ไม่มีความหมาย:

ตัวอย่าง

ในตัวอย่าง 1,000 หน่วย สัดส่วนของผลิตภัณฑ์ที่มีข้อบกพร่องคือ 2% ความน่าจะเป็นที่ผลิตภัณฑ์ทั้งชุด (10,000 ชิ้น) สัดส่วนของผลิตภัณฑ์ที่มีข้อบกพร่องจะอยู่ในช่วง 1.5 ถึง 2.5% เป็นเท่าใด

ความน่าจะเป็นของความเชื่อมั่นที่ต้องพิจารณาคือฟังก์ชัน ทีอย่างหลังพบได้จากสูตรสำหรับข้อผิดพลาดในการสุ่มตัวอย่างสูงสุด , ที่ไหน . ค่าความผิดพลาดในการสุ่มตัวอย่างสูงสุดสามารถกำหนดได้เป็นผลต่างระหว่างส่วนแบ่งทั่วไปสูงสุดที่อนุญาต (ตามเงื่อนไขเท่ากับ 2.5%) และสัดส่วนของผลิตภัณฑ์ที่มีข้อบกพร่องในกลุ่มตัวอย่าง (ตามเงื่อนไข 2%) .

ดังนั้น = 0.5% (2.5% – 2.0%) เนื่องจากตัวอย่างเป็นแบบสุ่มและไม่ซ้ำกัน สูตรจึงพบค่าของข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย

เราพบค่าของสัมประสิทธิ์ความเชื่อมั่น: .

ตามตารางของฟังก์ชันอินทิกรัลลาปลาซ ความน่าจะเป็นที่สอดคล้องกับค่าสัมประสิทธิ์ที่กำหนด เสื้อเท่ากับ 0.76595 ◄

5. วิธีการเผยแพร่ข้อมูลตัวอย่างแก่ประชาชนทั่วไปวิธีการสุ่มตัวอย่างมักใช้เพื่อให้ได้คุณลักษณะของประชากรตามตัวบ่งชี้ตัวอย่างที่เกี่ยวข้อง ทั้งนี้ขึ้นอยู่กับวัตถุประสงค์ของการวิจัยทั้งสอง วิธีการขยายการสังเกตตัวอย่างไปยังประชาชนทั่วไป: การคำนวณใหม่โดยตรงของตัวบ่งชี้ตัวอย่างสำหรับประชากรทั่วไปหรือโดยการคำนวณปัจจัยแก้ไข

วิธีการแปลงโดยตรงคือตัวบ่งชี้ส่วนแบ่งตัวอย่างหรือค่าเฉลี่ยจะขยายไปยังประชากรทั่วไปโดยคำนึงถึงข้อผิดพลาดในการสุ่มตัวอย่าง ในกรณีนี้ ค่าเฉลี่ยทั่วไปถูกกำหนดเป็น และส่วนแบ่งทั่วไปคือ

ดังนั้นในทางการค้า จะมีการกำหนดจำนวนผลิตภัณฑ์ที่ไม่ได้มาตรฐานที่ได้รับในสินค้าฝากขาย ในการทำเช่นนี้ (โดยคำนึงถึงระดับความน่าจะเป็นที่ยอมรับได้) ตัวบ่งชี้ส่วนแบ่งของผลิตภัณฑ์ที่ไม่ได้มาตรฐานในกลุ่มตัวอย่างจะถูกคูณด้วยจำนวนผลิตภัณฑ์ในชุดสินค้าทั้งหมด

ตัวอย่าง.

ในระหว่างการสุ่มตรวจก้อนขนมปังที่หั่นจำนวน 2,000 ชิ้น ส่วนแบ่งของผลิตภัณฑ์ที่ไม่ได้มาตรฐานในกลุ่มตัวอย่างคือ: 0.1 (10: 100) โดยมีข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดที่กำหนดด้วยความน่าจะเป็น = 0.954

จากข้อมูลเหล่านี้ ส่วนแบ่งของผลิตภัณฑ์ที่ไม่ได้มาตรฐานในชุดทั้งหมดจะเป็น: หรือตั้งแต่ 0.04 ถึง 0.16

โดยใช้วิธีการคำนวณใหม่โดยตรง สามารถกำหนดขีดจำกัดของจำนวนที่แน่นอนของผลิตภัณฑ์ที่ไม่ได้มาตรฐานในชุดทั้งหมด: จำนวนขั้นต่ำ - 2,000: 0.04 = 80 ชิ้น; จำนวนสูงสุด - 2,000: 0.16 = 320 ชิ้น

วิธีการแก้ไขปัจจัยใช้ในกรณีที่วัตถุประสงค์ของวิธีการสุ่มตัวอย่างคือการชี้แจงผลการสังเกตอย่างต่อเนื่อง

ในทางปฏิบัติทางสถิติ วิธีการนี้ใช้เพื่อชี้แจงข้อมูลจากการสำรวจสำมะโนประชากรประจำปีของการปศุสัตว์ที่ประชากรเป็นเจ้าของ ในการดำเนินการนี้ หลังจากสรุปข้อมูลจากการสำรวจสำมะโนประชากรทั้งหมดแล้ว จะใช้การสำรวจตัวอย่าง 10% เพื่อกำหนดสิ่งที่เรียกว่า "เปอร์เซ็นต์ของการนับน้อยไป"

ตัวอย่างเช่น หากตามตัวอย่าง 10% มีหัวปศุสัตว์ 52 ตัวลงทะเบียนในฟาร์มของประชากรหมู่บ้าน และตามข้อมูลการสำรวจสำมะโนประชากรทั้งหมด มีหัว 50 ตัวในอาร์เรย์นี้ ดังนั้นปัจจัยการนับต่ำกว่าคือ 4 % [(2*50):100]. เมื่อคำนึงถึงค่าสัมประสิทธิ์ที่ได้รับ จึงมีการแก้ไขจำนวนปศุสัตว์ทั้งหมดที่ประชากรในหมู่บ้านหนึ่งเป็นเจ้าของ

6. การทดสอบสมมติฐานทางสถิติ สมมติฐาน- นี่เป็นข้อสันนิษฐานทางวิทยาศาสตร์เกี่ยวกับลักษณะของปรากฏการณ์ที่กำหนดสิ่งเหล่านั้นซึ่งต้องมีการตรวจสอบและพิสูจน์

สมมติฐานทางสถิติ- นี่เป็นข้อสันนิษฐานบางประการเกี่ยวกับพารามิเตอร์หรือรูปร่างของการกระจายตัวของประชากร ซึ่งสามารถตรวจสอบได้จากผลการสังเกตตัวอย่าง สาระสำคัญของการทดสอบสมมติฐานคือการตรวจสอบว่าผลลัพธ์ของกลุ่มตัวอย่างสอดคล้องกับสมมติฐานหรือไม่ หรือความแตกต่างระหว่างสมมติฐานและข้อมูลตัวอย่างเป็นแบบสุ่มหรือไม่สุ่ม

ก็สามารถตั้งสมมติฐานได้ว่า ปกติ, ทวินาม, การแจกแจงแบบปัวซงฯลฯ . เหตุผลในการอ้างอิงถึงการแจกแจงแบบปกติบ่อยครั้งก็คือการแจกแจงประเภทนี้เป็นการแสดงออกถึงรูปแบบที่เกิดขึ้นจากอันตรกิริยาของสาเหตุสุ่มต่างๆ มากมาย โดยที่สาเหตุเหล่านั้นไม่มีอิทธิพลเหนือกว่าเลย ในสถิติทางเศรษฐกิจและสังคม การแจกแจงแบบปกตินั้นหาได้ยาก แต่เมื่อเปรียบเทียบกับการแจกแจงแบบปกติแล้ว สิ่งสำคัญคือต้องกำหนดขอบเขตและลักษณะของการเบี่ยงเบนของการกระจายตามจริง เมื่อทดสอบสมมติฐาน อาจทำให้เกิดข้อผิดพลาดได้ 2 ประเภท:

ก) พิมพ์ผิดครับ– สมมติฐานที่กำลังทดสอบ (ปกติเรียกว่าสมมติฐานว่าง) เป็นจริง แต่ผลลัพธ์ของการทดสอบนำไปสู่การปฏิเสธ

ข) ข้อผิดพลาดประเภท II– สมมติฐานที่กำลังทดสอบนั้นแท้จริงแล้วมีข้อผิดพลาด แต่ผลลัพธ์ของการทดสอบนำไปสู่การยอมรับ

ส่วนใหญ่แล้ว สมมติฐานที่ต้องทดสอบนั้นถูกกำหนดไว้ว่าไม่มีความแตกต่างระหว่างพารามิเตอร์ประชากรที่ไม่รู้จักและค่าที่กำหนด (สมมติฐานว่าง) ซึ่งแสดงด้วย เนื้อหาของสมมติฐานจะเขียนตามหลังเครื่องหมายทวิภาค เป็นต้น

เกณฑ์ทางสถิติคือกฎเกณฑ์ที่ยอมรับหรือปฏิเสธสมมติฐานว่าง สำหรับสมมติฐานแต่ละประเภทที่กำลังทดสอบ เกณฑ์พิเศษได้รับการพัฒนาขึ้น ซึ่งเกณฑ์ที่ใช้บ่อยที่สุดคือการทดสอบการแจกแจงแบบปกติและการแจกแจงของนักเรียน การทดสอบฟิชเชอร์ การแจกแจงแบบเพียร์สัน (“ไคสแควร์”) และอื่นๆ

หากต้องการสร้างเกณฑ์ทางสถิติที่ช่วยให้คุณสามารถทดสอบสมมติฐานได้ คุณต้องมีสิ่งต่อไปนี้:

1) กำหนดสมมติฐานที่ทดสอบได้ นอกจากสมมติฐานที่กำลังทดสอบแล้ว ยังมีการกำหนดสมมติฐานที่แข่งขันกัน (ทางเลือก) อีกด้วย

2) เลือกระดับนัยสำคัญที่ควบคุมความน่าจะเป็นที่อนุญาตของข้อผิดพลาดประเภทที่ 1

3) กำหนดช่วงของค่าที่ยอมรับได้และพื้นที่วิกฤติที่เรียกว่า

4) ตัดสินใจสิ่งนี้หรือสิ่งนั้นโดยอาศัยการเปรียบเทียบค่าจริงและค่าวิกฤตของเกณฑ์

ระดับความสำคัญ() เป็นค่าเล็กน้อยของความน่าจะเป็นที่เกณฑ์จะตกลงไปในพื้นที่วิกฤต โดยมีเงื่อนไขว่าสมมติฐานนั้นถูกต้อง ซึ่งการเกิดขึ้นของเหตุการณ์นี้ถือได้ว่าเป็นผลมาจากความแตกต่างที่มีนัยสำคัญระหว่างสมมติฐานที่ยกมาและผลลัพธ์ของตัวอย่าง . โดยปกติแล้วระดับนัยสำคัญจะอยู่ที่ 0.05 หรือ 0.01

พลังแห่งการทดสอบคือความน่าจะเป็นที่จะปฏิเสธสมมติฐานว่างที่กำลังทดสอบเมื่อสมมติฐานทางเลือกนั้นถูกต้อง นั่นคืออำนาจของเกณฑ์คือความน่าจะเป็นที่จะไม่มีข้อผิดพลาดเกิดขึ้น แน่นอนว่า ควรมีเกณฑ์ที่มีประสิทธิภาพมากกว่านี้ เนื่องจากจะทำให้มีความเป็นไปได้น้อยที่สุดที่จะเกิดข้อผิดพลาดประเภท II

การทดสอบทางสถิติที่ใช้ในการทดสอบสมมติฐานมีสองประเภท:

1) พาราเมตริกฉันเรียกเกณฑ์ที่อิงตามสมมติฐาน: การแจกแจงของตัวแปรสุ่มโดยรวมเป็นไปตามกฎที่ทราบบางประการ (เช่น ปกติ, ทวินาม, ปัวซอง) เกณฑ์เหล่านี้รวมถึงเกณฑ์ด้วย

2) ไม่ใช่พารามิเตอร์(ลำดับ) คือเกณฑ์การใช้งานที่ไม่เกี่ยวข้องกับความรู้เรื่องกฎการกระจายของตัวแปรสุ่ม สามารถใช้เมื่อการกระจายแตกต่างไปจากปกติอย่างมาก เกณฑ์เหล่านี้รวมถึงการทดสอบสัญญาณ Wilcoxon, White และ Mann-Whitney

เมื่อเปรียบเทียบกับการทดสอบแบบอิงพารามิเตอร์ การทดสอบแบบไม่อิงพารามิเตอร์มีข้อดีและข้อเสียดังต่อไปนี้

ข้อดี:

1. มีสมมติฐานเกี่ยวกับประชากรน้อยลง สิ่งสำคัญที่สุดคือ ประชากรไม่ควรมีการกระจายตัวตามปกติหรือประมาณปกติ

2. สามารถใช้วิธีการทดสอบแบบไม่อิงพารามิเตอร์ได้แม้ว่าตัวอย่างจะมีขนาดเล็กมากก็ตาม

3. สามารถใช้ข้อมูลที่นำเสนอในระดับการวัดใดก็ได้ (ระบุ, ลำดับ)

4. ความเรียบง่ายของการคำนวณซึ่งสามารถทำได้บนเครื่องคิดเลขขนาดเล็ก สาเหตุหลักมาจากการสังเกตจำนวนเล็กน้อยที่ใช้การทดสอบแบบไม่มีพารามิเตอร์

ข้อบกพร่อง:

1. ข้อมูลข้อมูลถูกใช้อย่างมีประสิทธิภาพน้อยลง และพลังของการทดสอบต่ำกว่าพารามิเตอร์พาราเมตริก

การทดสอบแบบไม่อิงพารามิเตอร์อาศัยตารางทางสถิติมากกว่า เว้นแต่จะใช้ชุดซอฟต์แวร์พิเศษ

ขั้นตอนการทำงานเพื่อทดสอบสมมติฐานทางสถิติ:

1) การประเมินข้อมูลอินพุตและคำอธิบายของแบบจำลองทางสถิติของประชากรตัวอย่าง

2) การก่อตัวของสมมติฐานว่างและทางเลือก;

3) การสร้างระดับนัยสำคัญเพื่อควบคุมข้อผิดพลาดประเภทแรก

4) การเลือกเกณฑ์ที่มีประสิทธิภาพเพื่อทดสอบสมมติฐานว่าง (ทำให้สามารถควบคุมการเกิดข้อผิดพลาดประเภท II ได้)

5) การคำนวณมูลค่าที่แท้จริงของเกณฑ์โดยใช้อัลกอริธึมบางอย่าง

6) การกำหนดขอบเขตวิกฤตและขอบเขตของข้อตกลงกับสมมติฐานว่าง นั่นคือ การสร้างค่าตารางของเกณฑ์

7) การเปรียบเทียบค่าเกณฑ์ตามจริงและแบบตารางและสรุปผลตามผลการทดสอบสมมติฐานว่าง

จำนวนการสังเกตที่ใช้สร้างการแจกแจงเชิงประจักษ์มีน้อยและแสดงถึงกลุ่มตัวอย่างจากประชากรที่กำลังศึกษา ข้อมูลเชิงประจักษ์เกี่ยวข้องกับข้อผิดพลาดแบบสุ่ม ซึ่งไม่ทราบขนาด ด้วยการเพิ่มจำนวนการสังเกตและในเวลาเดียวกันกับค่าของช่วงเวลาที่ลดลง ซิกแซกของรูปหลายเหลี่ยมเริ่มเรียบออกและในขีดจำกัด ส่งผ่านไปยังเส้นโค้งเรียบ - เส้นโค้งการกระจาย

เส้นการแจกแจงแสดงลักษณะของการแจกแจงทางทฤษฎี ซึ่งก็คือ ซึ่งจะได้มาถ้าสาเหตุที่สุ่มทั้งหมดที่ปิดบังรูปแบบหลักถูกระงับโดยสิ้นเชิง

การศึกษารูปแบบ (รูปร่าง) การกระจายตัวประกอบด้วย:

· ชี้แจงลักษณะทั่วไปของการกระจาย;

· การจัดตำแหน่งของการกระจายเชิงประจักษ์ ซึ่งก็คือ เส้นโค้งที่มีรูปร่างที่กำหนดจะถูกสร้างขึ้นตามการกระจายเชิงประจักษ์

· ตรวจสอบความสอดคล้องของการแจกแจงทางทฤษฎีที่พบกับแบบเชิงประจักษ์

ประชากรที่เป็นเนื้อเดียวกันมีลักษณะเฉพาะ การแจกแจงจุดยอดเดี่ยว มัลติเวอร์เท็กซ์บ่งชี้ ความแตกต่างประชากรที่กำลังศึกษา ในกรณีนี้ จำเป็นต้องจัดกลุ่มข้อมูลใหม่เพื่อระบุกลุ่มที่เป็นเนื้อเดียวกันมากขึ้น

การกำหนดลักษณะทั่วไปของการกระจายนั้นเกี่ยวข้องกับการประเมินระดับความเป็นเนื้อเดียวกันตลอดจนการคำนวณตัวบ่งชี้ความไม่สมมาตรและความโด่ง

สมมาตรคือการแจกแจงโดยที่ความถี่ของตัวเลือกสองตัวใดๆ ที่มีระยะห่างจากศูนย์กลางของการแจกแจงเท่ากันจะเท่ากัน สำหรับการกระจายแบบสมมาตร

สำหรับการวิเคราะห์เปรียบเทียบความไม่สมดุลของการแจกแจงหลายแบบแบบสัมพัทธ์ ดัชนีความไม่สมดุล:

ค่าอาจเป็นค่าบวกหรือลบก็ได้ ค่าบวกบ่งบอกถึงการมีอยู่ของความไม่สมมาตรทางด้านขวา (กิ่งด้านขวาจะยาวกว่าเมื่อเทียบกับลำดับสูงสุดมากกว่าด้านซ้าย) (รูปที่ 1):

รูปที่ 1. โม<Ме<

สัญญาณลบของตัวบ่งชี้ความไม่สมมาตรบ่งชี้ว่ามีความไม่สมมาตรด้านซ้าย (รูปที่ 2)

รูปที่ 2. โม>ฉัน>

ที่พบมากที่สุดคือตัวบ่งชี้ความไม่สมมาตรซึ่งคำนวณโดยสูตร

ช่วงเวลาศูนย์กลางอันดับสามอยู่ที่ไหน

การใช้ตัวบ่งชี้นี้ทำให้สามารถระบุได้ไม่เพียง แต่ระดับของความไม่สมมาตรเท่านั้น แต่ยังรวมถึงการมีหรือไม่มีความไม่สมดุลในการกระจายลักษณะเฉพาะในประชากรทั่วไปอีกด้วย การประมาณค่าดำเนินการโดยใช้ค่าคลาดเคลื่อนกำลังสองเฉลี่ย:

โดยที่ n คือจำนวนการสังเกต

ถ้า >3 แสดงว่าความไม่สมมาตรมีนัยสำคัญ และการกระจายลักษณะในประชากรไม่สมมาตร ถ้า<3, асимметрия несущественна и ее наличие может объясняться влиянием случайных обстоятельств.

เกณฑ์ข้อตกลงเรียกว่าเกณฑ์ในการทดสอบสมมติฐานเกี่ยวกับกฎที่คาดหวังของการกระจายตัวที่ไม่รู้จักในประชากร มีเกณฑ์ข้อตกลงหลายประการ: Pearson, Kolmogorov, Smirnov, Yastremsky เกณฑ์เหล่านี้ทำให้สามารถกำหนดได้ว่าการแจกแจงเชิงทดลองสอดคล้องกับเกณฑ์ทางทฤษฎีหรือไม่ รวมถึงความคลาดเคลื่อนระหว่างการแจกแจงที่มีนัยสำคัญเพียงใด

หนึ่งในการทดสอบความพอดีที่ใช้กันมากที่สุดคือการทดสอบของ K. Pearson (“ไคสแควร์”):

โดยที่ความถี่ของการแจกแจงเชิงประจักษ์และเชิงทฤษฎีในช่วงเวลาตามลำดับ

ยิ่งความแตกต่างระหว่างความถี่ที่สังเกตได้กับความถี่ทางทฤษฎีมากเท่าใด ค่าของเกณฑ์ของ Pearson ก็จะยิ่งมากขึ้นเท่านั้น เพื่อแยกแยะค่าที่มีนัยสำคัญจากค่าที่อาจเกิดขึ้นจากการสุ่มตัวอย่าง ค่าเกณฑ์ที่คำนวณได้จะถูกนำไปเปรียบเทียบกับค่าที่ทำเป็นตารางตามจำนวนองศาอิสระที่เหมาะสมและระดับนัยสำคัญที่กำหนด

เมื่อกำหนดค่าของเกณฑ์ Pearson ตามข้อมูลจากตัวอย่างเฉพาะแล้ว คุณจะพบกับตัวเลือกต่อไปนี้:

1) กล่าวคือ ตกอยู่ในบริเวณวิกฤต ซึ่งหมายความว่าความแตกต่างระหว่างความถี่เชิงประจักษ์และความถี่ทางทฤษฎีมีความสำคัญและไม่สามารถอธิบายได้ด้วยความผันผวนแบบสุ่มในข้อมูลตัวอย่าง ในกรณีนี้ สมมติฐานที่ว่าการแจกแจงเชิงประจักษ์ใกล้เคียงกับปกติจะถูกปฏิเสธ

2) กล่าวคือ เกณฑ์ที่คำนวณได้จะต้องไม่เกินค่าความคลาดเคลื่อนสูงสุดที่เป็นไปได้ระหว่างความถี่เชิงประจักษ์และความถี่ทางทฤษฎี ซึ่งอาจเกิดขึ้นเนื่องจากความผันผวนแบบสุ่มในข้อมูลตัวอย่าง ในกรณีนี้ สมมติฐานที่ว่าการกระจายเชิงประจักษ์ใกล้เคียงกับปกติจะไม่ถูกปฏิเสธ

ค่าตารางของเกณฑ์ Pearson ถูกกำหนดที่ระดับนัยสำคัญคงที่และจำนวนระดับความเป็นอิสระที่สอดคล้องกัน

จำนวนองศาอิสระ = โดยที่จำนวนเงื่อนไขที่ถือว่าต้องเป็นไปตามเมื่อคำนวณความถี่ทางทฤษฎี คือจำนวนกลุ่ม แนวคิดของจำนวนองศาอิสระนั้นเกิดจากการที่ในการรวมทางสถิติจำเป็นต้องคำนึงถึงความสัมพันธ์เชิงเส้นที่จำกัดอิสระในการเปลี่ยนแปลงของตัวแปรสุ่ม ตัวอย่างเช่นเมื่อคำนวณการกระจายตัวโดยรวมเรามีระดับความเป็นอิสระเนื่องจากเราสามารถกำหนดค่าใด ๆ ของคุณลักษณะได้โดยการรู้ค่าและค่าเฉลี่ยเลขคณิต.

เมื่อคำนวณเกณฑ์ของ Pearson ต้องเป็นไปตามเงื่อนไขต่อไปนี้:

1. จำนวนการสังเกตต้องมีมากเพียงพอ

2. หากความถี่ทางทฤษฎีในบางช่วงน้อยกว่า 5 ดังนั้นช่วงดังกล่าวจะถูกรวมเข้าด้วยกันเพื่อให้ความถี่มากกว่า 5

ตัวอย่าง

จำเป็นต้องตรวจสอบว่าการกระจายตัวของวิสาหกิจระดับภูมิภาคตามต้นทุนเฉลี่ยของสินทรัพย์ถาวรสอดคล้องกับกฎหมายการกระจายสินค้าแบบปกติโดยใช้เกณฑ์หรือไม่

มีความจำเป็นต้องทดสอบสมมติฐานว่าตัวอย่างได้มาจากประชากรที่แจกแจงตามปกติ (ในประชากรนี้ 30.3; 8.44)

เพื่อตอบคำถามเราจะรวบรวมตารางเสริม 13

ตารางที่ 13

กลุ่มสถานประกอบการก่อสร้าง ตามปริมาณงานตามสัญญาที่ดำเนินการ ล้านรูเบิล ความถี่ที่สังเกตได้ ความถี่กลม
10–15 15–20 20–25 25–30 30–35 35–40 40–45 45–50 50–55 -2,41 -1,81 -1,22 -0,63 -0,04 0,56 1,15 1,74 2,33 -1,81 -1,22 -0,63 -0,04 0,56 1,15 1,74 2,33 2,93 -0,984 -0,930 -0,778 -0,471 -0,032 0,425 0,750 0,918 0,980 -0,930 -0,778 -0,471 -0,032 0,425 0,750 0,918 0,980 0,997 0,027 0,076 0,153 0,220 0,228 0,163 0,084 0,031 0,008 3,9 10,9 21,9 31,4 32,6 23,3 12,0 4,4 1,2
0,18 3,226 1,48 0,173 0,333
0,2
ทั้งหมด - - - - - - 5,512

สำหรับช่วงแรก

143*0,027 = 3,9 ≈ 4.

จำนวนกลุ่มหลังรวมกลุ่มย่อยคือ 7 ค่าวิกฤตที่ 7 – 3 = องศาอิสระ 4 องศา และค่านัยสำคัญ 0.05 จะเป็น 9.49 ซึ่งหมายความว่าความน่าจะเป็นของการแจกแจงที่แตกต่างจากปกติจะน้อยกว่า 0.05 และความน่าจะเป็นที่จะปฏิบัติตามกฎหมายปกตินั้นมากกว่า 0.95 ที่ α = 0.1 จะเท่ากับ 7.78 ซึ่งมากกว่าค่าจริงเช่นกัน สมมติฐานที่ว่าการกระจายตัวของประชากรที่กำหนดนั้นสอดคล้องกับกฎปกติไม่สามารถปฏิเสธได้

เมื่อใช้เกณฑ์นี้ คุณสามารถตรวจสอบไม่เพียงแต่สมมติฐานเกี่ยวกับข้อตกลงของการแจกแจงเชิงประจักษ์กับสมมติฐานปกติ แต่ยังรวมถึงกฎการกระจายอื่น ๆ ที่รู้จักด้วย การกระจายปัวซอง. การกระจายนี้เกิดขึ้นเมื่อพิจารณาเหตุการณ์ความน่าจะเป็นต่ำที่เกิดขึ้นในการทดลองอิสระชุดใหญ่ โอกาสที่เหตุการณ์หายากเหล่านี้จะเกิดขึ้น

โดยที่คือจำนวนครั้งเฉลี่ยของเหตุการณ์ วี nการทดสอบอิสระที่เหมือนกันนั่นคือ – ความน่าจะเป็นของเหตุการณ์ระหว่างการทดลองหนึ่งครั้ง = 2,71828; – ความถี่ของเหตุการณ์นี้

ตัวอย่างเช่น เพื่อดำเนินการควบคุมคุณภาพภายในของการประมวลผลคำขอชำระเงิน มีการสุ่มเลือกเอกสาร 100 รายการ จำนวนข้อผิดพลาดโดยเฉลี่ยคือ จำเป็นต้องตรวจสอบความสอดคล้องของการแจกแจงเชิงประจักษ์กับการแจกแจงแบบปัวซองโดยใช้เกณฑ์ (ตารางที่ 14)

ตารางที่ 14

จำนวนข้อผิดพลาด จำนวนเอกสารที่ตรวจสอบแล้ว
0,6771 0,2641 0,0515 0,0067 0,0007 67,7 26,4 5,15 0,7 0,1 0,7859 0,4100 0,0043 8,1148 13,3877
ทั้งหมด 1,0000 26,400

ค่า = 26.4 จำนวนองศาอิสระ df = 5 – 1 = 4 (สำหรับการแจกแจงแบบปัวซอง: df = k – 1 – r โดยที่ r = 1 หรือ r = 0 หากการประมาณค่าอิงจากตัวอย่าง) ค่าตาราง ; . เนื่องจาก สมมติฐานการกระจายปัวซองถูกปฏิเสธ

เพื่อประเมินระดับข้อตกลงระหว่างการแจกแจงเชิงประจักษ์และเชิงทฤษฎีตามเกณฑ์นี้ จะใช้ตารางพิเศษ

ในกรณีที่ไม่มีตารางพิเศษ เกณฑ์ "ไคสแควร์" สามารถถูกแทนที่ด้วยเกณฑ์ของ V.I. Romanovsky:

จำนวนองศาอิสระอยู่ที่ไหน

สำหรับการแจกแจงแบบปกติ การแจกแจงแบบ Charlier โดยที่คือจำนวนช่วง (กลุ่ม)

ความแตกต่างระหว่างความถี่เชิงประจักษ์และความถี่ทางทฤษฎีจะถือเป็นแบบสุ่มหากค่าน้อยกว่าสาม

นอกเหนือจากเกณฑ์เหล่านี้แล้วให้พิจารณาด้วย เกณฑ์ที่ไม่ใช่พารามิเตอร์และความเกี่ยวข้องของการใช้งานก็เพิ่มขึ้นอย่างต่อเนื่อง

การทดสอบอันดับลงนามของวิลคอกสัน– จำนวนการสังเกตซึ่ง )

พื้นที่เบี่ยงเบน เอช 0อาจเป็นด้านเดียวหรือทั้งสองด้านก็ได้ ขึ้นอยู่กับว่าสมมติฐานว่างใดที่กำลังถูกทดสอบ ในกรณีที่ไม่มีตารางสถิติ W พิเศษ สามารถใช้การแจกแจงแบบปกติมาตรฐานได้ นั่นคือ สถิติ Z โดยคำนึงถึง ป.

ตัวอย่าง

จำเป็นต้องใช้การทดสอบอันดับลงนามของ Wilcoxon เพื่อแก้ไขปัญหาความสำคัญของมูลค่ากำไรเฉลี่ยที่มากเกินไปในประชากรที่ศึกษาของบริษัทที่มีส่วนร่วมในธุรกรรมอสังหาริมทรัพย์ ซึ่งมีค่าเป็นศูนย์ (ระดับนัยสำคัญ 5%) สมมติฐานว่างและทางเลือกจะถูกเขียนดังนี้: แต่:ม< 0; ฮ 1:ม. > 0.

ตารางที่ 16

การคำนวณการทดสอบวิลคอกซัน

บริษัท มูลค่าที่สังเกตได้ (กำไรเป็นเปอร์เซ็นต์ของยอดขาย) อันดับ
-5 -5 9,5 9,5 9,5 15,5 9,5 2,0 15,5 9,5 13,5 13,5 9,5 9,5 9,5 9,5 15,5 9,5 2,0 15,5 9,5 13,5 - 9,5 13,5
ทั้งหมด - - - - 139,5 13,5

สำหรับบริษัทที่มี อันดับจะถูกวางไว้ในคอลัมน์แยกต่างหาก ร+ผลรวมของค่าในคอลัมน์นี้ให้สถิติของวิลคอกซัน: ว= 139.5. (คอลัมน์ R– ไม่เกี่ยวข้องกับการวิเคราะห์ แต่มีการคำนวณเพื่อหลีกเลี่ยงข้อผิดพลาด)

ค่าเกณฑ์วิกฤต สามารถพบได้จากตาราง

สำหรับผลต่างที่ไม่ใช่ศูนย์ 17 รายการ และ α = 0.05 คือค่าวิกฤตที่ต่ำกว่า = 42, บน – 111 ค่าจริง = 139.5 ไม่อยู่ในช่วงของค่าในตาราง ดังนั้นสมมติฐานว่างจึงสามารถปฏิเสธได้ที่ระดับนัยสำคัญ 5%

การทดสอบอันดับลงนามของวิลคอกสันเพื่อเปรียบเทียบสองตัวอย่างสามารถใช้เป็นเกณฑ์ที่ไม่ใช่พารามิเตอร์ในการแก้ปัญหาที่เคยใช้การทดสอบแบบพาราเมตริกมาก่อน มีการกำหนดลักษณะของประชากรกลุ่มหนึ่ง x 1 และอื่น ๆ 1 . วิธีการคำนวณคล้ายกับการใช้เกณฑ์กับตัวอย่างเดียว

ตัวอย่าง

สมาชิกแต่ละคนของทีมวิเคราะห์ 17 คนเห็นโฆษณาสองรายการ อาสาสมัครให้คะแนนระดับความคิดสร้างสรรค์ของโฆษณาแต่ละรายการในระดับตั้งแต่ 1 ถึง 5 ให้คะแนนระดับความคิดสร้างสรรค์ของโฆษณาแต่ละรายการที่ระดับนัยสำคัญ 5%

H 0: นั่นคือค่ามัธยฐาน ในประชากรเท่ากับศูนย์ (ระดับการโฆษณาที่สร้างสรรค์เท่ากัน)

21.5 อยู่ภายในขีดจำกัดเหล่านี้ ดังนั้นจึงยอมรับสมมติฐานว่าง สรุป: สินค้าโฆษณาที่นำมาเปรียบเทียบมีความคิดสร้างสรรค์ในระดับเดียวกัน สันนิษฐานว่า , อันดับข้อมูลจากตัวอย่างที่ 2 จะถูกเขียนลงในคอลัมน์ R2.ค่าที่สังเกตได้ (จริง) ของการทดสอบวิลคอกซันคำนวณโดยใช้สูตร = .

ตัวอย่าง.บริษัทกำลังเผชิญกับการฟ้องร้องโดยกล่าวหาว่ามีการเลือกปฏิบัติต่อพนักงานตามเพศ จำเป็นต้องใช้ข้อมูลค่าจ้างที่นำเสนอ (ตารางที่ 19) เพื่อกำหนดที่ระดับนัยสำคัญ 5% ว่าการแจกแจงทั้งสองมีค่ามัธยฐานเท่ากันหรือไม่

ตารางที่ 19

ข้อมูลการเลือกปฏิบัติทางเพศของพนักงาน

เงินเดือนหนึ่งพันรูเบิล
ผู้หญิง 11,2 10,5 8,3 10,2 14,4 8,5 5,0
7,5 = 43,5
ผู้ชาย 9,1 18,3 14,1 21,9 10,5 13,8 14,6 8,6 13,4 10,6
7,5

เนื่องจากไม่มีเหตุผลที่จะเชื่อได้ว่าค่าจ้างรายเดือนสำหรับพนักงานกลุ่มหนึ่งสูงกว่าอีกกลุ่มหนึ่ง สมมติฐานที่เป็นโมฆะและทางเลือกจึงถูกกำหนดให้เป็นแบบสองด้าน

กำลังโหลด...