ตัวอย่างใดๆ ให้เพียงแนวคิดโดยประมาณของประชากรทั่วไป และคุณลักษณะทางสถิติของกลุ่มตัวอย่างทั้งหมด (ค่าเฉลี่ย โหมด ความแปรปรวน...) เป็นเพียงการประมาณบางส่วนหรือพูดเป็นค่าประมาณของพารามิเตอร์ทั่วไป ซึ่งในกรณีส่วนใหญ่ไม่สามารถคำนวณได้เนื่องจาก การเข้าถึงไม่ได้ของประชาชนทั่วไป (รูปที่ 20)
รูปที่ 20. ข้อผิดพลาดในการสุ่มตัวอย่าง
แต่คุณสามารถระบุช่วงเวลาที่ค่าจริง (ทั่วไป) ของคุณลักษณะทางสถิติอยู่ได้ในระดับความน่าจะเป็นหนึ่ง ช่วงเวลานี้เรียกว่า ง ช่วงความเชื่อมั่น (CI)
ดังนั้นค่าเฉลี่ยทั่วไปที่มีความน่าจะเป็น 95% จึงอยู่ภายใน
จากถึง (20)
ที่ไหน ที – ค่าตารางของการทดสอบของนักเรียนสำหรับ α =0.05 และ ฉ= n-1
ในกรณีนี้ CI สามารถพบได้ 99% ที เลือกสำหรับ α =0,01.
ความสำคัญเชิงปฏิบัติของช่วงความเชื่อมั่นคืออะไร?
ช่วงความเชื่อมั่นที่กว้างบ่งชี้ว่าค่าเฉลี่ยตัวอย่างไม่ได้สะท้อนถึงค่าเฉลี่ยประชากรอย่างแม่นยำ ซึ่งมักเกิดจากการมีขนาดตัวอย่างไม่เพียงพอ หรือความหลากหลาย เช่น การกระจายตัวขนาดใหญ่ ทั้งคู่ให้ค่าคลาดเคลื่อนที่มากกว่าของค่าเฉลี่ยและด้วยเหตุนี้ CI ที่กว้างขึ้น และนี่คือพื้นฐานในการกลับเข้าสู่ขั้นตอนการวางแผนการวิจัย
ขีดจำกัดบนและล่างของ CI เป็นการประมาณว่าผลลัพธ์จะมีนัยสำคัญทางคลินิกหรือไม่
ให้เราอาศัยอยู่ในรายละเอียดเกี่ยวกับคำถามเกี่ยวกับนัยสำคัญทางสถิติและทางคลินิกของผลการศึกษาคุณสมบัติของกลุ่ม ให้เราจำไว้ว่าหน้าที่ของสถิติคือการตรวจจับความแตกต่างบางอย่างในประชากรทั่วไปเป็นอย่างน้อยโดยพิจารณาจากข้อมูลตัวอย่าง ความท้าทายสำหรับแพทย์คือการตรวจหาความแตกต่าง (ไม่ใช่แค่ข้อแตกต่าง) ที่จะช่วยในการวินิจฉัยหรือการรักษา และข้อสรุปทางสถิติก็ไม่ใช่พื้นฐานสำหรับข้อสรุปทางคลินิกเสมอไป ดังนั้นการลดลงของฮีโมโกลบินอย่างมีนัยสำคัญทางสถิติ 3 กรัม/ลิตรจึงไม่ทำให้เกิดความกังวล และในทางกลับกัน หากปัญหาบางอย่างในร่างกายมนุษย์ไม่แพร่หลายในระดับประชากรทั้งหมด ก็ไม่ใช่เหตุผลที่จะไม่จัดการกับปัญหานี้
ลองดูสถานการณ์นี้ ตัวอย่าง. นักวิจัยสงสัยว่าเด็กผู้ชายที่ป่วยด้วยโรคติดเชื้อบางประเภทจะล้าหลังกว่าเพื่อนในการเติบโตหรือไม่ เพื่อจุดประสงค์นี้ ได้ทำการศึกษาตัวอย่างโดยนำเด็กชาย 10 คนที่ป่วยด้วยโรคนี้เข้าร่วม ผลลัพธ์แสดงไว้ในตารางที่ 23 ตารางที่ 23. ผลลัพธ์ของการประมวลผลทางสถิติ
จากการคำนวณเหล่านี้ พบว่าส่วนสูงเฉลี่ยของกลุ่มตัวอย่างเด็กชายอายุ 10 ขวบที่ป่วยด้วยโรคติดเชื้อบางชนิดอยู่ในเกณฑ์ใกล้เคียงปกติ (132.5 ซม.) อย่างไรก็ตาม ขีดจำกัดล่างของช่วงความเชื่อมั่น (126.6 ซม.) บ่งชี้ว่ามีความน่าจะเป็น 95% ที่ความสูงเฉลี่ยที่แท้จริงของเด็กเหล่านี้สอดคล้องกับแนวคิดเรื่อง "ส่วนสูงสั้น" กล่าวคือ เด็กเหล่านี้แคระแกรน ในตัวอย่างนี้ ผลลัพธ์ของการคำนวณช่วงความเชื่อมั่นมีความสำคัญทางคลินิก |
การประมาณค่าช่วงความเชื่อมั่น
วัตถุประสงค์การเรียนรู้
สถิติพิจารณาสิ่งต่อไปนี้ สองงานหลัก:
เรามีค่าประมาณจากข้อมูลตัวอย่าง และเราต้องการสร้างข้อความความน่าจะเป็นว่าค่าที่แท้จริงของพารามิเตอร์ประมาณนั้นอยู่ที่ใด
เรามีสมมติฐานเฉพาะที่ต้องทดสอบโดยใช้ข้อมูลตัวอย่าง
ในหัวข้อนี้เราจะพิจารณางานแรก ให้เราแนะนำคำจำกัดความของช่วงความเชื่อมั่นด้วย
ช่วงความเชื่อมั่นคือช่วงที่สร้างขึ้นรอบๆ ค่าประมาณของพารามิเตอร์ และแสดงตำแหน่งที่ค่าจริงของพารามิเตอร์โดยประมาณอยู่ด้วยความน่าจะเป็นที่ระบุตามลำดับความสำคัญ
หลังจากศึกษาเนื้อหาในหัวข้อนี้แล้ว คุณ:
เรียนรู้ว่าช่วงความเชื่อมั่นสำหรับการประมาณค่าคืออะไร
เรียนรู้การจำแนกปัญหาทางสถิติ
เชี่ยวชาญเทคนิคการสร้างช่วงความเชื่อมั่นทั้งโดยใช้สูตรทางสถิติและการใช้เครื่องมือซอฟต์แวร์
เรียนรู้ที่จะกำหนดขนาดตัวอย่างที่ต้องการเพื่อให้ได้พารามิเตอร์ความแม่นยำของการประมาณการทางสถิติ
การกระจายตัวของลักษณะตัวอย่าง
T-การกระจาย
ตามที่กล่าวไว้ข้างต้น การแจกแจงของตัวแปรสุ่มนั้นใกล้เคียงกับการแจกแจงแบบปกติมาตรฐานด้วยพารามิเตอร์ 0 และ 1 เนื่องจากเราไม่ทราบค่าของ σ เราจึงแทนที่มันด้วยการประมาณค่า s ปริมาณมีการกระจายที่แตกต่างกันอยู่แล้วคือหรือ การกระจายตัวของนักเรียนซึ่งถูกกำหนดโดยพารามิเตอร์ n -1 (จำนวนองศาอิสระ) การแจกแจงนี้ใกล้เคียงกับการแจกแจงแบบปกติ (ยิ่ง n ยิ่งมาก การแจกแจงก็จะยิ่งใกล้มากขึ้น)
ในรูป 95
นำเสนอการกระจายตัวของนักเรียนที่มีระดับความอิสระ 30 องศา อย่างที่คุณเห็น มันใกล้เคียงกับการกระจายตัวแบบปกติมาก
คล้ายกับฟังก์ชันสำหรับการทำงานกับการแจกแจงแบบปกติ NORMIDIST และ NORMINV มีฟังก์ชันสำหรับการทำงานกับการแจกแจงแบบ t - STUDIST (TDIST) และ สตูดราซอร์ (TINV). ตัวอย่างของการใช้ฟังก์ชันเหล่านี้สามารถดูได้ในไฟล์ STUDRASP.XLS (เทมเพลตและโซลูชัน) และในรูปที่ 1 96
.
การกระจายลักษณะอื่น ๆ
ดังที่เราทราบแล้วว่า เพื่อกำหนดความแม่นยำในการประมาณค่าความคาดหวังทางคณิตศาสตร์ เราจำเป็นต้องมีการแจกแจงแบบ t ในการประมาณค่าพารามิเตอร์อื่นๆ เช่น ความแปรปรวน จำเป็นต้องมีการแจกแจงที่แตกต่างกัน สองในนั้นคือการแจกแจงแบบ F และ x 2 -การกระจาย.
ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ย
ช่วงความเชื่อมั่น- นี่คือช่วงเวลาที่สร้างขึ้นรอบๆ ค่าประมาณของพารามิเตอร์ และแสดงตำแหน่งที่ค่าจริงของพารามิเตอร์โดยประมาณอยู่ด้วยความน่าจะเป็นที่ระบุโดยนิรนัย
การสร้างช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยเกิดขึ้น ดังต่อไปนี้:
ตัวอย่าง
ร้านอาหารฟาสต์ฟู้ดแห่งนี้วางแผนที่จะขยายประเภทด้วยแซนด์วิชรูปแบบใหม่ เพื่อประเมินความต้องการ ผู้จัดการวางแผนที่จะสุ่มเลือกผู้เข้าชม 40 คนจากผู้ที่ได้ลองใช้แล้ว และขอให้พวกเขาให้คะแนนทัศนคติต่อผลิตภัณฑ์ใหม่ในระดับตั้งแต่ 1 ถึง 10 ผู้จัดการต้องการประมาณค่าที่คาดหวัง จำนวนคะแนนที่ผลิตภัณฑ์ใหม่จะได้รับและสร้างช่วงความเชื่อมั่น 95% สำหรับการประมาณนี้ วิธีการทำเช่นนี้? (ดูไฟล์ SANDWICH1.XLS (เทมเพลตและวิธีแก้ไข)
สารละลาย
เพื่อแก้ไขปัญหานี้คุณสามารถใช้ . ผลลัพธ์จะแสดงในรูป 97
.
ช่วงความเชื่อมั่นสำหรับมูลค่ารวม
บางครั้ง การใช้ข้อมูลตัวอย่าง จำเป็นต้องประมาณไม่ใช่การคาดการณ์ทางคณิตศาสตร์ แต่ต้องประมาณผลรวมของค่าทั้งหมด ตัวอย่างเช่น ในสถานการณ์ที่มีผู้ตรวจสอบบัญชี ดอกเบี้ยอาจอยู่ที่การประมาณไม่ใช่ขนาดบัญชีเฉลี่ย แต่อยู่ที่ผลรวมของบัญชีทั้งหมด
ให้ N เป็นจำนวนองค์ประกอบทั้งหมด n คือขนาดตัวอย่าง T 3 คือผลรวมของค่าในกลุ่มตัวอย่าง T" เป็นการประมาณสำหรับผลรวมของประชากรทั้งหมด จากนั้น และช่วงความเชื่อมั่นคำนวณโดยสูตร โดยที่ s คือค่าประมาณของค่าเบี่ยงเบนมาตรฐานสำหรับตัวอย่าง และคือค่าประมาณของค่าเฉลี่ยสำหรับตัวอย่าง
ตัวอย่าง
สมมติว่าหน่วยงานภาษีต้องการประมาณยอดคืนภาษีทั้งหมดสำหรับผู้เสียภาษี 10,000 ราย ผู้เสียภาษีจะได้รับเงินคืนหรือจ่ายภาษีเพิ่มเติม ค้นหาช่วงความเชื่อมั่น 95% สำหรับจำนวนเงินคืน โดยสมมติว่ามีกลุ่มตัวอย่าง 500 คน (ดูไฟล์ AMOUNT OF REFUND.XLS (เทมเพลตและวิธีแก้ไข)
สารละลาย
StatPro ไม่มีขั้นตอนพิเศษสำหรับกรณีนี้ อย่างไรก็ตาม สามารถสังเกตได้ว่าขอบเขตสามารถรับได้จากขอบเขตของค่าเฉลี่ยตามสูตรข้างต้น (รูปที่ 98
).
ช่วงความมั่นใจสำหรับสัดส่วน
ให้ p เป็นความคาดหวังทางคณิตศาสตร์ของส่วนแบ่งของลูกค้า และให้ p b เป็นค่าประมาณของส่วนแบ่งนี้ที่ได้จากตัวอย่างขนาด n แสดงว่าสำหรับขนาดใหญ่พอสมควรแล้ว การกระจายการประเมินจะใกล้เคียงกับปกติโดยมีค่าคาดหวังทางคณิตศาสตร์ p และค่าเบี่ยงเบนมาตรฐาน . ข้อผิดพลาดมาตรฐานของการประมาณค่าในกรณีนี้แสดงเป็น และช่วงความเชื่อมั่นเท่ากับ .
ตัวอย่าง
ร้านอาหารฟาสต์ฟู้ดแห่งนี้วางแผนที่จะขยายประเภทด้วยแซนด์วิชรูปแบบใหม่ เพื่อประเมินความต้องการ ผู้จัดการได้สุ่มเลือกผู้เข้าชม 40 คนจากผู้ที่ได้ลองใช้แล้ว และขอให้พวกเขาให้คะแนนทัศนคติที่มีต่อผลิตภัณฑ์ใหม่ในระดับตั้งแต่ 1 ถึง 10 ผู้จัดการต้องการประมาณสัดส่วนที่คาดหวังของ ลูกค้าที่ให้คะแนนผลิตภัณฑ์ใหม่อย่างน้อย 6 คะแนน (เขาคาดหวังว่าลูกค้าเหล่านี้จะเป็นผู้บริโภคของผลิตภัณฑ์ใหม่)
สารละลาย
ในตอนแรก เราจะสร้างคอลัมน์ใหม่ตามแอตทริบิวต์ 1 หากคะแนนของลูกค้ามากกว่า 6 คะแนนและเป็น 0 มิฉะนั้น (ดูไฟล์ SANDWICH2.XLS (เทมเพลตและวิธีแก้ปัญหา)
วิธีที่ 1
โดยการนับเลข 1 เราประมาณส่วนแบ่งแล้วใช้สูตร
ค่า zcr นำมาจากตารางการแจกแจงแบบปกติพิเศษ (เช่น 1.96 สำหรับช่วงความเชื่อมั่น 95%)
เมื่อใช้วิธีการนี้และข้อมูลเฉพาะเพื่อสร้างช่วง 95% เราจะได้ผลลัพธ์ดังต่อไปนี้ (รูปที่ 99
). ค่าวิกฤตของพารามิเตอร์ zcr คือ 1.96 ข้อผิดพลาดมาตรฐานของการประมาณการคือ 0.077 ขีดจำกัดล่างของช่วงความเชื่อมั่นคือ 0.475 ขีดจำกัดบนของช่วงความเชื่อมั่นคือ 0.775 ดังนั้น ผู้จัดการมีสิทธิ์ที่จะเชื่อด้วยความมั่นใจ 95% ว่าเปอร์เซ็นต์ของลูกค้าที่ให้คะแนนผลิตภัณฑ์ใหม่ 6 คะแนนขึ้นไปจะอยู่ระหว่าง 47.5 ถึง 77.5
วิธีที่ 2
ปัญหานี้สามารถแก้ไขได้โดยใช้เครื่องมือ StatPro มาตรฐาน ในการดำเนินการนี้ ก็เพียงพอที่จะทราบว่าส่วนแบ่งในกรณีนี้เกิดขึ้นพร้อมกับค่าเฉลี่ยของคอลัมน์ประเภท ต่อไปเราสมัคร StatPro/การอนุมานทางสถิติ/การวิเคราะห์ตัวอย่างเดียวเพื่อสร้างช่วงความเชื่อมั่นของค่าเฉลี่ย (ค่าประมาณของความคาดหวังทางคณิตศาสตร์) สำหรับคอลัมน์ประเภท ผลลัพธ์ที่ได้ในกรณีนี้จะใกล้เคียงกับผลลัพธ์ของวิธีที่ 1 มาก (รูปที่ 99)
ช่วงความเชื่อมั่นสำหรับส่วนเบี่ยงเบนมาตรฐาน
s ใช้เป็นค่าประมาณของส่วนเบี่ยงเบนมาตรฐาน (สูตรแสดงไว้ในส่วนที่ 1) ฟังก์ชันความหนาแน่นของการประมาณค่า s คือฟังก์ชันไคสแควร์ ซึ่งมีดีกรีอิสระ n-1 เช่นเดียวกับการแจกแจงแบบ t มีฟังก์ชันพิเศษสำหรับการทำงานกับการแจกแจง CHIDIST และ CHIINV นี้
ช่วงความเชื่อมั่นในกรณีนี้จะไม่สมมาตรอีกต่อไป แผนภาพขอบเขตแบบธรรมดาแสดงไว้ในรูปที่ 1 100 .
ตัวอย่าง
เครื่องจักรจะต้องผลิตชิ้นส่วนที่มีเส้นผ่านศูนย์กลาง 10 ซม. อย่างไรก็ตาม เกิดข้อผิดพลาดขึ้นเนื่องจากสถานการณ์ต่างๆ ผู้ควบคุมคุณภาพมีความกังวลเกี่ยวกับสองสถานการณ์ ประการแรก ค่าเฉลี่ยควรอยู่ที่ 10 ซม. ประการที่สอง แม้ในกรณีนี้ ถ้ามีการเบี่ยงเบนมาก หลายส่วนก็จะถูกปฏิเสธ ทุกวันเขาสร้างตัวอย่าง 50 ชิ้นส่วน (ดูไฟล์ QUALITY CONTROL.XLS (เทมเพลตและโซลูชัน) ตัวอย่างดังกล่าวให้ข้อสรุปอะไรได้บ้าง
สารละลาย
ลองสร้างช่วงความเชื่อมั่น 95% สำหรับค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานโดยใช้ StatPro/การอนุมานทางสถิติ/การวิเคราะห์ตัวอย่างเดียว(รูปที่ 101
).
ต่อไป โดยใช้สมมติฐานของการกระจายเส้นผ่านศูนย์กลางปกติ เราจะคำนวณสัดส่วนของผลิตภัณฑ์ที่มีข้อบกพร่อง โดยตั้งค่าส่วนเบี่ยงเบนสูงสุดที่ 0.065 การใช้ความสามารถของตารางการทดแทน (กรณีของพารามิเตอร์สองตัว) เราวางแผนการพึ่งพาสัดส่วนของข้อบกพร่องกับค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน (รูปที่ 102
).
ช่วงความเชื่อมั่นสำหรับผลต่างระหว่างสองค่าเฉลี่ย
นี่เป็นหนึ่งในการประยุกต์ใช้วิธีการทางสถิติที่สำคัญที่สุด ตัวอย่างสถานการณ์
ผู้จัดการร้านเสื้อผ้าต้องการทราบว่าลูกค้าหญิงโดยเฉลี่ยใช้จ่ายในร้านค้ามากหรือน้อยกว่าลูกค้าชายโดยเฉลี่ย
สองสายการบินบินเส้นทางเดียวกัน องค์กรผู้บริโภคต้องการเปรียบเทียบความแตกต่างระหว่างเวลาล่าช้าของเที่ยวบินโดยเฉลี่ยที่คาดไว้สำหรับทั้งสองสายการบิน
บริษัทจะส่งคูปองสำหรับสินค้าบางประเภทในเมืองหนึ่งและไม่ใช่ในเมืองอื่น ผู้จัดการต้องการเปรียบเทียบปริมาณการซื้อเฉลี่ยของผลิตภัณฑ์เหล่านี้ในช่วงสองเดือนข้างหน้า
ตัวแทนจำหน่ายรถยนต์มักจะจัดการกับคู่แต่งงานในการนำเสนอ เพื่อให้เข้าใจถึงปฏิกิริยาส่วนตัวของพวกเขาต่อการนำเสนอ คู่รักมักจะถูกสัมภาษณ์แยกกัน ผู้จัดการต้องการประเมินความแตกต่างของคะแนนที่ได้รับจากชายและหญิง
กรณีตัวอย่างอิสระ
ความแตกต่างระหว่างค่าเฉลี่ยจะมีการแจกแจงแบบ t โดยมีดีกรีอิสระ n 1 + n 2 - 2 ช่วงความเชื่อมั่นสำหรับ μ 1 - μ 2 แสดงโดยความสัมพันธ์:
ปัญหานี้สามารถแก้ไขได้ไม่เพียงแต่โดยใช้สูตรข้างต้น แต่ยังใช้เครื่องมือ StatPro มาตรฐานอีกด้วย เมื่อต้องการทำเช่นนี้ก็เพียงพอที่จะใช้
ช่วงความเชื่อมั่นสำหรับความแตกต่างระหว่างสัดส่วน
ให้เป็นความคาดหวังทางคณิตศาสตร์ของหุ้น ให้ เป็นการประมาณตัวอย่างที่สร้างจากตัวอย่างขนาด n 1 และ n 2 ตามลำดับ แล้วเป็นการประมาณความแตกต่าง ดังนั้น ช่วงความเชื่อมั่นของความแตกต่างนี้จึงแสดงเป็น:
โดยที่ z cr คือค่าที่ได้จากการแจกแจงแบบปกติโดยใช้ตารางพิเศษ (เช่น 1.96 สำหรับช่วงความเชื่อมั่น 95%)
ข้อผิดพลาดมาตรฐานของการประมาณค่าแสดงในกรณีนี้โดยความสัมพันธ์:
.
ตัวอย่าง
ร้านค้ากำลังเตรียมการขายครั้งใหญ่ ได้ทำการวิจัยทางการตลาดดังต่อไปนี้ ผู้ซื้อ 300 อันดับแรกได้รับการคัดเลือกและสุ่มแบ่งออกเป็นสองกลุ่ม กลุ่มละ 150 คน ลูกค้าที่เลือกทั้งหมดได้รับคำเชิญให้เข้าร่วมการขาย แต่มีเพียงสมาชิกของกลุ่มแรกเท่านั้นที่ได้รับคูปองเพื่อรับส่วนลด 5% ในระหว่างการขาย จะมีการบันทึกการซื้อของผู้ซื้อที่เลือกทั้งหมด 300 ราย ผู้จัดการสามารถตีความผลลัพธ์และตัดสินเกี่ยวกับประสิทธิผลของคูปองได้อย่างไร (ดูไฟล์ COUPONS.XLS (เทมเพลตและโซลูชัน))
สารละลาย
สำหรับกรณีเฉพาะของเรา ลูกค้า 150 รายที่ได้รับคูปองส่วนลด 55 รายซื้อสินค้าลดราคา และใน 150 รายที่ไม่ได้รับคูปอง มีเพียง 35 รายที่ซื้อสินค้า (รูปที่ 103)
). จากนั้นค่าสัดส่วนตัวอย่างคือ 0.3667 และ 0.2333 ตามลำดับ และผลต่างตัวอย่างระหว่างพวกมันเท่ากับ 0.1333 ตามลำดับ สมมติว่าช่วงความเชื่อมั่น 95% เราพบจากตารางการแจกแจงแบบปกติ z cr = 1.96 การคำนวณค่าความผิดพลาดมาตรฐานของผลต่างตัวอย่างคือ 0.0524 ในที่สุดเราก็พบว่าขีดจำกัดล่างของช่วงความเชื่อมั่น 95% คือ 0.0307 และขีดจำกัดบนคือ 0.2359 ตามลำดับ ผลลัพธ์ที่ได้สามารถตีความได้ในลักษณะที่ว่าสำหรับลูกค้าทุกๆ 100 รายที่ได้รับคูปองส่วนลด เราสามารถคาดหวังลูกค้าใหม่ได้ตั้งแต่ 3 ถึง 23 ราย อย่างไรก็ตาม เราต้องจำไว้ว่าข้อสรุปนี้ไม่ได้หมายถึงประสิทธิผลของการใช้คูปอง (เนื่องจากการให้ส่วนลด เราจึงสูญเสียกำไร!) มาสาธิตสิ่งนี้ด้วยข้อมูลเฉพาะกัน สมมติว่าขนาดการซื้อเฉลี่ยคือ 400 รูเบิล ซึ่งคือ 50 รูเบิล มีกำไรให้ร้าน. ดังนั้นกำไรที่คาดหวังจากลูกค้า 100 รายที่ไม่ได้รับคูปองคือ:
50 0.2333 100 = 1166.50 ถู
การคำนวณที่คล้ายกันสำหรับลูกค้า 100 รายที่ได้รับคูปองจะให้:
30 0.3667 100 = 1100.10 ถู
กำไรเฉลี่ยที่ลดลงเหลือ 30 อธิบายได้จากข้อเท็จจริงที่ว่าเมื่อใช้ส่วนลด ลูกค้าที่ได้รับคูปองจะซื้อสินค้าโดยเฉลี่ย 380 รูเบิล
ดังนั้นข้อสรุปสุดท้ายบ่งชี้ถึงความไร้ประสิทธิผลของการใช้คูปองดังกล่าวในสถานการณ์เฉพาะนี้
ความคิดเห็น ปัญหานี้สามารถแก้ไขได้โดยใช้เครื่องมือ StatPro มาตรฐาน ในการทำเช่นนี้ ก็เพียงพอแล้วที่จะลดปัญหานี้ให้เหลือเพียงปัญหาการประมาณความแตกต่างระหว่างค่าเฉลี่ยสองค่าโดยใช้วิธีนี้ จากนั้นจึงนำไปใช้ StatPro/การอนุมานทางสถิติ/การวิเคราะห์สองตัวอย่างเพื่อสร้างช่วงความเชื่อมั่นสำหรับผลต่างระหว่างค่าเฉลี่ยสองค่า
การควบคุมความยาวช่วงความเชื่อมั่น
ความยาวของช่วงความเชื่อมั่นขึ้นอยู่กับ เงื่อนไขต่อไปนี้:
ข้อมูลโดยตรง (ส่วนเบี่ยงเบนมาตรฐาน)
ระดับความสำคัญ
ขนาดตัวอย่าง.
ขนาดตัวอย่างในการประมาณค่าเฉลี่ย
ขั้นแรก พิจารณาปัญหาในกรณีทั่วไปก่อน ให้เราแทนค่าของความยาวครึ่งหนึ่งของช่วงความเชื่อมั่นที่มอบให้เราเป็น B (รูปที่ 104
). เรารู้ว่าช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยของตัวแปรสุ่ม X บางตัวแสดงเป็น , ที่ไหน . เชื่อ:
และแสดง n เราจะได้
น่าเสียดายที่เราไม่ทราบค่าที่แน่นอนของความแปรปรวนของตัวแปรสุ่ม X นอกจากนี้ เราไม่ทราบค่าของ tcr เนื่องจากมันขึ้นอยู่กับ n ถึงจำนวนดีกรีอิสระ ในสถานการณ์นี้ เราสามารถทำได้ดังต่อไปนี้ แทนที่จะใช้ความแปรปรวน เราใช้การประมาณค่าความแปรปรวนตามการใช้งานตัวแปรสุ่มที่มีอยู่ภายใต้การศึกษา แทนที่จะใช้ค่า t cr เราใช้ค่า z cr สำหรับการแจกแจงแบบปกติ สิ่งนี้ค่อนข้างยอมรับได้ เนื่องจากฟังก์ชันความหนาแน่นของการแจกแจงสำหรับการแจกแจงแบบปกติและการแจกแจงแบบ t นั้นใกล้เคียงกันมาก (ยกเว้นกรณีของ n เล็ก) ดังนั้นสูตรที่ต้องการจึงอยู่ในรูปแบบ:
.
เนื่องจากสูตรนี้ให้ผลลัพธ์ที่ไม่ใช่จำนวนเต็ม โดยทั่วไปแล้ว การปัดเศษด้วยผลลัพธ์ที่มากเกินไปจึงถือเป็นขนาดตัวอย่างที่ต้องการ
ตัวอย่าง
ร้านอาหารฟาสต์ฟู้ดแห่งนี้วางแผนที่จะขยายประเภทด้วยแซนด์วิชรูปแบบใหม่ เพื่อประเมินความต้องการ ผู้จัดการวางแผนที่จะสุ่มเลือกจำนวนผู้เข้าชมจากผู้ที่ได้ลองใช้แล้ว และขอให้พวกเขาให้คะแนนทัศนคติต่อผลิตภัณฑ์ใหม่ในระดับตั้งแต่ 1 ถึง 10 ผู้จัดการต้องการประมาณ จำนวนคะแนนที่คาดหวังที่ผลิตภัณฑ์ใหม่จะได้รับผลิตภัณฑ์และสร้างช่วงความเชื่อมั่น 95% สำหรับการประมาณการนี้ ในเวลาเดียวกัน เขาต้องการให้ช่วงความเชื่อมั่นครึ่งหนึ่งไม่เกิน 0.3 เขาต้องสัมภาษณ์ผู้เยี่ยมชมกี่คน?
ดังต่อไปนี้:
ที่นี่ โอเคคือค่าประมาณของสัดส่วน p และ B คือค่าครึ่งหนึ่งของความยาวของช่วงความเชื่อมั่น การประมาณค่าสูงเกินไปสำหรับ n สามารถหาได้โดยใช้ค่า โอเค= 0.5. ในกรณีนี้ ความยาวของช่วงความเชื่อมั่นจะไม่เกินค่า B ที่ระบุสำหรับค่าจริงของ p
ตัวอย่าง
ให้ผู้จัดการจากตัวอย่างก่อนหน้านี้วางแผนประมาณส่วนแบ่งของลูกค้าที่ต้องการผลิตภัณฑ์ประเภทใหม่ เขาต้องการสร้างช่วงความเชื่อมั่น 90% โดยมีความยาวครึ่งหนึ่งไม่เกิน 0.05 ควรรวมไคลเอนต์จำนวนเท่าใดในกลุ่มตัวอย่างแบบสุ่ม?
สารละลาย
ในกรณีของเรา ค่า z cr = 1.645 ดังนั้นปริมาณที่ต้องการจึงถูกคำนวณดังนี้ .
หากผู้จัดการมีเหตุผลให้เชื่อได้ว่าค่า p ที่ต้องการคือประมาณ 0.3 ดังนั้น เมื่อแทนค่านี้ลงในสูตรข้างต้น เราจะได้ค่าตัวอย่างสุ่มที่น้อยกว่า ซึ่งก็คือ 228
สูตรในการกำหนด ขนาดตัวอย่างแบบสุ่ม ในกรณีที่มีความแตกต่างระหว่างสองวิธีเขียนเป็น:
.
ตัวอย่าง
บริษัทคอมพิวเตอร์บางแห่งมีศูนย์บริการลูกค้า เมื่อเร็ว ๆ นี้จำนวนข้อร้องเรียนของลูกค้าเกี่ยวกับคุณภาพการบริการที่ไม่ดีเพิ่มขึ้น ศูนย์บริการจ้างพนักงานสองประเภทเป็นหลัก: ผู้ที่ไม่มีประสบการณ์มากนัก แต่สำเร็จการศึกษาหลักสูตรเตรียมความพร้อมพิเศษ และผู้ที่มีประสบการณ์ภาคปฏิบัติอย่างกว้างขวาง แต่ยังไม่จบหลักสูตรพิเศษ บริษัทต้องการวิเคราะห์ข้อร้องเรียนของลูกค้าในช่วง 6 เดือนที่ผ่านมา และเปรียบเทียบจำนวนข้อร้องเรียนโดยเฉลี่ยของพนักงานแต่ละกลุ่มในสองกลุ่ม สันนิษฐานว่าตัวเลขในกลุ่มตัวอย่างทั้งสองกลุ่มจะเท่ากัน ต้องรวมพนักงานกี่คนในกลุ่มตัวอย่างเพื่อให้ได้ช่วง 95% ที่มีความยาวครึ่งหนึ่งไม่เกิน 2
สารละลาย
ในที่นี้ σ ots คือค่าประมาณของค่าเบี่ยงเบนมาตรฐานของตัวแปรสุ่มทั้งสองตัวภายใต้สมมติฐานที่ว่ามันใกล้เคียงกัน ดังนั้นในปัญหาของเรา เราจำเป็นต้องได้ค่าประมาณนี้ ซึ่งสามารถทำได้ดังต่อไปนี้ เมื่อดูข้อมูลข้อร้องเรียนของลูกค้าในช่วงหกเดือนที่ผ่านมา ผู้จัดการอาจสังเกตเห็นว่าโดยทั่วไปพนักงานแต่ละคนได้รับการร้องเรียนตั้งแต่ 6 ถึง 36 เรื่อง เมื่อรู้ว่าสำหรับการแจกแจงแบบปกติค่าเกือบทั้งหมดอยู่ห่างจากค่าเฉลี่ยไม่เกินสามส่วนเบี่ยงเบนมาตรฐาน เขาจึงเชื่อได้อย่างสมเหตุสมผลว่า:
จากที่ σ ots = 5
เราได้แทนค่านี้ลงในสูตร .
สูตรในการกำหนด ขนาดตัวอย่างแบบสุ่ม กรณีประมาณความแตกต่างระหว่างสัดส่วนมีรูปแบบ:
ตัวอย่าง
บริษัทบางแห่งมีโรงงานสองแห่งที่ผลิตสินค้าที่คล้ายคลึงกัน ผู้จัดการบริษัทต้องการเปรียบเทียบเปอร์เซ็นต์ของผลิตภัณฑ์ที่มีข้อบกพร่องในโรงงานทั้งสองแห่ง จากข้อมูลที่มีอยู่ อัตราของเสียที่โรงงานทั้งสองแห่งอยู่ระหว่าง 3 ถึง 5% มีวัตถุประสงค์เพื่อสร้างช่วงความเชื่อมั่น 99% โดยมีความยาวครึ่งหนึ่งไม่เกิน 0.005 (หรือ 0.5%) แต่ละโรงงานต้องเลือกสินค้ากี่รายการ?
สารละลาย
ในที่นี้ p 1ots และ p 2ots เป็นค่าประมาณของข้อบกพร่องที่ไม่ทราบสาเหตุ 2 ส่วนในโรงงานแห่งที่ 1 และ 2 หากเราใส่ p 1ots = p 2ots = 0.5 เราจะได้ค่าที่ประเมินไว้สูงเกินไปสำหรับ n แต่เนื่องจากในกรณีของเรา เรามีข้อมูลเบื้องต้นเกี่ยวกับหุ้นเหล่านี้ เราจึงใช้ค่าประมาณด้านบนของหุ้นเหล่านี้ ซึ่งก็คือ 0.05 เราได้รับ
เมื่อประมาณค่าพารามิเตอร์ประชากรบางตัวจากข้อมูลตัวอย่าง จะมีประโยชน์ที่จะไม่เพียงแต่ให้ค่าประมาณแบบจุดของพารามิเตอร์เท่านั้น แต่ยังให้ช่วงความเชื่อมั่นที่แสดงตำแหน่งที่ค่าที่แน่นอนของพารามิเตอร์ที่ถูกประมาณค่าอาจอยู่อีกด้วย
ในบทนี้ เรายังได้ทำความคุ้นเคยกับความสัมพันธ์เชิงปริมาณที่ช่วยให้เราสามารถสร้างช่วงเวลาดังกล่าวสำหรับพารามิเตอร์ต่างๆ เรียนรู้วิธีควบคุมความยาวของช่วงความเชื่อมั่น
โปรดทราบว่าปัญหาในการประมาณขนาดตัวอย่าง (ปัญหาในการวางแผนการทดลอง) สามารถแก้ไขได้โดยใช้เครื่องมือ StatPro มาตรฐาน กล่าวคือ StatPro/การอนุมานทางสถิติ/การเลือกขนาดตัวอย่าง.
เรามาสร้างช่วงความเชื่อมั่นใน MS EXCEL เพื่อประมาณค่าเฉลี่ยของการแจกแจงในกรณีที่ทราบค่าการกระจายตัว
แน่นอนว่าทางเลือก ระดับความไว้วางใจขึ้นอยู่กับปัญหาที่กำลังแก้ไขโดยสิ้นเชิง ดังนั้นระดับความมั่นใจของผู้โดยสารทางอากาศในความน่าเชื่อถือของเครื่องบินควรสูงกว่าระดับความมั่นใจของผู้ซื้อในความน่าเชื่อถือของหลอดไฟอย่างไม่ต้องสงสัย
การกำหนดปัญหา
ให้เราสันนิษฐานว่าจาก ประชากรได้รับการถ่าย ตัวอย่างขนาด n. สันนิษฐานว่า ส่วนเบี่ยงเบนมาตรฐานการกระจายนี้เป็นที่รู้จัก มีความจำเป็นตามนี้ ตัวอย่างประเมินสิ่งที่ไม่รู้จัก ค่าเฉลี่ยการกระจาย(μ, ) และสร้างค่าที่สอดคล้องกัน สองด้าน ช่วงความมั่นใจ.
การประมาณจุด
ดังที่ได้ทราบมาจาก สถิติ(ลองแสดงว่ามัน เฉลี่ย X) เป็น การประมาณค่าเฉลี่ยอย่างไม่เอนเอียงนี้ ประชากรและมีการกระจายตัว N(μ;σ 2 /n)
บันทึก: จะทำอย่างไรถ้าคุณต้องการสร้าง ช่วงความมั่นใจในกรณีที่มีการกระจายสินค้านั้น ไม่ใช่ ปกติ?ในกรณีนี้มาช่วยซึ่งระบุว่ามีขนาดใหญ่พอสมควร ตัวอย่าง n จากการกระจาย ไม่ได้เป็น ปกติ, การกระจายตัวอย่างสถิติ X เฉลี่ยจะ ประมาณสอดคล้อง การกระจายตัวตามปกติด้วยพารามิเตอร์ N(μ; σ 2 / n)
ดังนั้น, การประมาณจุด เฉลี่ย ค่าการกระจายเรามี - สิ่งนี้ ค่าเฉลี่ยตัวอย่าง, เช่น. เฉลี่ย X. ตอนนี้เรามาเริ่มต้นกัน ช่วงความมั่นใจ
การสร้างช่วงความเชื่อมั่น
โดยปกติ เมื่อทราบการกระจายตัวและพารามิเตอร์แล้ว เราสามารถคำนวณความน่าจะเป็นที่ตัวแปรสุ่มจะนำค่าจากช่วงเวลาที่เราระบุได้ ตอนนี้เรามาทำสิ่งที่ตรงกันข้ามกัน: ค้นหาช่วงเวลาที่ตัวแปรสุ่มจะตกด้วยความน่าจะเป็นที่กำหนด เช่นจากคุณสมบัติ การกระจายตัวตามปกติเป็นที่รู้กันว่าด้วยความน่าจะเป็น 95% ตัวแปรสุ่มจะกระจายไปทั่ว กฎหมายปกติจะตกอยู่ในช่วงประมาณ +/- 2 จาก ค่าเฉลี่ย(ดูบทความเกี่ยวกับ) ช่วงเวลานี้จะทำหน้าที่เป็นต้นแบบสำหรับเรา ช่วงความมั่นใจ.
ทีนี้ลองดูว่าเรารู้การกระจายตัวหรือไม่ , เพื่อคำนวณช่วงเวลานี้? เพื่อตอบคำถาม เราต้องระบุรูปร่างของการแจกแจงและพารามิเตอร์ของมัน
เรารู้รูปแบบการกระจาย - นี่คือ การกระจายตัวตามปกติ(จำไว้ว่าเรากำลังพูดถึง. การกระจายตัวอย่าง สถิติ เฉลี่ย X).
เราไม่รู้จักพารามิเตอร์ μ (เพียงแค่ต้องประมาณโดยใช้ ช่วงความมั่นใจ) แต่เรามีค่าประมาณของมัน X เฉลี่ยคำนวณจาก ตัวอย่าง,ซึ่งสามารถใช้ได้
พารามิเตอร์ที่สอง - ค่าเบี่ยงเบนมาตรฐานของค่าเฉลี่ยตัวอย่าง เราจะถือว่ารู้แล้วมันจะเท่ากับ σ/√n
เพราะ เราไม่รู้ μ จากนั้นเราจะสร้างช่วง +/- 2 ส่วนเบี่ยงเบนมาตรฐานไม่ได้มาจาก ค่าเฉลี่ยและจากการประมาณค่าที่ทราบ เฉลี่ย X. เหล่านั้น. เมื่อคำนวณ ช่วงความมั่นใจเราจะไม่ถือว่า เฉลี่ย Xอยู่ในช่วง +/- 2 ส่วนเบี่ยงเบนมาตรฐานจาก μ ด้วยความน่าจะเป็น 95% และเราจะถือว่าช่วงเวลาคือ +/- 2 ส่วนเบี่ยงเบนมาตรฐานจาก เฉลี่ย Xโดยมีความน่าจะเป็น 95% ที่จะครอบคลุมμ – ค่าเฉลี่ยของประชากรทั่วไปจากที่มันถูกยึดไป ตัวอย่าง. ข้อความทั้งสองนี้เทียบเท่ากัน แต่ข้อความที่สองช่วยให้เราสามารถสร้างได้ ช่วงความมั่นใจ.
นอกจากนี้ ให้เราชี้แจงช่วงเวลา: ตัวแปรสุ่มกระจายไป กฎหมายปกติโดยมีความน่าจะเป็น 95% อยู่ภายในช่วง +/- 1.960 ส่วนเบี่ยงเบนมาตรฐานไม่ใช่ +/- 2 ส่วนเบี่ยงเบนมาตรฐาน. สามารถคำนวณได้โดยใช้สูตร =NORM.ST.REV((1+0.95)/2), ซม. ตัวอย่างไฟล์ Sheet Interval.
ตอนนี้เราสามารถกำหนดข้อความความน่าจะเป็นที่จะช่วยให้เราสร้างได้ ช่วงความมั่นใจ:
“ความน่าจะเป็นนั้น. ค่าเฉลี่ยประชากรตั้งอยู่ห่างจาก ค่าเฉลี่ยตัวอย่างภายใน 1,960" ค่าเบี่ยงเบนมาตรฐานของค่าเฉลี่ยตัวอย่าง"เท่ากับ 95%"
ค่าความน่าจะเป็นที่กล่าวถึงในคำสั่งมีชื่อพิเศษ ซึ่งเกี่ยวข้องกับระดับนัยสำคัญ α (อัลฟา) ด้วยการแสดงออกอย่างง่าย ระดับความไว้วางใจ =1 -α . ในกรณีของเรา ระดับนัยสำคัญ α =1-0,95=0,05 .
ตอนนี้ จากข้อความความน่าจะเป็นนี้ เราเขียนนิพจน์สำหรับการคำนวณ ช่วงความมั่นใจ:
โดยที่ Z α/2 – มาตรฐาน การกระจายตัวตามปกติ(ค่าของตัวแปรสุ่มนี้ z, อะไร ป(z>=ซี α/2 )=α/2).
บันทึก: α/2-ควอนไทล์ตอนบนกำหนดความกว้าง ช่วงความมั่นใจวี ส่วนเบี่ยงเบนมาตรฐาน ค่าเฉลี่ยตัวอย่าง α/2-ควอนไทล์ตอนบน มาตรฐาน การกระจายตัวตามปกติมากกว่า 0 เสมอ ซึ่งสะดวกมาก
ในกรณีของเรา โดยที่ α=0.05 α/2-ควอนไทล์ตอนบน เท่ากับ 1.960 สำหรับระดับนัยสำคัญอื่นๆ α (10%; 1%) α/2-ควอนไทล์ตอนบน ซี α/2 สามารถคำนวณได้โดยใช้สูตร =NORM.ST.REV(1-α/2) หรือหากทราบ ระดับความไว้วางใจ, =NORM.ST.OBR((1+ระดับความน่าเชื่อถือ)/2).
โดยปกติแล้วเมื่อมีการสร้าง ช่วงความเชื่อมั่นสำหรับการประมาณค่าเฉลี่ยใช้เฉพาะ α ตอนบน/2-ปริมาณและอย่าใช้ α ล่าง/2-ปริมาณ. ที่เป็นไปเช่นนี้เพราะว่า มาตรฐาน การกระจายตัวตามปกติอย่างสมมาตรเกี่ยวกับแกน x ( ความหนาแน่นของการกระจายตัวสมมาตรเกี่ยวกับ เฉลี่ยเช่น 0). ดังนั้นจึงไม่จำเป็นต้องคำนวณ α/2-ควอนไทล์ที่ต่ำกว่า(เรียกง่ายๆ ว่า α /2-ควอนไทล์), เพราะ มันเท่าเทียมกัน α ตอนบน/2-ปริมาณมีเครื่องหมายลบ
ขอให้เราจำไว้ว่าแม้จะมีรูปร่างของการแจกแจงของค่า x แต่ตัวแปรสุ่มที่สอดคล้องกัน เฉลี่ย Xกระจาย ประมาณ ดี N(μ;σ 2 /n) (ดูบทความเกี่ยวกับ) ดังนั้น โดยทั่วไปแล้ว นิพจน์ข้างต้นสำหรับ ช่วงความมั่นใจเป็นเพียงการประมาณเท่านั้น ถ้าค่า x ถูกกระจายไป กฎหมายปกติ N(μ;σ 2 /n) จากนั้นนิพจน์สำหรับ ช่วงความมั่นใจมีความแม่นยำ
การคำนวณช่วงความเชื่อมั่นใน MS EXCEL
มาแก้ปัญหากันเถอะ
เวลาตอบสนองของชิ้นส่วนอิเล็กทรอนิกส์ต่อสัญญาณอินพุตเป็นคุณลักษณะที่สำคัญของอุปกรณ์ วิศวกรต้องการสร้างช่วงความเชื่อมั่นสำหรับเวลาตอบสนองโดยเฉลี่ยที่ระดับความเชื่อมั่น 95% จากประสบการณ์ก่อนหน้านี้ วิศวกรรู้ว่าค่าเบี่ยงเบนมาตรฐานของเวลาตอบสนองคือ 8 ms เป็นที่ทราบกันดีว่าในการประเมินเวลาตอบสนองวิศวกรทำการวัด 25 ครั้งค่าเฉลี่ยคือ 78 มิลลิวินาที
สารละลาย: วิศวกรต้องการทราบเวลาตอบสนองของอุปกรณ์อิเล็กทรอนิกส์ แต่เขาเข้าใจว่าเวลาตอบสนองไม่ใช่ค่าคงที่ แต่เป็นตัวแปรสุ่มที่มีการแจกแจงของตัวเอง ดังนั้น สิ่งที่ดีที่สุดที่เขาหวังได้คือการกำหนดพารามิเตอร์และรูปร่างของการแจกแจงนี้
น่าเสียดายที่จากเงื่อนไขของปัญหา เราไม่ทราบรูปแบบของการกระจายเวลาตอบสนอง (ไม่จำเป็นต้องเป็นเช่นนั้น ปกติ). การกระจายนี้ไม่เป็นที่รู้จักเช่นกัน มีเพียงเขาเท่านั้นที่รู้ ส่วนเบี่ยงเบนมาตรฐานσ=8. ดังนั้นในขณะที่เราไม่สามารถคำนวณความน่าจะเป็นและสร้างได้ ช่วงความมั่นใจ.
อย่างไรก็ตามถึงแม้ว่าเราจะไม่ทราบการกระจายตัวก็ตาม เวลา การตอบสนองที่แยกจากกันเรารู้ว่าตามนั้น พท, การกระจายตัวอย่าง เวลาตอบสนองโดยเฉลี่ยอยู่ที่ประมาณ ปกติ(เราจะถือว่าเงื่อนไขนั้น พทจะดำเนินการเพราะว่า ขนาด ตัวอย่างค่อนข้างใหญ่ (n=25)) .
นอกจากนี้, เฉลี่ยการกระจายตัวนี้จะเท่ากับ ค่าเฉลี่ยการกระจายคำตอบเดียวเช่น ม. ก ส่วนเบี่ยงเบนมาตรฐานของการแจกแจงนี้ (σ/√n) สามารถคำนวณได้โดยใช้สูตร =8/ROOT(25)
เป็นที่รู้กันว่าวิศวกรได้รับ การประมาณจุดพารามิเตอร์ μ เท่ากับ 78 ms (X เฉลี่ย) ดังนั้นตอนนี้เราสามารถคำนวณความน่าจะเป็นได้แล้วเพราะว่า เรารู้รูปแบบการกระจาย ( ปกติ) และพารามิเตอร์ของมัน (X avg และ σ/√n)
วิศวกรอยากทราบว่า มูลค่าที่คาดหวังμ การกระจายเวลาตอบสนอง ตามที่ระบุไว้ข้างต้น μ นี้เท่ากับ ความคาดหวังทางคณิตศาสตร์ของการกระจายตัวอย่างของเวลาตอบสนองโดยเฉลี่ย. หากเราใช้ การกระจายตัวตามปกติ N(X avg; σ/√n) ดังนั้น μ ที่ต้องการจะอยู่ในช่วง +/-2*σ/√n โดยมีความน่าจะเป็นประมาณ 95%
ระดับความสำคัญเท่ากับ 1-0.95=0.05
สุดท้ายเราลองหาขอบซ้ายและขวากัน ช่วงความมั่นใจ.
ขอบซ้าย: =78-NORM.ST.REV(1-0.05/2)*8/รูท(25) =
74,864
ขอบขวา: =78+NORM.ST.INV(1-0.05/2)*8/รูท(25)=81.136
ขอบซ้าย: =NORM.REV(0.05/2; 78; 8/รูท(25))
ขอบขวา: =NORM.REV(1-0.05/2; 78; 8/รูท(25))
คำตอบ: ช่วงความมั่นใจที่ ระดับความเชื่อมั่น 95% และ σ=8มิลลิวินาทีเท่ากับ 78+/-3.136 มิลลิวินาที
ใน ไฟล์ตัวอย่างบนแผ่น Sigmaรู้จักสร้างแบบฟอร์มการคำนวณและการก่อสร้าง สองด้าน ช่วงความมั่นใจโดยพลการ ตัวอย่างโดยให้ σ และ ระดับความสำคัญ.
ฟังก์ชัน CONFIDENCE.NORM()
หากมีค่า ตัวอย่างอยู่ในช่วง B20:B79
, ก ระดับนัยสำคัญเท่ากับ 0.05; จากนั้นสูตร MS EXCEL:
=ค่าเฉลี่ย(B20:B79)-CONFIDENCE.NORM(0.05;σ; COUNT(B20:B79))
จะกลับขอบด้านซ้าย ช่วงความมั่นใจ.
ขีดจำกัดเดียวกันสามารถคำนวณได้โดยใช้สูตร:
=ค่าเฉลี่ย(B20:B79)-NORM.ST.REV(1-0.05/2)*σ/ROOT(COUNT(B20:B79))
บันทึก: ฟังก์ชัน CONFIDENCE.NORM() ปรากฏใน MS EXCEL 2010 ใน MS EXCEL เวอร์ชันก่อนหน้านี้ ฟังก์ชัน TRUST() ถูกนำมาใช้
"Katren-Style" ยังคงตีพิมพ์ซีรีส์เกี่ยวกับสถิติทางการแพทย์ของ Konstantin Kravchik ต่อไป ในบทความสองบทความก่อนหน้านี้ ผู้เขียนได้กล่าวถึงคำอธิบายแนวคิดต่างๆ เช่น และ
คอนสแตนติน คราฟชิค
นักคณิตศาสตร์-นักวิเคราะห์ ผู้เชี่ยวชาญด้านการวิจัยทางสถิติด้านการแพทย์และมนุษยศาสตร์
เมืองมอสโก
บ่อยครั้งในบทความเกี่ยวกับการศึกษาทางคลินิก คุณจะพบวลีลึกลับ: “ช่วงความมั่นใจ” (95 % CI หรือ 95 % CI - ช่วงความมั่นใจ) ตัวอย่างเช่น บทความอาจเขียนว่า "เพื่อประเมินความสำคัญของความแตกต่าง การทดสอบของนักเรียนใช้ในการคำนวณช่วงความเชื่อมั่น 95 %"
ค่าของ “ช่วงความเชื่อมั่น 95 %” คืออะไร และเหตุใดจึงต้องคำนวณ
ช่วงความเชื่อมั่นคืออะไร? - นี่คือช่วงที่ประชากรที่แท้จริงหมายถึงการโกหก มีค่าเฉลี่ยที่ "ไม่จริง" หรือไม่? ในแง่หนึ่งใช่พวกเขาทำ ใน เราอธิบายว่าเป็นไปไม่ได้ที่จะวัดพารามิเตอร์ที่สนใจในประชากรทั้งหมด ดังนั้นนักวิจัยจึงพอใจกับกลุ่มตัวอย่างที่มีจำกัด ในตัวอย่างนี้ (เช่น ตามน้ำหนักตัว) มีค่าเฉลี่ยหนึ่งค่า (น้ำหนักที่แน่นอน) ซึ่งเราจะตัดสินค่าเฉลี่ยในประชากรทั้งหมด อย่างไรก็ตาม ไม่น่าเป็นไปได้ที่น้ำหนักเฉลี่ยในกลุ่มตัวอย่าง (โดยเฉพาะกลุ่มที่มีขนาดเล็ก) จะตรงกับน้ำหนักเฉลี่ยในประชากรทั่วไป ดังนั้นจึงถูกต้องกว่าในการคำนวณและใช้ช่วงค่าเฉลี่ยของประชากร
ตัวอย่างเช่น จินตนาการว่าช่วงความเชื่อมั่น 95% (95% CI) สำหรับฮีโมโกลบินคือ 110 ถึง 122 กรัม/ลิตร ซึ่งหมายความว่ามีโอกาส 95% ที่ค่าฮีโมโกลบินเฉลี่ยที่แท้จริงในประชากรจะอยู่ระหว่าง 110 ถึง 122 กรัม/ลิตร กล่าวอีกนัยหนึ่งเราไม่ทราบค่าฮีโมโกลบินเฉลี่ยในประชากร แต่ด้วยความน่าจะเป็น 95 % เราสามารถระบุช่วงของค่าสำหรับคุณลักษณะนี้ได้
ช่วงความเชื่อมั่นมีความเกี่ยวข้องอย่างยิ่งกับความแตกต่างในค่าเฉลี่ยระหว่างกลุ่ม หรือขนาดผลกระทบเมื่อมีการเรียก
สมมติว่าเราเปรียบเทียบประสิทธิภาพของการเตรียมธาตุเหล็กสองชนิด: ชนิดหนึ่งที่มีอยู่ในตลาดมาเป็นเวลานานและอีกชนิดที่เพิ่งได้รับการขึ้นทะเบียน หลังจากการบำบัด เราได้ประเมินความเข้มข้นของฮีโมโกลบินในกลุ่มผู้ป่วยที่ทำการศึกษา และโปรแกรมทางสถิติได้คำนวณว่าความแตกต่างระหว่างค่าเฉลี่ยของทั้งสองกลุ่มมีความน่าจะเป็น 95 % ในช่วงตั้งแต่ 1.72 ถึง 14.36 กรัม/ลิตร (ตารางที่ 1)
โต๊ะ 1. ทดสอบตัวอย่างอิสระ
(กลุ่มถูกเปรียบเทียบตามระดับฮีโมโกลบิน)
ควรตีความดังนี้ ในผู้ป่วยบางรายในประชากรทั่วไปที่รับประทานยาใหม่ ฮีโมโกลบินจะสูงกว่าโดยเฉลี่ย 1.72–14.36 กรัม/ลิตร มากกว่าในผู้ป่วยที่รับประทานยาที่ทราบอยู่แล้ว
กล่าวอีกนัยหนึ่ง ในประชากรทั่วไป ความแตกต่างของค่าฮีโมโกลบินเฉลี่ยระหว่างกลุ่มอยู่ภายในขีดจำกัดเหล่านี้โดยมีความน่าจะเป็น 95% ขึ้นอยู่กับผู้วิจัยที่จะตัดสินว่ามากหรือน้อย ประเด็นทั้งหมดก็คือ เราไม่ได้ทำงานกับค่าเฉลี่ยเพียงค่าเดียว แต่ด้วยช่วงของค่า ดังนั้นเราจึงประมาณค่าความแตกต่างในพารามิเตอร์ระหว่างกลุ่มได้อย่างน่าเชื่อถือมากขึ้น
ในแพ็คเกจทางสถิติ คุณสามารถจำกัดหรือขยายขอบเขตของช่วงความเชื่อมั่นได้โดยขึ้นอยู่กับดุลยพินิจของผู้วิจัย การลดความน่าจะเป็นของช่วงความเชื่อมั่นจะทำให้ช่วงของค่าเฉลี่ยแคบลง ตัวอย่างเช่น ที่ 90 % CI ช่วงของค่าเฉลี่ย (หรือความแตกต่างในค่าเฉลี่ย) จะแคบกว่าที่ 95 %
ในทางกลับกัน การเพิ่มความน่าจะเป็นเป็น 99 % จะทำให้ช่วงของค่ากว้างขึ้น เมื่อทำการเปรียบเทียบกลุ่ม ขีดจำกัดล่างของ CI อาจข้ามเครื่องหมายศูนย์ ตัวอย่างเช่น ถ้าเราขยายขอบเขตของช่วงความเชื่อมั่นเป็น 99 % ขอบเขตของช่วงความเชื่อมั่นจะอยู่ในช่วงตั้งแต่ –1 ถึง 16 กรัม/ลิตร ซึ่งหมายความว่าในประชากรทั่วไปมีกลุ่มต่างๆ ซึ่งความแตกต่างระหว่างค่าเฉลี่ยสำหรับคุณลักษณะที่กำลังศึกษาคือ 0 (M = 0)
คุณสามารถทดสอบสมมติฐานทางสถิติได้โดยใช้ช่วงความเชื่อมั่น ถ้าช่วงความเชื่อมั่นข้ามค่าศูนย์ สมมุติฐานว่างซึ่งถือว่ากลุ่มไม่แตกต่างกันตามพารามิเตอร์ที่กำลังศึกษาจะเป็นจริง ตัวอย่างอธิบายไว้ข้างต้นโดยที่เราขยายขอบเขตเป็น 99 % ที่ไหนสักแห่งในประชากรทั่วไปเราพบกลุ่มที่ไม่แตกต่างกันแต่อย่างใด
ช่วงความเชื่อมั่น 95% ของความแตกต่างในฮีโมโกลบิน (กรัม/ลิตร)
รูปนี้แสดงช่วงความเชื่อมั่น 95% สำหรับความแตกต่างของค่าฮีโมโกลบินเฉลี่ยระหว่างทั้งสองกลุ่ม เส้นตรงลากผ่านเครื่องหมายศูนย์ ดังนั้นจึงมีความแตกต่างระหว่างค่าเฉลี่ยของศูนย์ ซึ่งยืนยันสมมติฐานว่างที่ว่ากลุ่มต่างๆ ไม่ได้แตกต่างกัน ช่วงความแตกต่างระหว่างกลุ่มคือตั้งแต่ –2 ถึง 5 กรัม/ลิตร ซึ่งหมายความว่าฮีโมโกลบินสามารถลดลง 2 กรัม/ลิตรหรือเพิ่มขึ้น 5 กรัม/ลิตร
ช่วงความเชื่อมั่นเป็นตัวบ่งชี้ที่สำคัญมาก ด้วยเหตุนี้ คุณจะสามารถดูได้ว่าความแตกต่างในกลุ่มนั้นจริงๆ แล้วเกิดจากความแตกต่างในวิธีการหรือเนื่องจากกลุ่มตัวอย่างขนาดใหญ่ เนื่องจากกลุ่มตัวอย่างขนาดใหญ่โอกาสในการค้นหาความแตกต่างมีมากกว่ากลุ่มตัวอย่างขนาดเล็ก
ในทางปฏิบัติอาจมีลักษณะเช่นนี้ เราสุ่มตัวอย่างจากคน 1,000 คน วัดระดับฮีโมโกลบิน และพบว่าช่วงความเชื่อมั่นสำหรับความแตกต่างในค่าเฉลี่ยอยู่ระหว่าง 1.2 ถึง 1.5 กรัม/ลิตร ระดับนัยสำคัญทางสถิติในกรณีนี้ p
เราเห็นว่าความเข้มข้นของฮีโมโกลบินเพิ่มขึ้น แต่แทบจะมองไม่เห็น ดังนั้นนัยสำคัญทางสถิติจึงปรากฏอย่างแม่นยำเนื่องจากขนาดตัวอย่าง
ช่วงความเชื่อมั่นสามารถคำนวณได้ไม่เพียงแต่สำหรับวิธีการเท่านั้น แต่ยังรวมถึงสัดส่วน (และอัตราส่วนความเสี่ยง) ด้วย ตัวอย่างเช่น เราสนใจช่วงความเชื่อมั่นของสัดส่วนของผู้ป่วยที่ได้รับการบรรเทาอาการขณะรับประทานยาที่พัฒนาแล้ว ให้เราสมมติว่า 95 % CI สำหรับสัดส่วน เช่น สำหรับสัดส่วนของผู้ป่วยดังกล่าว อยู่ในช่วง 0.60–0.80 ดังนั้น เราสามารถพูดได้ว่ายาของเรามีผลการรักษาในกรณี 60 ถึง 80 %
การประมาณค่าทางสถิติมีสองประเภท: จุดและช่วง การประมาณจุดคือสถิติตัวอย่างเดียวที่ใช้ในการประมาณค่าพารามิเตอร์ประชากร เช่น ค่าเฉลี่ยตัวอย่าง คือค่าประมาณแบบจุดของความคาดหวังทางคณิตศาสตร์ของประชากร และความแปรปรวนของกลุ่มตัวอย่าง เอส 2- การประมาณจุดของความแปรปรวนของประชากร ซิ 2. แสดงให้เห็นว่าค่าเฉลี่ยของกลุ่มตัวอย่างเป็นการประมาณค่าความคาดหวังทางคณิตศาสตร์ของประชากรอย่างเป็นกลาง ค่าเฉลี่ยตัวอย่างเรียกว่าเป็นกลาง เนื่องจากค่าเฉลี่ยของค่าเฉลี่ยตัวอย่างทั้งหมด (ที่มีขนาดตัวอย่างเท่ากัน) n) เท่ากับค่าคาดหวังทางคณิตศาสตร์ของประชากรทั่วไป
เพื่อให้เกิดความแปรปรวนตัวอย่าง เอส 2กลายเป็นการประมาณค่าความแปรปรวนของประชากรอย่างเป็นกลาง ซิ 2ควรตั้งค่าตัวส่วนของความแปรปรวนตัวอย่างให้เท่ากับ n – 1 , แต่ไม่ n. กล่าวอีกนัยหนึ่ง ความแปรปรวนของประชากรคือค่าเฉลี่ยของความแปรปรวนตัวอย่างที่เป็นไปได้ทั้งหมด
เมื่อประมาณค่าพารามิเตอร์ประชากร ควรคำนึงถึงสถิติตัวอย่าง เช่น ขึ้นอยู่กับตัวอย่างเฉพาะ เพื่อคำนึงถึงข้อเท็จจริงนี้เพื่อรับ การประมาณช่วงความคาดหวังทางคณิตศาสตร์ของประชากรทั่วไป วิเคราะห์การกระจายตัวของค่าเฉลี่ยตัวอย่าง (ดูรายละเอียดเพิ่มเติม) ช่วงที่สร้างขึ้นนั้นมีลักษณะเฉพาะด้วยระดับความเชื่อมั่นที่แน่นอน ซึ่งแสดงถึงความน่าจะเป็นที่พารามิเตอร์ประชากรจริงจะถูกประมาณอย่างถูกต้อง ช่วงความเชื่อมั่นที่คล้ายกันสามารถใช้เพื่อประมาณสัดส่วนของคุณลักษณะได้ รและมวลกระจายหลักของประชากร
ดาวน์โหลดบันทึกในรูปแบบหรือตัวอย่างในรูปแบบ
การสร้างช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์ของประชากรที่มีค่าเบี่ยงเบนมาตรฐานที่ทราบ
การสร้างช่วงความเชื่อมั่นสำหรับส่วนแบ่งของคุณลักษณะในประชากร
ส่วนนี้จะขยายแนวคิดเรื่องช่วงความเชื่อมั่นไปสู่ข้อมูลที่เป็นหมวดหมู่ สิ่งนี้ช่วยให้เราสามารถประมาณส่วนแบ่งของลักษณะเฉพาะในประชากรได้ รโดยใช้การแชร์ตัวอย่าง รส= เอ็กซ์/n. ตามที่ระบุหากมีปริมาณ nรและ n(1 – หน้า)เกินเลข 5 การแจกแจงแบบทวินามสามารถประมาณได้ตามปกติ ดังนั้นเพื่อประมาณส่วนแบ่งของลักษณะเฉพาะในประชากร รสามารถสร้างช่วงที่มีระดับความเชื่อมั่นเท่ากับได้ (1 – α)х100%.
ที่ไหน พีส- สัดส่วนตัวอย่างลักษณะเท่ากับ เอ็กซ์/n, เช่น. จำนวนความสำเร็จหารด้วยขนาดตัวอย่าง ร- ส่วนแบ่งของลักษณะในประชากรทั่วไป ซี- ค่าวิกฤตของการแจกแจงแบบปกติมาตรฐาน n- ขนาดตัวอย่าง.
ตัวอย่างที่ 3สมมติว่าตัวอย่างที่ประกอบด้วยใบแจ้งหนี้ 100 ใบที่กรอกในช่วงเดือนที่แล้วถูกแยกออกจากระบบข้อมูล สมมติว่าใบแจ้งหนี้ทั้ง 10 ใบถูกรวบรวมโดยมีข้อผิดพลาด ดังนั้น, ร= 10/100 = 0.1 ระดับความเชื่อมั่น 95% สอดคล้องกับค่าวิกฤต Z = 1.96
ดังนั้น ความน่าจะเป็นที่ระหว่าง 4.12% ถึง 15.88% ของใบแจ้งหนี้มีข้อผิดพลาดคือ 95%
สำหรับขนาดตัวอย่างที่กำหนด ช่วงความเชื่อมั่นที่มีสัดส่วนของลักษณะเฉพาะในประชากรจะปรากฏกว้างกว่าตัวแปรสุ่มแบบต่อเนื่อง เนื่องจากการวัดตัวแปรสุ่มแบบต่อเนื่องมีข้อมูลมากกว่าการวัดข้อมูลเชิงหมวดหมู่ กล่าวอีกนัยหนึ่งข้อมูลหมวดหมู่ที่รับเพียงสองค่าจะมีข้อมูลไม่เพียงพอที่จะประมาณค่าพารามิเตอร์ของการแจกแจง
ในการคำนวณค่าประมาณที่ดึงมาจากประชากรจำนวนจำกัด
การประมาณค่าความคาดหวังทางคณิตศาสตร์ปัจจัยแก้ไขสำหรับประชากรสุดท้าย ( เอฟพีซี) ถูกนำมาใช้เพื่อลดข้อผิดพลาดมาตรฐานตามปัจจัย เมื่อคำนวณช่วงความเชื่อมั่นสำหรับการประมาณค่าพารามิเตอร์ประชากร ปัจจัยการแก้ไขจะถูกใช้ในสถานการณ์ที่มีการเก็บตัวอย่างโดยไม่ถูกส่งกลับ ดังนั้น ช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์ที่มีระดับความเชื่อมั่นเท่ากับ (1 – α)х100%คำนวณโดยสูตร:
ตัวอย่างที่ 4เพื่อแสดงให้เห็นการใช้ปัจจัยแก้ไขสำหรับประชากรที่มีจำกัด ขอให้เรากลับไปสู่ปัญหาในการคำนวณช่วงความเชื่อมั่นสำหรับจำนวนใบแจ้งหนี้โดยเฉลี่ย ตามที่กล่าวไว้ข้างต้นในตัวอย่างที่ 3 สมมติว่าบริษัทออกใบแจ้งหนี้ 5,000 ใบต่อเดือน และ เอ็กซ์=110.27 ดอลลาร์ ส= $28.95, เอ็น = 5000, n = 100, α = 0.05, ที 99 = 1.9842 การใช้สูตร (6) เราได้รับ:
การประมาณส่วนแบ่งของฟีเจอร์เมื่อเลือกโดยไม่ส่งคืน ช่วงความเชื่อมั่นสำหรับสัดส่วนของคุณลักษณะที่มีระดับความเชื่อมั่นเท่ากับ (1 – α)х100%คำนวณโดยสูตร:
ช่วงความเชื่อมั่นและประเด็นทางจริยธรรม
เมื่อทำการสุ่มตัวอย่างประชากรและทำการสรุปทางสถิติ มักจะเกิดปัญหาด้านจริยธรรมเกิดขึ้น สิ่งสำคัญคือช่วงความเชื่อมั่นและการประมาณค่าจุดของสถิติตัวอย่างสอดคล้องกันอย่างไร การเผยแพร่การประมาณจุดโดยไม่ระบุช่วงความเชื่อมั่นที่เกี่ยวข้อง (โดยปกติจะอยู่ที่ระดับความเชื่อมั่น 95%) และขนาดตัวอย่างที่ได้รับมาอาจทำให้เกิดความสับสนได้ สิ่งนี้อาจทำให้ผู้ใช้รู้สึกว่าการประมาณจุดเป็นสิ่งที่เขาต้องการในการทำนายคุณสมบัติของประชากรทั้งหมด ดังนั้นจึงจำเป็นต้องเข้าใจว่าในการวิจัยใดๆ ไม่ควรเน้นที่การประมาณจุด แต่เป็นการประมาณช่วง นอกจากนี้ควรให้ความใส่ใจเป็นพิเศษกับการเลือกขนาดตัวอย่างที่ถูกต้อง
บ่อยครั้งที่เป้าหมายของการจัดการทางสถิติเป็นผลมาจากการสำรวจทางสังคมวิทยาของประชากรในประเด็นทางการเมืองบางอย่าง ในเวลาเดียวกัน ผลการสำรวจจะถูกตีพิมพ์บนหน้าแรกของหนังสือพิมพ์ และข้อผิดพลาดในการสุ่มตัวอย่างและวิธีการวิเคราะห์ทางสถิติจะถูกตีพิมพ์ที่ไหนสักแห่งตรงกลาง เพื่อพิสูจน์ความถูกต้องของการประมาณค่าจุดที่ได้รับ จำเป็นต้องระบุขนาดตัวอย่างตามที่ได้รับ ขอบเขตของช่วงความเชื่อมั่น และระดับนัยสำคัญ
หมายเหตุถัดไป
สื่อจากหนังสือ Levin และคณะ ใช้สถิติสำหรับผู้จัดการ – อ.: วิลเลียมส์, 2004. – หน้า. 448–462
ทฤษฎีบทขีดจำกัดกลางระบุว่าด้วยขนาดตัวอย่างที่ใหญ่เพียงพอ การกระจายตัวของค่าเฉลี่ยของตัวอย่างสามารถประมาณได้โดยการแจกแจงแบบปกติ คุณสมบัตินี้ไม่ขึ้นอยู่กับประเภทของการกระจายตัวของประชากร