ช่วงความเชื่อมั่นมาตรฐาน ช่วงความเชื่อมั่นสำหรับการประมาณค่าเฉลี่ย (ทราบความแปรปรวน) ใน MS EXCEL

ตัวอย่างใดๆ ให้เพียงแนวคิดโดยประมาณของประชากรทั่วไป และคุณลักษณะทางสถิติของกลุ่มตัวอย่างทั้งหมด (ค่าเฉลี่ย โหมด ความแปรปรวน...) เป็นเพียงการประมาณบางส่วนหรือพูดเป็นค่าประมาณของพารามิเตอร์ทั่วไป ซึ่งในกรณีส่วนใหญ่ไม่สามารถคำนวณได้เนื่องจาก การเข้าถึงไม่ได้ของประชาชนทั่วไป (รูปที่ 20)

รูปที่ 20. ข้อผิดพลาดในการสุ่มตัวอย่าง

แต่คุณสามารถระบุช่วงเวลาที่ค่าจริง (ทั่วไป) ของคุณลักษณะทางสถิติอยู่ได้ในระดับความน่าจะเป็นหนึ่ง ช่วงเวลานี้เรียกว่า ช่วงความเชื่อมั่น (CI)

ดังนั้นค่าเฉลี่ยทั่วไปที่มีความน่าจะเป็น 95% จึงอยู่ภายใน

จากถึง (20)

ที่ไหน ที – ค่าตารางของการทดสอบของนักเรียนสำหรับ α =0.05 และ = n-1

ในกรณีนี้ CI สามารถพบได้ 99% ที เลือกสำหรับ α =0,01.

ความสำคัญเชิงปฏิบัติของช่วงความเชื่อมั่นคืออะไร?

    ช่วงความเชื่อมั่นที่กว้างบ่งชี้ว่าค่าเฉลี่ยตัวอย่างไม่ได้สะท้อนถึงค่าเฉลี่ยประชากรอย่างแม่นยำ ซึ่งมักเกิดจากการมีขนาดตัวอย่างไม่เพียงพอ หรือความหลากหลาย เช่น การกระจายตัวขนาดใหญ่ ทั้งคู่ให้ค่าคลาดเคลื่อนที่มากกว่าของค่าเฉลี่ยและด้วยเหตุนี้ CI ที่กว้างขึ้น และนี่คือพื้นฐานในการกลับเข้าสู่ขั้นตอนการวางแผนการวิจัย

    ขีดจำกัดบนและล่างของ CI เป็นการประมาณว่าผลลัพธ์จะมีนัยสำคัญทางคลินิกหรือไม่

ให้เราอาศัยอยู่ในรายละเอียดเกี่ยวกับคำถามเกี่ยวกับนัยสำคัญทางสถิติและทางคลินิกของผลการศึกษาคุณสมบัติของกลุ่ม ให้เราจำไว้ว่าหน้าที่ของสถิติคือการตรวจจับความแตกต่างบางอย่างในประชากรทั่วไปเป็นอย่างน้อยโดยพิจารณาจากข้อมูลตัวอย่าง ความท้าทายสำหรับแพทย์คือการตรวจหาความแตกต่าง (ไม่ใช่แค่ข้อแตกต่าง) ที่จะช่วยในการวินิจฉัยหรือการรักษา และข้อสรุปทางสถิติก็ไม่ใช่พื้นฐานสำหรับข้อสรุปทางคลินิกเสมอไป ดังนั้นการลดลงของฮีโมโกลบินอย่างมีนัยสำคัญทางสถิติ 3 กรัม/ลิตรจึงไม่ทำให้เกิดความกังวล และในทางกลับกัน หากปัญหาบางอย่างในร่างกายมนุษย์ไม่แพร่หลายในระดับประชากรทั้งหมด ก็ไม่ใช่เหตุผลที่จะไม่จัดการกับปัญหานี้

ลองดูสถานการณ์นี้ ตัวอย่าง.

นักวิจัยสงสัยว่าเด็กผู้ชายที่ป่วยด้วยโรคติดเชื้อบางประเภทจะล้าหลังกว่าเพื่อนในการเติบโตหรือไม่ เพื่อจุดประสงค์นี้ ได้ทำการศึกษาตัวอย่างโดยนำเด็กชาย 10 คนที่ป่วยด้วยโรคนี้เข้าร่วม ผลลัพธ์แสดงไว้ในตารางที่ 23

ตารางที่ 23. ผลลัพธ์ของการประมวลผลทางสถิติ

ขีดจำกัดล่าง

ขีด จำกัด บน

มาตรฐาน (ซม.)

เฉลี่ย

จากการคำนวณเหล่านี้ พบว่าส่วนสูงเฉลี่ยของกลุ่มตัวอย่างเด็กชายอายุ 10 ขวบที่ป่วยด้วยโรคติดเชื้อบางชนิดอยู่ในเกณฑ์ใกล้เคียงปกติ (132.5 ซม.) อย่างไรก็ตาม ขีดจำกัดล่างของช่วงความเชื่อมั่น (126.6 ซม.) บ่งชี้ว่ามีความน่าจะเป็น 95% ที่ความสูงเฉลี่ยที่แท้จริงของเด็กเหล่านี้สอดคล้องกับแนวคิดเรื่อง "ส่วนสูงสั้น" กล่าวคือ เด็กเหล่านี้แคระแกรน

ในตัวอย่างนี้ ผลลัพธ์ของการคำนวณช่วงความเชื่อมั่นมีความสำคัญทางคลินิก

การประมาณค่าช่วงความเชื่อมั่น

วัตถุประสงค์การเรียนรู้

สถิติพิจารณาสิ่งต่อไปนี้ สองงานหลัก:

    เรามีค่าประมาณจากข้อมูลตัวอย่าง และเราต้องการสร้างข้อความความน่าจะเป็นว่าค่าที่แท้จริงของพารามิเตอร์ประมาณนั้นอยู่ที่ใด

    เรามีสมมติฐานเฉพาะที่ต้องทดสอบโดยใช้ข้อมูลตัวอย่าง

ในหัวข้อนี้เราจะพิจารณางานแรก ให้เราแนะนำคำจำกัดความของช่วงความเชื่อมั่นด้วย

ช่วงความเชื่อมั่นคือช่วงที่สร้างขึ้นรอบๆ ค่าประมาณของพารามิเตอร์ และแสดงตำแหน่งที่ค่าจริงของพารามิเตอร์โดยประมาณอยู่ด้วยความน่าจะเป็นที่ระบุตามลำดับความสำคัญ

หลังจากศึกษาเนื้อหาในหัวข้อนี้แล้ว คุณ:

    เรียนรู้ว่าช่วงความเชื่อมั่นสำหรับการประมาณค่าคืออะไร

    เรียนรู้การจำแนกปัญหาทางสถิติ

    เชี่ยวชาญเทคนิคการสร้างช่วงความเชื่อมั่นทั้งโดยใช้สูตรทางสถิติและการใช้เครื่องมือซอฟต์แวร์

    เรียนรู้ที่จะกำหนดขนาดตัวอย่างที่ต้องการเพื่อให้ได้พารามิเตอร์ความแม่นยำของการประมาณการทางสถิติ

การกระจายตัวของลักษณะตัวอย่าง

T-การกระจาย

ตามที่กล่าวไว้ข้างต้น การแจกแจงของตัวแปรสุ่มนั้นใกล้เคียงกับการแจกแจงแบบปกติมาตรฐานด้วยพารามิเตอร์ 0 และ 1 เนื่องจากเราไม่ทราบค่าของ σ เราจึงแทนที่มันด้วยการประมาณค่า s ปริมาณมีการกระจายที่แตกต่างกันอยู่แล้วคือหรือ การกระจายตัวของนักเรียนซึ่งถูกกำหนดโดยพารามิเตอร์ n -1 (จำนวนองศาอิสระ) การแจกแจงนี้ใกล้เคียงกับการแจกแจงแบบปกติ (ยิ่ง n ยิ่งมาก การแจกแจงก็จะยิ่งใกล้มากขึ้น)

ในรูป 95
นำเสนอการกระจายตัวของนักเรียนที่มีระดับความอิสระ 30 องศา อย่างที่คุณเห็น มันใกล้เคียงกับการกระจายตัวแบบปกติมาก

คล้ายกับฟังก์ชันสำหรับการทำงานกับการแจกแจงแบบปกติ NORMIDIST และ NORMINV มีฟังก์ชันสำหรับการทำงานกับการแจกแจงแบบ t - STUDIST (TDIST) และ สตูดราซอร์ (TINV). ตัวอย่างของการใช้ฟังก์ชันเหล่านี้สามารถดูได้ในไฟล์ STUDRASP.XLS (เทมเพลตและโซลูชัน) และในรูปที่ 1 96
.

การกระจายลักษณะอื่น ๆ

ดังที่เราทราบแล้วว่า เพื่อกำหนดความแม่นยำในการประมาณค่าความคาดหวังทางคณิตศาสตร์ เราจำเป็นต้องมีการแจกแจงแบบ t ในการประมาณค่าพารามิเตอร์อื่นๆ เช่น ความแปรปรวน จำเป็นต้องมีการแจกแจงที่แตกต่างกัน สองในนั้นคือการแจกแจงแบบ F และ x 2 -การกระจาย.

ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ย

ช่วงความเชื่อมั่น- นี่คือช่วงเวลาที่สร้างขึ้นรอบๆ ค่าประมาณของพารามิเตอร์ และแสดงตำแหน่งที่ค่าจริงของพารามิเตอร์โดยประมาณอยู่ด้วยความน่าจะเป็นที่ระบุโดยนิรนัย

การสร้างช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยเกิดขึ้น ดังต่อไปนี้:

ตัวอย่าง

ร้านอาหารฟาสต์ฟู้ดแห่งนี้วางแผนที่จะขยายประเภทด้วยแซนด์วิชรูปแบบใหม่ เพื่อประเมินความต้องการ ผู้จัดการวางแผนที่จะสุ่มเลือกผู้เข้าชม 40 คนจากผู้ที่ได้ลองใช้แล้ว และขอให้พวกเขาให้คะแนนทัศนคติต่อผลิตภัณฑ์ใหม่ในระดับตั้งแต่ 1 ถึง 10 ผู้จัดการต้องการประมาณค่าที่คาดหวัง จำนวนคะแนนที่ผลิตภัณฑ์ใหม่จะได้รับและสร้างช่วงความเชื่อมั่น 95% สำหรับการประมาณนี้ วิธีการทำเช่นนี้? (ดูไฟล์ SANDWICH1.XLS (เทมเพลตและวิธีแก้ไข)

สารละลาย

เพื่อแก้ไขปัญหานี้คุณสามารถใช้ . ผลลัพธ์จะแสดงในรูป 97
.

ช่วงความเชื่อมั่นสำหรับมูลค่ารวม

บางครั้ง การใช้ข้อมูลตัวอย่าง จำเป็นต้องประมาณไม่ใช่การคาดการณ์ทางคณิตศาสตร์ แต่ต้องประมาณผลรวมของค่าทั้งหมด ตัวอย่างเช่น ในสถานการณ์ที่มีผู้ตรวจสอบบัญชี ดอกเบี้ยอาจอยู่ที่การประมาณไม่ใช่ขนาดบัญชีเฉลี่ย แต่อยู่ที่ผลรวมของบัญชีทั้งหมด

ให้ N เป็นจำนวนองค์ประกอบทั้งหมด n คือขนาดตัวอย่าง T 3 คือผลรวมของค่าในกลุ่มตัวอย่าง T" เป็นการประมาณสำหรับผลรวมของประชากรทั้งหมด จากนั้น และช่วงความเชื่อมั่นคำนวณโดยสูตร โดยที่ s คือค่าประมาณของค่าเบี่ยงเบนมาตรฐานสำหรับตัวอย่าง และคือค่าประมาณของค่าเฉลี่ยสำหรับตัวอย่าง

ตัวอย่าง

สมมติว่าหน่วยงานภาษีต้องการประมาณยอดคืนภาษีทั้งหมดสำหรับผู้เสียภาษี 10,000 ราย ผู้เสียภาษีจะได้รับเงินคืนหรือจ่ายภาษีเพิ่มเติม ค้นหาช่วงความเชื่อมั่น 95% สำหรับจำนวนเงินคืน โดยสมมติว่ามีกลุ่มตัวอย่าง 500 คน (ดูไฟล์ AMOUNT OF REFUND.XLS (เทมเพลตและวิธีแก้ไข)

สารละลาย

StatPro ไม่มีขั้นตอนพิเศษสำหรับกรณีนี้ อย่างไรก็ตาม สามารถสังเกตได้ว่าขอบเขตสามารถรับได้จากขอบเขตของค่าเฉลี่ยตามสูตรข้างต้น (รูปที่ 98
).

ช่วงความมั่นใจสำหรับสัดส่วน

ให้ p เป็นความคาดหวังทางคณิตศาสตร์ของส่วนแบ่งของลูกค้า และให้ p b เป็นค่าประมาณของส่วนแบ่งนี้ที่ได้จากตัวอย่างขนาด n แสดงว่าสำหรับขนาดใหญ่พอสมควรแล้ว การกระจายการประเมินจะใกล้เคียงกับปกติโดยมีค่าคาดหวังทางคณิตศาสตร์ p และค่าเบี่ยงเบนมาตรฐาน . ข้อผิดพลาดมาตรฐานของการประมาณค่าในกรณีนี้แสดงเป็น และช่วงความเชื่อมั่นเท่ากับ .

ตัวอย่าง

ร้านอาหารฟาสต์ฟู้ดแห่งนี้วางแผนที่จะขยายประเภทด้วยแซนด์วิชรูปแบบใหม่ เพื่อประเมินความต้องการ ผู้จัดการได้สุ่มเลือกผู้เข้าชม 40 คนจากผู้ที่ได้ลองใช้แล้ว และขอให้พวกเขาให้คะแนนทัศนคติที่มีต่อผลิตภัณฑ์ใหม่ในระดับตั้งแต่ 1 ถึง 10 ผู้จัดการต้องการประมาณสัดส่วนที่คาดหวังของ ลูกค้าที่ให้คะแนนผลิตภัณฑ์ใหม่อย่างน้อย 6 คะแนน (เขาคาดหวังว่าลูกค้าเหล่านี้จะเป็นผู้บริโภคของผลิตภัณฑ์ใหม่)

สารละลาย

ในตอนแรก เราจะสร้างคอลัมน์ใหม่ตามแอตทริบิวต์ 1 หากคะแนนของลูกค้ามากกว่า 6 คะแนนและเป็น 0 มิฉะนั้น (ดูไฟล์ SANDWICH2.XLS (เทมเพลตและวิธีแก้ปัญหา)

วิธีที่ 1

โดยการนับเลข 1 เราประมาณส่วนแบ่งแล้วใช้สูตร

ค่า zcr นำมาจากตารางการแจกแจงแบบปกติพิเศษ (เช่น 1.96 สำหรับช่วงความเชื่อมั่น 95%)

เมื่อใช้วิธีการนี้และข้อมูลเฉพาะเพื่อสร้างช่วง 95% เราจะได้ผลลัพธ์ดังต่อไปนี้ (รูปที่ 99
). ค่าวิกฤตของพารามิเตอร์ zcr คือ 1.96 ข้อผิดพลาดมาตรฐานของการประมาณการคือ 0.077 ขีดจำกัดล่างของช่วงความเชื่อมั่นคือ 0.475 ขีดจำกัดบนของช่วงความเชื่อมั่นคือ 0.775 ดังนั้น ผู้จัดการมีสิทธิ์ที่จะเชื่อด้วยความมั่นใจ 95% ว่าเปอร์เซ็นต์ของลูกค้าที่ให้คะแนนผลิตภัณฑ์ใหม่ 6 คะแนนขึ้นไปจะอยู่ระหว่าง 47.5 ถึง 77.5

วิธีที่ 2

ปัญหานี้สามารถแก้ไขได้โดยใช้เครื่องมือ StatPro มาตรฐาน ในการดำเนินการนี้ ก็เพียงพอที่จะทราบว่าส่วนแบ่งในกรณีนี้เกิดขึ้นพร้อมกับค่าเฉลี่ยของคอลัมน์ประเภท ต่อไปเราสมัคร StatPro/การอนุมานทางสถิติ/การวิเคราะห์ตัวอย่างเดียวเพื่อสร้างช่วงความเชื่อมั่นของค่าเฉลี่ย (ค่าประมาณของความคาดหวังทางคณิตศาสตร์) สำหรับคอลัมน์ประเภท ผลลัพธ์ที่ได้ในกรณีนี้จะใกล้เคียงกับผลลัพธ์ของวิธีที่ 1 มาก (รูปที่ 99)

ช่วงความเชื่อมั่นสำหรับส่วนเบี่ยงเบนมาตรฐาน

s ใช้เป็นค่าประมาณของส่วนเบี่ยงเบนมาตรฐาน (สูตรแสดงไว้ในส่วนที่ 1) ฟังก์ชันความหนาแน่นของการประมาณค่า s คือฟังก์ชันไคสแควร์ ซึ่งมีดีกรีอิสระ n-1 เช่นเดียวกับการแจกแจงแบบ t มีฟังก์ชันพิเศษสำหรับการทำงานกับการแจกแจง CHIDIST และ CHIINV นี้

ช่วงความเชื่อมั่นในกรณีนี้จะไม่สมมาตรอีกต่อไป แผนภาพขอบเขตแบบธรรมดาแสดงไว้ในรูปที่ 1 100 .

ตัวอย่าง

เครื่องจักรจะต้องผลิตชิ้นส่วนที่มีเส้นผ่านศูนย์กลาง 10 ซม. อย่างไรก็ตาม เกิดข้อผิดพลาดขึ้นเนื่องจากสถานการณ์ต่างๆ ผู้ควบคุมคุณภาพมีความกังวลเกี่ยวกับสองสถานการณ์ ประการแรก ค่าเฉลี่ยควรอยู่ที่ 10 ซม. ประการที่สอง แม้ในกรณีนี้ ถ้ามีการเบี่ยงเบนมาก หลายส่วนก็จะถูกปฏิเสธ ทุกวันเขาสร้างตัวอย่าง 50 ชิ้นส่วน (ดูไฟล์ QUALITY CONTROL.XLS (เทมเพลตและโซลูชัน) ตัวอย่างดังกล่าวให้ข้อสรุปอะไรได้บ้าง

สารละลาย

ลองสร้างช่วงความเชื่อมั่น 95% สำหรับค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานโดยใช้ StatPro/การอนุมานทางสถิติ/การวิเคราะห์ตัวอย่างเดียว(รูปที่ 101
).

ต่อไป โดยใช้สมมติฐานของการกระจายเส้นผ่านศูนย์กลางปกติ เราจะคำนวณสัดส่วนของผลิตภัณฑ์ที่มีข้อบกพร่อง โดยตั้งค่าส่วนเบี่ยงเบนสูงสุดที่ 0.065 การใช้ความสามารถของตารางการทดแทน (กรณีของพารามิเตอร์สองตัว) เราวางแผนการพึ่งพาสัดส่วนของข้อบกพร่องกับค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน (รูปที่ 102
).

ช่วงความเชื่อมั่นสำหรับผลต่างระหว่างสองค่าเฉลี่ย

นี่เป็นหนึ่งในการประยุกต์ใช้วิธีการทางสถิติที่สำคัญที่สุด ตัวอย่างสถานการณ์

    ผู้จัดการร้านเสื้อผ้าต้องการทราบว่าลูกค้าหญิงโดยเฉลี่ยใช้จ่ายในร้านค้ามากหรือน้อยกว่าลูกค้าชายโดยเฉลี่ย

    สองสายการบินบินเส้นทางเดียวกัน องค์กรผู้บริโภคต้องการเปรียบเทียบความแตกต่างระหว่างเวลาล่าช้าของเที่ยวบินโดยเฉลี่ยที่คาดไว้สำหรับทั้งสองสายการบิน

    บริษัทจะส่งคูปองสำหรับสินค้าบางประเภทในเมืองหนึ่งและไม่ใช่ในเมืองอื่น ผู้จัดการต้องการเปรียบเทียบปริมาณการซื้อเฉลี่ยของผลิตภัณฑ์เหล่านี้ในช่วงสองเดือนข้างหน้า

    ตัวแทนจำหน่ายรถยนต์มักจะจัดการกับคู่แต่งงานในการนำเสนอ เพื่อให้เข้าใจถึงปฏิกิริยาส่วนตัวของพวกเขาต่อการนำเสนอ คู่รักมักจะถูกสัมภาษณ์แยกกัน ผู้จัดการต้องการประเมินความแตกต่างของคะแนนที่ได้รับจากชายและหญิง

กรณีตัวอย่างอิสระ

ความแตกต่างระหว่างค่าเฉลี่ยจะมีการแจกแจงแบบ t โดยมีดีกรีอิสระ n 1 + n 2 - 2 ช่วงความเชื่อมั่นสำหรับ μ 1 - μ 2 แสดงโดยความสัมพันธ์:

ปัญหานี้สามารถแก้ไขได้ไม่เพียงแต่โดยใช้สูตรข้างต้น แต่ยังใช้เครื่องมือ StatPro มาตรฐานอีกด้วย เมื่อต้องการทำเช่นนี้ก็เพียงพอที่จะใช้

ช่วงความเชื่อมั่นสำหรับความแตกต่างระหว่างสัดส่วน

ให้เป็นความคาดหวังทางคณิตศาสตร์ของหุ้น ให้ เป็นการประมาณตัวอย่างที่สร้างจากตัวอย่างขนาด n 1 และ n 2 ตามลำดับ แล้วเป็นการประมาณความแตกต่าง ดังนั้น ช่วงความเชื่อมั่นของความแตกต่างนี้จึงแสดงเป็น:

โดยที่ z cr คือค่าที่ได้จากการแจกแจงแบบปกติโดยใช้ตารางพิเศษ (เช่น 1.96 สำหรับช่วงความเชื่อมั่น 95%)

ข้อผิดพลาดมาตรฐานของการประมาณค่าแสดงในกรณีนี้โดยความสัมพันธ์:

.

ตัวอย่าง

ร้านค้ากำลังเตรียมการขายครั้งใหญ่ ได้ทำการวิจัยทางการตลาดดังต่อไปนี้ ผู้ซื้อ 300 อันดับแรกได้รับการคัดเลือกและสุ่มแบ่งออกเป็นสองกลุ่ม กลุ่มละ 150 คน ลูกค้าที่เลือกทั้งหมดได้รับคำเชิญให้เข้าร่วมการขาย แต่มีเพียงสมาชิกของกลุ่มแรกเท่านั้นที่ได้รับคูปองเพื่อรับส่วนลด 5% ในระหว่างการขาย จะมีการบันทึกการซื้อของผู้ซื้อที่เลือกทั้งหมด 300 ราย ผู้จัดการสามารถตีความผลลัพธ์และตัดสินเกี่ยวกับประสิทธิผลของคูปองได้อย่างไร (ดูไฟล์ COUPONS.XLS (เทมเพลตและโซลูชัน))

สารละลาย

สำหรับกรณีเฉพาะของเรา ลูกค้า 150 รายที่ได้รับคูปองส่วนลด 55 รายซื้อสินค้าลดราคา และใน 150 รายที่ไม่ได้รับคูปอง มีเพียง 35 รายที่ซื้อสินค้า (รูปที่ 103)
). จากนั้นค่าสัดส่วนตัวอย่างคือ 0.3667 และ 0.2333 ตามลำดับ และผลต่างตัวอย่างระหว่างพวกมันเท่ากับ 0.1333 ตามลำดับ สมมติว่าช่วงความเชื่อมั่น 95% เราพบจากตารางการแจกแจงแบบปกติ z cr = 1.96 การคำนวณค่าความผิดพลาดมาตรฐานของผลต่างตัวอย่างคือ 0.0524 ในที่สุดเราก็พบว่าขีดจำกัดล่างของช่วงความเชื่อมั่น 95% คือ 0.0307 ​​และขีดจำกัดบนคือ 0.2359 ตามลำดับ ผลลัพธ์ที่ได้สามารถตีความได้ในลักษณะที่ว่าสำหรับลูกค้าทุกๆ 100 รายที่ได้รับคูปองส่วนลด เราสามารถคาดหวังลูกค้าใหม่ได้ตั้งแต่ 3 ถึง 23 ราย อย่างไรก็ตาม เราต้องจำไว้ว่าข้อสรุปนี้ไม่ได้หมายถึงประสิทธิผลของการใช้คูปอง (เนื่องจากการให้ส่วนลด เราจึงสูญเสียกำไร!) มาสาธิตสิ่งนี้ด้วยข้อมูลเฉพาะกัน สมมติว่าขนาดการซื้อเฉลี่ยคือ 400 รูเบิล ซึ่งคือ 50 รูเบิล มีกำไรให้ร้าน. ดังนั้นกำไรที่คาดหวังจากลูกค้า 100 รายที่ไม่ได้รับคูปองคือ:

50 0.2333 100 = 1166.50 ถู

การคำนวณที่คล้ายกันสำหรับลูกค้า 100 รายที่ได้รับคูปองจะให้:

30 0.3667 100 = 1100.10 ถู

กำไรเฉลี่ยที่ลดลงเหลือ 30 อธิบายได้จากข้อเท็จจริงที่ว่าเมื่อใช้ส่วนลด ลูกค้าที่ได้รับคูปองจะซื้อสินค้าโดยเฉลี่ย 380 รูเบิล

ดังนั้นข้อสรุปสุดท้ายบ่งชี้ถึงความไร้ประสิทธิผลของการใช้คูปองดังกล่าวในสถานการณ์เฉพาะนี้

ความคิดเห็น ปัญหานี้สามารถแก้ไขได้โดยใช้เครื่องมือ StatPro มาตรฐาน ในการทำเช่นนี้ ก็เพียงพอแล้วที่จะลดปัญหานี้ให้เหลือเพียงปัญหาการประมาณความแตกต่างระหว่างค่าเฉลี่ยสองค่าโดยใช้วิธีนี้ จากนั้นจึงนำไปใช้ StatPro/การอนุมานทางสถิติ/การวิเคราะห์สองตัวอย่างเพื่อสร้างช่วงความเชื่อมั่นสำหรับผลต่างระหว่างค่าเฉลี่ยสองค่า

การควบคุมความยาวช่วงความเชื่อมั่น

ความยาวของช่วงความเชื่อมั่นขึ้นอยู่กับ เงื่อนไขต่อไปนี้:

    ข้อมูลโดยตรง (ส่วนเบี่ยงเบนมาตรฐาน)

    ระดับความสำคัญ

    ขนาดตัวอย่าง.

ขนาดตัวอย่างในการประมาณค่าเฉลี่ย

ขั้นแรก พิจารณาปัญหาในกรณีทั่วไปก่อน ให้เราแทนค่าของความยาวครึ่งหนึ่งของช่วงความเชื่อมั่นที่มอบให้เราเป็น B (รูปที่ 104
). เรารู้ว่าช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยของตัวแปรสุ่ม X บางตัวแสดงเป็น , ที่ไหน . เชื่อ:

และแสดง n เราจะได้

น่าเสียดายที่เราไม่ทราบค่าที่แน่นอนของความแปรปรวนของตัวแปรสุ่ม X นอกจากนี้ เราไม่ทราบค่าของ tcr เนื่องจากมันขึ้นอยู่กับ n ถึงจำนวนดีกรีอิสระ ในสถานการณ์นี้ เราสามารถทำได้ดังต่อไปนี้ แทนที่จะใช้ความแปรปรวน เราใช้การประมาณค่าความแปรปรวนตามการใช้งานตัวแปรสุ่มที่มีอยู่ภายใต้การศึกษา แทนที่จะใช้ค่า t cr เราใช้ค่า z cr สำหรับการแจกแจงแบบปกติ สิ่งนี้ค่อนข้างยอมรับได้ เนื่องจากฟังก์ชันความหนาแน่นของการแจกแจงสำหรับการแจกแจงแบบปกติและการแจกแจงแบบ t นั้นใกล้เคียงกันมาก (ยกเว้นกรณีของ n เล็ก) ดังนั้นสูตรที่ต้องการจึงอยู่ในรูปแบบ:

.

เนื่องจากสูตรนี้ให้ผลลัพธ์ที่ไม่ใช่จำนวนเต็ม โดยทั่วไปแล้ว การปัดเศษด้วยผลลัพธ์ที่มากเกินไปจึงถือเป็นขนาดตัวอย่างที่ต้องการ

ตัวอย่าง

ร้านอาหารฟาสต์ฟู้ดแห่งนี้วางแผนที่จะขยายประเภทด้วยแซนด์วิชรูปแบบใหม่ เพื่อประเมินความต้องการ ผู้จัดการวางแผนที่จะสุ่มเลือกจำนวนผู้เข้าชมจากผู้ที่ได้ลองใช้แล้ว และขอให้พวกเขาให้คะแนนทัศนคติต่อผลิตภัณฑ์ใหม่ในระดับตั้งแต่ 1 ถึง 10 ผู้จัดการต้องการประมาณ จำนวนคะแนนที่คาดหวังที่ผลิตภัณฑ์ใหม่จะได้รับผลิตภัณฑ์และสร้างช่วงความเชื่อมั่น 95% สำหรับการประมาณการนี้ ในเวลาเดียวกัน เขาต้องการให้ช่วงความเชื่อมั่นครึ่งหนึ่งไม่เกิน 0.3 เขาต้องสัมภาษณ์ผู้เยี่ยมชมกี่คน?

ดังต่อไปนี้:

ที่นี่ โอเคคือค่าประมาณของสัดส่วน p และ B คือค่าครึ่งหนึ่งของความยาวของช่วงความเชื่อมั่น การประมาณค่าสูงเกินไปสำหรับ n สามารถหาได้โดยใช้ค่า โอเค= 0.5. ในกรณีนี้ ความยาวของช่วงความเชื่อมั่นจะไม่เกินค่า B ที่ระบุสำหรับค่าจริงของ p

ตัวอย่าง

ให้ผู้จัดการจากตัวอย่างก่อนหน้านี้วางแผนประมาณส่วนแบ่งของลูกค้าที่ต้องการผลิตภัณฑ์ประเภทใหม่ เขาต้องการสร้างช่วงความเชื่อมั่น 90% โดยมีความยาวครึ่งหนึ่งไม่เกิน 0.05 ควรรวมไคลเอนต์จำนวนเท่าใดในกลุ่มตัวอย่างแบบสุ่ม?

สารละลาย

ในกรณีของเรา ค่า z cr = 1.645 ดังนั้นปริมาณที่ต้องการจึงถูกคำนวณดังนี้ .

หากผู้จัดการมีเหตุผลให้เชื่อได้ว่าค่า p ที่ต้องการคือประมาณ 0.3 ดังนั้น เมื่อแทนค่านี้ลงในสูตรข้างต้น เราจะได้ค่าตัวอย่างสุ่มที่น้อยกว่า ซึ่งก็คือ 228

สูตรในการกำหนด ขนาดตัวอย่างแบบสุ่ม ในกรณีที่มีความแตกต่างระหว่างสองวิธีเขียนเป็น:

.

ตัวอย่าง

บริษัทคอมพิวเตอร์บางแห่งมีศูนย์บริการลูกค้า เมื่อเร็ว ๆ นี้จำนวนข้อร้องเรียนของลูกค้าเกี่ยวกับคุณภาพการบริการที่ไม่ดีเพิ่มขึ้น ศูนย์บริการจ้างพนักงานสองประเภทเป็นหลัก: ผู้ที่ไม่มีประสบการณ์มากนัก แต่สำเร็จการศึกษาหลักสูตรเตรียมความพร้อมพิเศษ และผู้ที่มีประสบการณ์ภาคปฏิบัติอย่างกว้างขวาง แต่ยังไม่จบหลักสูตรพิเศษ บริษัทต้องการวิเคราะห์ข้อร้องเรียนของลูกค้าในช่วง 6 เดือนที่ผ่านมา และเปรียบเทียบจำนวนข้อร้องเรียนโดยเฉลี่ยของพนักงานแต่ละกลุ่มในสองกลุ่ม สันนิษฐานว่าตัวเลขในกลุ่มตัวอย่างทั้งสองกลุ่มจะเท่ากัน ต้องรวมพนักงานกี่คนในกลุ่มตัวอย่างเพื่อให้ได้ช่วง 95% ที่มีความยาวครึ่งหนึ่งไม่เกิน 2

สารละลาย

ในที่นี้ σ ots คือค่าประมาณของค่าเบี่ยงเบนมาตรฐานของตัวแปรสุ่มทั้งสองตัวภายใต้สมมติฐานที่ว่ามันใกล้เคียงกัน ดังนั้นในปัญหาของเรา เราจำเป็นต้องได้ค่าประมาณนี้ ซึ่งสามารถทำได้ดังต่อไปนี้ เมื่อดูข้อมูลข้อร้องเรียนของลูกค้าในช่วงหกเดือนที่ผ่านมา ผู้จัดการอาจสังเกตเห็นว่าโดยทั่วไปพนักงานแต่ละคนได้รับการร้องเรียนตั้งแต่ 6 ถึง 36 เรื่อง เมื่อรู้ว่าสำหรับการแจกแจงแบบปกติค่าเกือบทั้งหมดอยู่ห่างจากค่าเฉลี่ยไม่เกินสามส่วนเบี่ยงเบนมาตรฐาน เขาจึงเชื่อได้อย่างสมเหตุสมผลว่า:

จากที่ σ ots = 5

เราได้แทนค่านี้ลงในสูตร .

สูตรในการกำหนด ขนาดตัวอย่างแบบสุ่ม กรณีประมาณความแตกต่างระหว่างสัดส่วนมีรูปแบบ:

ตัวอย่าง

บริษัทบางแห่งมีโรงงานสองแห่งที่ผลิตสินค้าที่คล้ายคลึงกัน ผู้จัดการบริษัทต้องการเปรียบเทียบเปอร์เซ็นต์ของผลิตภัณฑ์ที่มีข้อบกพร่องในโรงงานทั้งสองแห่ง จากข้อมูลที่มีอยู่ อัตราของเสียที่โรงงานทั้งสองแห่งอยู่ระหว่าง 3 ถึง 5% มีวัตถุประสงค์เพื่อสร้างช่วงความเชื่อมั่น 99% โดยมีความยาวครึ่งหนึ่งไม่เกิน 0.005 (หรือ 0.5%) แต่ละโรงงานต้องเลือกสินค้ากี่รายการ?

สารละลาย

ในที่นี้ p 1ots และ p 2ots เป็นค่าประมาณของข้อบกพร่องที่ไม่ทราบสาเหตุ 2 ส่วนในโรงงานแห่งที่ 1 และ 2 หากเราใส่ p 1ots = p 2ots = 0.5 เราจะได้ค่าที่ประเมินไว้สูงเกินไปสำหรับ n แต่เนื่องจากในกรณีของเรา เรามีข้อมูลเบื้องต้นเกี่ยวกับหุ้นเหล่านี้ เราจึงใช้ค่าประมาณด้านบนของหุ้นเหล่านี้ ซึ่งก็คือ 0.05 เราได้รับ

เมื่อประมาณค่าพารามิเตอร์ประชากรบางตัวจากข้อมูลตัวอย่าง จะมีประโยชน์ที่จะไม่เพียงแต่ให้ค่าประมาณแบบจุดของพารามิเตอร์เท่านั้น แต่ยังให้ช่วงความเชื่อมั่นที่แสดงตำแหน่งที่ค่าที่แน่นอนของพารามิเตอร์ที่ถูกประมาณค่าอาจอยู่อีกด้วย

ในบทนี้ เรายังได้ทำความคุ้นเคยกับความสัมพันธ์เชิงปริมาณที่ช่วยให้เราสามารถสร้างช่วงเวลาดังกล่าวสำหรับพารามิเตอร์ต่างๆ เรียนรู้วิธีควบคุมความยาวของช่วงความเชื่อมั่น

โปรดทราบว่าปัญหาในการประมาณขนาดตัวอย่าง (ปัญหาในการวางแผนการทดลอง) สามารถแก้ไขได้โดยใช้เครื่องมือ StatPro มาตรฐาน กล่าวคือ StatPro/การอนุมานทางสถิติ/การเลือกขนาดตัวอย่าง.

เรามาสร้างช่วงความเชื่อมั่นใน MS EXCEL เพื่อประมาณค่าเฉลี่ยของการแจกแจงในกรณีที่ทราบค่าการกระจายตัว

แน่นอนว่าทางเลือก ระดับความไว้วางใจขึ้นอยู่กับปัญหาที่กำลังแก้ไขโดยสิ้นเชิง ดังนั้นระดับความมั่นใจของผู้โดยสารทางอากาศในความน่าเชื่อถือของเครื่องบินควรสูงกว่าระดับความมั่นใจของผู้ซื้อในความน่าเชื่อถือของหลอดไฟอย่างไม่ต้องสงสัย

การกำหนดปัญหา

ให้เราสันนิษฐานว่าจาก ประชากรได้รับการถ่าย ตัวอย่างขนาด n. สันนิษฐานว่า ส่วนเบี่ยงเบนมาตรฐานการกระจายนี้เป็นที่รู้จัก มีความจำเป็นตามนี้ ตัวอย่างประเมินสิ่งที่ไม่รู้จัก ค่าเฉลี่ยการกระจาย(μ, ) และสร้างค่าที่สอดคล้องกัน สองด้าน ช่วงความมั่นใจ.

การประมาณจุด

ดังที่ได้ทราบมาจาก สถิติ(ลองแสดงว่ามัน เฉลี่ย X) เป็น การประมาณค่าเฉลี่ยอย่างไม่เอนเอียงนี้ ประชากรและมีการกระจายตัว N(μ;σ 2 /n)

บันทึก: จะทำอย่างไรถ้าคุณต้องการสร้าง ช่วงความมั่นใจในกรณีที่มีการกระจายสินค้านั้น ไม่ใช่ ปกติ?ในกรณีนี้มาช่วยซึ่งระบุว่ามีขนาดใหญ่พอสมควร ตัวอย่าง n จากการกระจาย ไม่ได้เป็น ปกติ, การกระจายตัวอย่างสถิติ X เฉลี่ยจะ ประมาณสอดคล้อง การกระจายตัวตามปกติด้วยพารามิเตอร์ N(μ; σ 2 / n)

ดังนั้น, การประมาณจุด เฉลี่ย ค่าการกระจายเรามี - สิ่งนี้ ค่าเฉลี่ยตัวอย่าง, เช่น. เฉลี่ย X. ตอนนี้เรามาเริ่มต้นกัน ช่วงความมั่นใจ

การสร้างช่วงความเชื่อมั่น

โดยปกติ เมื่อทราบการกระจายตัวและพารามิเตอร์แล้ว เราสามารถคำนวณความน่าจะเป็นที่ตัวแปรสุ่มจะนำค่าจากช่วงเวลาที่เราระบุได้ ตอนนี้เรามาทำสิ่งที่ตรงกันข้ามกัน: ค้นหาช่วงเวลาที่ตัวแปรสุ่มจะตกด้วยความน่าจะเป็นที่กำหนด เช่นจากคุณสมบัติ การกระจายตัวตามปกติเป็นที่รู้กันว่าด้วยความน่าจะเป็น 95% ตัวแปรสุ่มจะกระจายไปทั่ว กฎหมายปกติจะตกอยู่ในช่วงประมาณ +/- 2 จาก ค่าเฉลี่ย(ดูบทความเกี่ยวกับ) ช่วงเวลานี้จะทำหน้าที่เป็นต้นแบบสำหรับเรา ช่วงความมั่นใจ.

ทีนี้ลองดูว่าเรารู้การกระจายตัวหรือไม่ , เพื่อคำนวณช่วงเวลานี้? เพื่อตอบคำถาม เราต้องระบุรูปร่างของการแจกแจงและพารามิเตอร์ของมัน

เรารู้รูปแบบการกระจาย - นี่คือ การกระจายตัวตามปกติ(จำไว้ว่าเรากำลังพูดถึง. การกระจายตัวอย่าง สถิติ เฉลี่ย X).

เราไม่รู้จักพารามิเตอร์ μ (เพียงแค่ต้องประมาณโดยใช้ ช่วงความมั่นใจ) แต่เรามีค่าประมาณของมัน X เฉลี่ยคำนวณจาก ตัวอย่าง,ซึ่งสามารถใช้ได้

พารามิเตอร์ที่สอง - ค่าเบี่ยงเบนมาตรฐานของค่าเฉลี่ยตัวอย่าง เราจะถือว่ารู้แล้วมันจะเท่ากับ σ/√n

เพราะ เราไม่รู้ μ จากนั้นเราจะสร้างช่วง +/- 2 ส่วนเบี่ยงเบนมาตรฐานไม่ได้มาจาก ค่าเฉลี่ยและจากการประมาณค่าที่ทราบ เฉลี่ย X. เหล่านั้น. เมื่อคำนวณ ช่วงความมั่นใจเราจะไม่ถือว่า เฉลี่ย Xอยู่ในช่วง +/- 2 ส่วนเบี่ยงเบนมาตรฐานจาก μ ด้วยความน่าจะเป็น 95% และเราจะถือว่าช่วงเวลาคือ +/- 2 ส่วนเบี่ยงเบนมาตรฐานจาก เฉลี่ย Xโดยมีความน่าจะเป็น 95% ที่จะครอบคลุมμ – ค่าเฉลี่ยของประชากรทั่วไปจากที่มันถูกยึดไป ตัวอย่าง. ข้อความทั้งสองนี้เทียบเท่ากัน แต่ข้อความที่สองช่วยให้เราสามารถสร้างได้ ช่วงความมั่นใจ.

นอกจากนี้ ให้เราชี้แจงช่วงเวลา: ตัวแปรสุ่มกระจายไป กฎหมายปกติโดยมีความน่าจะเป็น 95% อยู่ภายในช่วง +/- 1.960 ส่วนเบี่ยงเบนมาตรฐานไม่ใช่ +/- 2 ส่วนเบี่ยงเบนมาตรฐาน. สามารถคำนวณได้โดยใช้สูตร =NORM.ST.REV((1+0.95)/2), ซม. ตัวอย่างไฟล์ Sheet Interval.

ตอนนี้เราสามารถกำหนดข้อความความน่าจะเป็นที่จะช่วยให้เราสร้างได้ ช่วงความมั่นใจ:
“ความน่าจะเป็นนั้น. ค่าเฉลี่ยประชากรตั้งอยู่ห่างจาก ค่าเฉลี่ยตัวอย่างภายใน 1,960" ค่าเบี่ยงเบนมาตรฐานของค่าเฉลี่ยตัวอย่าง"เท่ากับ 95%"

ค่าความน่าจะเป็นที่กล่าวถึงในคำสั่งมีชื่อพิเศษ ซึ่งเกี่ยวข้องกับระดับนัยสำคัญ α (อัลฟา) ด้วยการแสดงออกอย่างง่าย ระดับความไว้วางใจ =1 . ในกรณีของเรา ระดับนัยสำคัญ α =1-0,95=0,05 .

ตอนนี้ จากข้อความความน่าจะเป็นนี้ เราเขียนนิพจน์สำหรับการคำนวณ ช่วงความมั่นใจ:

โดยที่ Z α/2 มาตรฐาน การกระจายตัวตามปกติ(ค่าของตัวแปรสุ่มนี้ z, อะไร (z>=ซี α/2 )=α/2).

บันทึก: α/2-ควอนไทล์ตอนบนกำหนดความกว้าง ช่วงความมั่นใจวี ส่วนเบี่ยงเบนมาตรฐาน ค่าเฉลี่ยตัวอย่าง α/2-ควอนไทล์ตอนบน มาตรฐาน การกระจายตัวตามปกติมากกว่า 0 เสมอ ซึ่งสะดวกมาก

ในกรณีของเรา โดยที่ α=0.05 α/2-ควอนไทล์ตอนบน เท่ากับ 1.960 สำหรับระดับนัยสำคัญอื่นๆ α (10%; 1%) α/2-ควอนไทล์ตอนบน ซี α/2 สามารถคำนวณได้โดยใช้สูตร =NORM.ST.REV(1-α/2) หรือหากทราบ ระดับความไว้วางใจ, =NORM.ST.OBR((1+ระดับความน่าเชื่อถือ)/2).

โดยปกติแล้วเมื่อมีการสร้าง ช่วงความเชื่อมั่นสำหรับการประมาณค่าเฉลี่ยใช้เฉพาะ α ตอนบน/2-ปริมาณและอย่าใช้ α ล่าง/2-ปริมาณ. ที่เป็นไปเช่นนี้เพราะว่า มาตรฐาน การกระจายตัวตามปกติอย่างสมมาตรเกี่ยวกับแกน x ( ความหนาแน่นของการกระจายตัวสมมาตรเกี่ยวกับ เฉลี่ยเช่น 0). ดังนั้นจึงไม่จำเป็นต้องคำนวณ α/2-ควอนไทล์ที่ต่ำกว่า(เรียกง่ายๆ ว่า α /2-ควอนไทล์), เพราะ มันเท่าเทียมกัน α ตอนบน/2-ปริมาณมีเครื่องหมายลบ

ขอให้เราจำไว้ว่าแม้จะมีรูปร่างของการแจกแจงของค่า x แต่ตัวแปรสุ่มที่สอดคล้องกัน เฉลี่ย Xกระจาย ประมาณ ดี N(μ;σ 2 /n) (ดูบทความเกี่ยวกับ) ดังนั้น โดยทั่วไปแล้ว นิพจน์ข้างต้นสำหรับ ช่วงความมั่นใจเป็นเพียงการประมาณเท่านั้น ถ้าค่า x ถูกกระจายไป กฎหมายปกติ N(μ;σ 2 /n) จากนั้นนิพจน์สำหรับ ช่วงความมั่นใจมีความแม่นยำ

การคำนวณช่วงความเชื่อมั่นใน MS EXCEL

มาแก้ปัญหากันเถอะ
เวลาตอบสนองของชิ้นส่วนอิเล็กทรอนิกส์ต่อสัญญาณอินพุตเป็นคุณลักษณะที่สำคัญของอุปกรณ์ วิศวกรต้องการสร้างช่วงความเชื่อมั่นสำหรับเวลาตอบสนองโดยเฉลี่ยที่ระดับความเชื่อมั่น 95% จากประสบการณ์ก่อนหน้านี้ วิศวกรรู้ว่าค่าเบี่ยงเบนมาตรฐานของเวลาตอบสนองคือ 8 ms เป็นที่ทราบกันดีว่าในการประเมินเวลาตอบสนองวิศวกรทำการวัด 25 ครั้งค่าเฉลี่ยคือ 78 มิลลิวินาที

สารละลาย: วิศวกรต้องการทราบเวลาตอบสนองของอุปกรณ์อิเล็กทรอนิกส์ แต่เขาเข้าใจว่าเวลาตอบสนองไม่ใช่ค่าคงที่ แต่เป็นตัวแปรสุ่มที่มีการแจกแจงของตัวเอง ดังนั้น สิ่งที่ดีที่สุดที่เขาหวังได้คือการกำหนดพารามิเตอร์และรูปร่างของการแจกแจงนี้

น่าเสียดายที่จากเงื่อนไขของปัญหา เราไม่ทราบรูปแบบของการกระจายเวลาตอบสนอง (ไม่จำเป็นต้องเป็นเช่นนั้น ปกติ). การกระจายนี้ไม่เป็นที่รู้จักเช่นกัน มีเพียงเขาเท่านั้นที่รู้ ส่วนเบี่ยงเบนมาตรฐานσ=8. ดังนั้นในขณะที่เราไม่สามารถคำนวณความน่าจะเป็นและสร้างได้ ช่วงความมั่นใจ.

อย่างไรก็ตามถึงแม้ว่าเราจะไม่ทราบการกระจายตัวก็ตาม เวลา การตอบสนองที่แยกจากกันเรารู้ว่าตามนั้น พท, การกระจายตัวอย่าง เวลาตอบสนองโดยเฉลี่ยอยู่ที่ประมาณ ปกติ(เราจะถือว่าเงื่อนไขนั้น พทจะดำเนินการเพราะว่า ขนาด ตัวอย่างค่อนข้างใหญ่ (n=25)) .

นอกจากนี้, เฉลี่ยการกระจายตัวนี้จะเท่ากับ ค่าเฉลี่ยการกระจายคำตอบเดียวเช่น ม. ก ส่วนเบี่ยงเบนมาตรฐานของการแจกแจงนี้ (σ/√n) สามารถคำนวณได้โดยใช้สูตร =8/ROOT(25)

เป็นที่รู้กันว่าวิศวกรได้รับ การประมาณจุดพารามิเตอร์ μ เท่ากับ 78 ms (X เฉลี่ย) ดังนั้นตอนนี้เราสามารถคำนวณความน่าจะเป็นได้แล้วเพราะว่า เรารู้รูปแบบการกระจาย ( ปกติ) และพารามิเตอร์ของมัน (X avg และ σ/√n)

วิศวกรอยากทราบว่า มูลค่าที่คาดหวังμ การกระจายเวลาตอบสนอง ตามที่ระบุไว้ข้างต้น μ ​​นี้เท่ากับ ความคาดหวังทางคณิตศาสตร์ของการกระจายตัวอย่างของเวลาตอบสนองโดยเฉลี่ย. หากเราใช้ การกระจายตัวตามปกติ N(X avg; σ/√n) ดังนั้น μ ที่ต้องการจะอยู่ในช่วง +/-2*σ/√n โดยมีความน่าจะเป็นประมาณ 95%

ระดับความสำคัญเท่ากับ 1-0.95=0.05

สุดท้ายเราลองหาขอบซ้ายและขวากัน ช่วงความมั่นใจ.
ขอบซ้าย: =78-NORM.ST.REV(1-0.05/2)*8/รูท(25) = 74,864
ขอบขวา: =78+NORM.ST.INV(1-0.05/2)*8/รูท(25)=81.136

ขอบซ้าย: =NORM.REV(0.05/2; 78; 8/รูท(25))
ขอบขวา: =NORM.REV(1-0.05/2; 78; 8/รูท(25))

คำตอบ: ช่วงความมั่นใจที่ ระดับความเชื่อมั่น 95% และ σ=8มิลลิวินาทีเท่ากับ 78+/-3.136 มิลลิวินาที

ใน ไฟล์ตัวอย่างบนแผ่น Sigmaรู้จักสร้างแบบฟอร์มการคำนวณและการก่อสร้าง สองด้าน ช่วงความมั่นใจโดยพลการ ตัวอย่างโดยให้ σ และ ระดับความสำคัญ.

ฟังก์ชัน CONFIDENCE.NORM()

หากมีค่า ตัวอย่างอยู่ในช่วง B20:B79 , ก ระดับนัยสำคัญเท่ากับ 0.05; จากนั้นสูตร MS EXCEL:
=ค่าเฉลี่ย(B20:B79)-CONFIDENCE.NORM(0.05;σ; COUNT(B20:B79))
จะกลับขอบด้านซ้าย ช่วงความมั่นใจ.

ขีดจำกัดเดียวกันสามารถคำนวณได้โดยใช้สูตร:
=ค่าเฉลี่ย(B20:B79)-NORM.ST.REV(1-0.05/2)*σ/ROOT(COUNT(B20:B79))

บันทึก: ฟังก์ชัน CONFIDENCE.NORM() ปรากฏใน MS EXCEL 2010 ใน MS EXCEL เวอร์ชันก่อนหน้านี้ ฟังก์ชัน TRUST() ถูกนำมาใช้

"Katren-Style" ยังคงตีพิมพ์ซีรีส์เกี่ยวกับสถิติทางการแพทย์ของ Konstantin Kravchik ต่อไป ในบทความสองบทความก่อนหน้านี้ ผู้เขียนได้กล่าวถึงคำอธิบายแนวคิดต่างๆ เช่น และ

คอนสแตนติน คราฟชิค

นักคณิตศาสตร์-นักวิเคราะห์ ผู้เชี่ยวชาญด้านการวิจัยทางสถิติด้านการแพทย์และมนุษยศาสตร์

เมืองมอสโก

บ่อยครั้งในบทความเกี่ยวกับการศึกษาทางคลินิก คุณจะพบวลีลึกลับ: “ช่วงความมั่นใจ” (95 % CI หรือ 95 % CI - ช่วงความมั่นใจ) ตัวอย่างเช่น บทความอาจเขียนว่า "เพื่อประเมินความสำคัญของความแตกต่าง การทดสอบของนักเรียนใช้ในการคำนวณช่วงความเชื่อมั่น 95 %"

ค่าของ “ช่วงความเชื่อมั่น 95 %” คืออะไร และเหตุใดจึงต้องคำนวณ

ช่วงความเชื่อมั่นคืออะไร? - นี่คือช่วงที่ประชากรที่แท้จริงหมายถึงการโกหก มีค่าเฉลี่ยที่ "ไม่จริง" หรือไม่? ในแง่หนึ่งใช่พวกเขาทำ ใน เราอธิบายว่าเป็นไปไม่ได้ที่จะวัดพารามิเตอร์ที่สนใจในประชากรทั้งหมด ดังนั้นนักวิจัยจึงพอใจกับกลุ่มตัวอย่างที่มีจำกัด ในตัวอย่างนี้ (เช่น ตามน้ำหนักตัว) มีค่าเฉลี่ยหนึ่งค่า (น้ำหนักที่แน่นอน) ซึ่งเราจะตัดสินค่าเฉลี่ยในประชากรทั้งหมด อย่างไรก็ตาม ไม่น่าเป็นไปได้ที่น้ำหนักเฉลี่ยในกลุ่มตัวอย่าง (โดยเฉพาะกลุ่มที่มีขนาดเล็ก) จะตรงกับน้ำหนักเฉลี่ยในประชากรทั่วไป ดังนั้นจึงถูกต้องกว่าในการคำนวณและใช้ช่วงค่าเฉลี่ยของประชากร

ตัวอย่างเช่น จินตนาการว่าช่วงความเชื่อมั่น 95% (95% CI) สำหรับฮีโมโกลบินคือ 110 ถึง 122 กรัม/ลิตร ซึ่งหมายความว่ามีโอกาส 95% ที่ค่าฮีโมโกลบินเฉลี่ยที่แท้จริงในประชากรจะอยู่ระหว่าง 110 ถึง 122 กรัม/ลิตร กล่าวอีกนัยหนึ่งเราไม่ทราบค่าฮีโมโกลบินเฉลี่ยในประชากร แต่ด้วยความน่าจะเป็น 95 % เราสามารถระบุช่วงของค่าสำหรับคุณลักษณะนี้ได้

ช่วงความเชื่อมั่นมีความเกี่ยวข้องอย่างยิ่งกับความแตกต่างในค่าเฉลี่ยระหว่างกลุ่ม หรือขนาดผลกระทบเมื่อมีการเรียก

สมมติว่าเราเปรียบเทียบประสิทธิภาพของการเตรียมธาตุเหล็กสองชนิด: ชนิดหนึ่งที่มีอยู่ในตลาดมาเป็นเวลานานและอีกชนิดที่เพิ่งได้รับการขึ้นทะเบียน หลังจากการบำบัด เราได้ประเมินความเข้มข้นของฮีโมโกลบินในกลุ่มผู้ป่วยที่ทำการศึกษา และโปรแกรมทางสถิติได้คำนวณว่าความแตกต่างระหว่างค่าเฉลี่ยของทั้งสองกลุ่มมีความน่าจะเป็น 95 % ในช่วงตั้งแต่ 1.72 ถึง 14.36 กรัม/ลิตร (ตารางที่ 1)

โต๊ะ 1. ทดสอบตัวอย่างอิสระ
(กลุ่มถูกเปรียบเทียบตามระดับฮีโมโกลบิน)

ควรตีความดังนี้ ในผู้ป่วยบางรายในประชากรทั่วไปที่รับประทานยาใหม่ ฮีโมโกลบินจะสูงกว่าโดยเฉลี่ย 1.72–14.36 กรัม/ลิตร มากกว่าในผู้ป่วยที่รับประทานยาที่ทราบอยู่แล้ว

กล่าวอีกนัยหนึ่ง ในประชากรทั่วไป ความแตกต่างของค่าฮีโมโกลบินเฉลี่ยระหว่างกลุ่มอยู่ภายในขีดจำกัดเหล่านี้โดยมีความน่าจะเป็น 95% ขึ้นอยู่กับผู้วิจัยที่จะตัดสินว่ามากหรือน้อย ประเด็นทั้งหมดก็คือ เราไม่ได้ทำงานกับค่าเฉลี่ยเพียงค่าเดียว แต่ด้วยช่วงของค่า ดังนั้นเราจึงประมาณค่าความแตกต่างในพารามิเตอร์ระหว่างกลุ่มได้อย่างน่าเชื่อถือมากขึ้น

ในแพ็คเกจทางสถิติ คุณสามารถจำกัดหรือขยายขอบเขตของช่วงความเชื่อมั่นได้โดยขึ้นอยู่กับดุลยพินิจของผู้วิจัย การลดความน่าจะเป็นของช่วงความเชื่อมั่นจะทำให้ช่วงของค่าเฉลี่ยแคบลง ตัวอย่างเช่น ที่ 90 % CI ช่วงของค่าเฉลี่ย (หรือความแตกต่างในค่าเฉลี่ย) จะแคบกว่าที่ 95 %

ในทางกลับกัน การเพิ่มความน่าจะเป็นเป็น 99 % จะทำให้ช่วงของค่ากว้างขึ้น เมื่อทำการเปรียบเทียบกลุ่ม ขีดจำกัดล่างของ CI อาจข้ามเครื่องหมายศูนย์ ตัวอย่างเช่น ถ้าเราขยายขอบเขตของช่วงความเชื่อมั่นเป็น 99 % ขอบเขตของช่วงความเชื่อมั่นจะอยู่ในช่วงตั้งแต่ –1 ถึง 16 กรัม/ลิตร ซึ่งหมายความว่าในประชากรทั่วไปมีกลุ่มต่างๆ ซึ่งความแตกต่างระหว่างค่าเฉลี่ยสำหรับคุณลักษณะที่กำลังศึกษาคือ 0 (M = 0)

คุณสามารถทดสอบสมมติฐานทางสถิติได้โดยใช้ช่วงความเชื่อมั่น ถ้าช่วงความเชื่อมั่นข้ามค่าศูนย์ สมมุติฐานว่างซึ่งถือว่ากลุ่มไม่แตกต่างกันตามพารามิเตอร์ที่กำลังศึกษาจะเป็นจริง ตัวอย่างอธิบายไว้ข้างต้นโดยที่เราขยายขอบเขตเป็น 99 % ที่ไหนสักแห่งในประชากรทั่วไปเราพบกลุ่มที่ไม่แตกต่างกันแต่อย่างใด

ช่วงความเชื่อมั่น 95% ของความแตกต่างในฮีโมโกลบิน (กรัม/ลิตร)


รูปนี้แสดงช่วงความเชื่อมั่น 95% สำหรับความแตกต่างของค่าฮีโมโกลบินเฉลี่ยระหว่างทั้งสองกลุ่ม เส้นตรงลากผ่านเครื่องหมายศูนย์ ดังนั้นจึงมีความแตกต่างระหว่างค่าเฉลี่ยของศูนย์ ซึ่งยืนยันสมมติฐานว่างที่ว่ากลุ่มต่างๆ ไม่ได้แตกต่างกัน ช่วงความแตกต่างระหว่างกลุ่มคือตั้งแต่ –2 ถึง 5 กรัม/ลิตร ซึ่งหมายความว่าฮีโมโกลบินสามารถลดลง 2 กรัม/ลิตรหรือเพิ่มขึ้น 5 กรัม/ลิตร

ช่วงความเชื่อมั่นเป็นตัวบ่งชี้ที่สำคัญมาก ด้วยเหตุนี้ คุณจะสามารถดูได้ว่าความแตกต่างในกลุ่มนั้นจริงๆ แล้วเกิดจากความแตกต่างในวิธีการหรือเนื่องจากกลุ่มตัวอย่างขนาดใหญ่ เนื่องจากกลุ่มตัวอย่างขนาดใหญ่โอกาสในการค้นหาความแตกต่างมีมากกว่ากลุ่มตัวอย่างขนาดเล็ก

ในทางปฏิบัติอาจมีลักษณะเช่นนี้ เราสุ่มตัวอย่างจากคน 1,000 คน วัดระดับฮีโมโกลบิน และพบว่าช่วงความเชื่อมั่นสำหรับความแตกต่างในค่าเฉลี่ยอยู่ระหว่าง 1.2 ถึง 1.5 กรัม/ลิตร ระดับนัยสำคัญทางสถิติในกรณีนี้ p

เราเห็นว่าความเข้มข้นของฮีโมโกลบินเพิ่มขึ้น แต่แทบจะมองไม่เห็น ดังนั้นนัยสำคัญทางสถิติจึงปรากฏอย่างแม่นยำเนื่องจากขนาดตัวอย่าง

ช่วงความเชื่อมั่นสามารถคำนวณได้ไม่เพียงแต่สำหรับวิธีการเท่านั้น แต่ยังรวมถึงสัดส่วน (และอัตราส่วนความเสี่ยง) ด้วย ตัวอย่างเช่น เราสนใจช่วงความเชื่อมั่นของสัดส่วนของผู้ป่วยที่ได้รับการบรรเทาอาการขณะรับประทานยาที่พัฒนาแล้ว ให้เราสมมติว่า 95 % CI สำหรับสัดส่วน เช่น สำหรับสัดส่วนของผู้ป่วยดังกล่าว อยู่ในช่วง 0.60–0.80 ดังนั้น เราสามารถพูดได้ว่ายาของเรามีผลการรักษาในกรณี 60 ถึง 80 %

การประมาณค่าทางสถิติมีสองประเภท: จุดและช่วง การประมาณจุดคือสถิติตัวอย่างเดียวที่ใช้ในการประมาณค่าพารามิเตอร์ประชากร เช่น ค่าเฉลี่ยตัวอย่าง คือค่าประมาณแบบจุดของความคาดหวังทางคณิตศาสตร์ของประชากร และความแปรปรวนของกลุ่มตัวอย่าง เอส 2- การประมาณจุดของความแปรปรวนของประชากร ซิ 2. แสดงให้เห็นว่าค่าเฉลี่ยของกลุ่มตัวอย่างเป็นการประมาณค่าความคาดหวังทางคณิตศาสตร์ของประชากรอย่างเป็นกลาง ค่าเฉลี่ยตัวอย่างเรียกว่าเป็นกลาง เนื่องจากค่าเฉลี่ยของค่าเฉลี่ยตัวอย่างทั้งหมด (ที่มีขนาดตัวอย่างเท่ากัน) n) เท่ากับค่าคาดหวังทางคณิตศาสตร์ของประชากรทั่วไป

เพื่อให้เกิดความแปรปรวนตัวอย่าง เอส 2กลายเป็นการประมาณค่าความแปรปรวนของประชากรอย่างเป็นกลาง ซิ 2ควรตั้งค่าตัวส่วนของความแปรปรวนตัวอย่างให้เท่ากับ n – 1 , แต่ไม่ n. กล่าวอีกนัยหนึ่ง ความแปรปรวนของประชากรคือค่าเฉลี่ยของความแปรปรวนตัวอย่างที่เป็นไปได้ทั้งหมด

เมื่อประมาณค่าพารามิเตอร์ประชากร ควรคำนึงถึงสถิติตัวอย่าง เช่น ขึ้นอยู่กับตัวอย่างเฉพาะ เพื่อคำนึงถึงข้อเท็จจริงนี้เพื่อรับ การประมาณช่วงความคาดหวังทางคณิตศาสตร์ของประชากรทั่วไป วิเคราะห์การกระจายตัวของค่าเฉลี่ยตัวอย่าง (ดูรายละเอียดเพิ่มเติม) ช่วงที่สร้างขึ้นนั้นมีลักษณะเฉพาะด้วยระดับความเชื่อมั่นที่แน่นอน ซึ่งแสดงถึงความน่าจะเป็นที่พารามิเตอร์ประชากรจริงจะถูกประมาณอย่างถูกต้อง ช่วงความเชื่อมั่นที่คล้ายกันสามารถใช้เพื่อประมาณสัดส่วนของคุณลักษณะได้ และมวลกระจายหลักของประชากร

ดาวน์โหลดบันทึกในรูปแบบหรือตัวอย่างในรูปแบบ

การสร้างช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์ของประชากรที่มีค่าเบี่ยงเบนมาตรฐานที่ทราบ

การสร้างช่วงความเชื่อมั่นสำหรับส่วนแบ่งของคุณลักษณะในประชากร

ส่วนนี้จะขยายแนวคิดเรื่องช่วงความเชื่อมั่นไปสู่ข้อมูลที่เป็นหมวดหมู่ สิ่งนี้ช่วยให้เราสามารถประมาณส่วนแบ่งของลักษณะเฉพาะในประชากรได้ โดยใช้การแชร์ตัวอย่าง = เอ็กซ์/n. ตามที่ระบุหากมีปริมาณ nและ n(1 – หน้า)เกินเลข 5 การแจกแจงแบบทวินามสามารถประมาณได้ตามปกติ ดังนั้นเพื่อประมาณส่วนแบ่งของลักษณะเฉพาะในประชากร สามารถสร้างช่วงที่มีระดับความเชื่อมั่นเท่ากับได้ (1 – α)х100%.


ที่ไหน พี- สัดส่วนตัวอย่างลักษณะเท่ากับ เอ็กซ์/n, เช่น. จำนวนความสำเร็จหารด้วยขนาดตัวอย่าง - ส่วนแบ่งของลักษณะในประชากรทั่วไป ซี- ค่าวิกฤตของการแจกแจงแบบปกติมาตรฐาน n- ขนาดตัวอย่าง.

ตัวอย่างที่ 3สมมติว่าตัวอย่างที่ประกอบด้วยใบแจ้งหนี้ 100 ใบที่กรอกในช่วงเดือนที่แล้วถูกแยกออกจากระบบข้อมูล สมมติว่าใบแจ้งหนี้ทั้ง 10 ใบถูกรวบรวมโดยมีข้อผิดพลาด ดังนั้น, = 10/100 = 0.1 ระดับความเชื่อมั่น 95% สอดคล้องกับค่าวิกฤต Z = 1.96

ดังนั้น ความน่าจะเป็นที่ระหว่าง 4.12% ถึง 15.88% ของใบแจ้งหนี้มีข้อผิดพลาดคือ 95%

สำหรับขนาดตัวอย่างที่กำหนด ช่วงความเชื่อมั่นที่มีสัดส่วนของลักษณะเฉพาะในประชากรจะปรากฏกว้างกว่าตัวแปรสุ่มแบบต่อเนื่อง เนื่องจากการวัดตัวแปรสุ่มแบบต่อเนื่องมีข้อมูลมากกว่าการวัดข้อมูลเชิงหมวดหมู่ กล่าวอีกนัยหนึ่งข้อมูลหมวดหมู่ที่รับเพียงสองค่าจะมีข้อมูลไม่เพียงพอที่จะประมาณค่าพารามิเตอร์ของการแจกแจง

ในการคำนวณค่าประมาณที่ดึงมาจากประชากรจำนวนจำกัด

การประมาณค่าความคาดหวังทางคณิตศาสตร์ปัจจัยแก้ไขสำหรับประชากรสุดท้าย ( เอฟพีซี) ถูกนำมาใช้เพื่อลดข้อผิดพลาดมาตรฐานตามปัจจัย เมื่อคำนวณช่วงความเชื่อมั่นสำหรับการประมาณค่าพารามิเตอร์ประชากร ปัจจัยการแก้ไขจะถูกใช้ในสถานการณ์ที่มีการเก็บตัวอย่างโดยไม่ถูกส่งกลับ ดังนั้น ช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์ที่มีระดับความเชื่อมั่นเท่ากับ (1 – α)х100%คำนวณโดยสูตร:

ตัวอย่างที่ 4เพื่อแสดงให้เห็นการใช้ปัจจัยแก้ไขสำหรับประชากรที่มีจำกัด ขอให้เรากลับไปสู่ปัญหาในการคำนวณช่วงความเชื่อมั่นสำหรับจำนวนใบแจ้งหนี้โดยเฉลี่ย ตามที่กล่าวไว้ข้างต้นในตัวอย่างที่ 3 สมมติว่าบริษัทออกใบแจ้งหนี้ 5,000 ใบต่อเดือน และ เอ็กซ์=110.27 ดอลลาร์ = $28.95, เอ็น = 5000, n = 100, α = 0.05, ที 99 = 1.9842 การใช้สูตร (6) เราได้รับ:

การประมาณส่วนแบ่งของฟีเจอร์เมื่อเลือกโดยไม่ส่งคืน ช่วงความเชื่อมั่นสำหรับสัดส่วนของคุณลักษณะที่มีระดับความเชื่อมั่นเท่ากับ (1 – α)х100%คำนวณโดยสูตร:

ช่วงความเชื่อมั่นและประเด็นทางจริยธรรม

เมื่อทำการสุ่มตัวอย่างประชากรและทำการสรุปทางสถิติ มักจะเกิดปัญหาด้านจริยธรรมเกิดขึ้น สิ่งสำคัญคือช่วงความเชื่อมั่นและการประมาณค่าจุดของสถิติตัวอย่างสอดคล้องกันอย่างไร การเผยแพร่การประมาณจุดโดยไม่ระบุช่วงความเชื่อมั่นที่เกี่ยวข้อง (โดยปกติจะอยู่ที่ระดับความเชื่อมั่น 95%) และขนาดตัวอย่างที่ได้รับมาอาจทำให้เกิดความสับสนได้ สิ่งนี้อาจทำให้ผู้ใช้รู้สึกว่าการประมาณจุดเป็นสิ่งที่เขาต้องการในการทำนายคุณสมบัติของประชากรทั้งหมด ดังนั้นจึงจำเป็นต้องเข้าใจว่าในการวิจัยใดๆ ไม่ควรเน้นที่การประมาณจุด แต่เป็นการประมาณช่วง นอกจากนี้ควรให้ความใส่ใจเป็นพิเศษกับการเลือกขนาดตัวอย่างที่ถูกต้อง

บ่อยครั้งที่เป้าหมายของการจัดการทางสถิติเป็นผลมาจากการสำรวจทางสังคมวิทยาของประชากรในประเด็นทางการเมืองบางอย่าง ในเวลาเดียวกัน ผลการสำรวจจะถูกตีพิมพ์บนหน้าแรกของหนังสือพิมพ์ และข้อผิดพลาดในการสุ่มตัวอย่างและวิธีการวิเคราะห์ทางสถิติจะถูกตีพิมพ์ที่ไหนสักแห่งตรงกลาง เพื่อพิสูจน์ความถูกต้องของการประมาณค่าจุดที่ได้รับ จำเป็นต้องระบุขนาดตัวอย่างตามที่ได้รับ ขอบเขตของช่วงความเชื่อมั่น และระดับนัยสำคัญ

หมายเหตุถัดไป

สื่อจากหนังสือ Levin และคณะ ใช้สถิติสำหรับผู้จัดการ – อ.: วิลเลียมส์, 2004. – หน้า. 448–462

ทฤษฎีบทขีดจำกัดกลางระบุว่าด้วยขนาดตัวอย่างที่ใหญ่เพียงพอ การกระจายตัวของค่าเฉลี่ยของตัวอย่างสามารถประมาณได้โดยการแจกแจงแบบปกติ คุณสมบัตินี้ไม่ขึ้นอยู่กับประเภทของการกระจายตัวของประชากร