Categories: All - สถิติ - การกระจาย

by ณัฎฐ์ธิดา ทวยเจริญ 4 years ago

319

การคำนวณสถิติค่าสถิติ

การวิเคราะห์ข้อมูลทางสถิติมีหลายวิธีที่สามารถใช้เพื่อทำความเข้าใจและสรุปข้อมูลได้ดียิ่งขึ้น วิธีการเหล่านี้รวมถึงการหาค่ากลางต่างๆ เช่น ค่าฐานนิยมที่ใช้เมื่อข้อมูลมีการซ้ำกันมากผิดปกติ ค่านี้สามารถมีได้มากกว่าหนึ่งค่าและใช้ได้กับข้อมูลเชิงคุณภาพและเชิงปริมาณ นอกจากนี้ยังมีการวัดการกระจายของข้อมูลที่สำคัญ เช่น ส่วนเบี่ยงเบนมาตรฐานซึ่งบอกถึงการกระจายของข้อมูลได้ดีกว่าค่าพิสัยและค่าส่วนเบี่ยงเบนเฉลี่ย การวัดการกระจายสัมบูรณ์ยังรวมถึงการวัดค่าพิสัยที่ได้จากการลบค่าต่ำสุดจากค่าสูงสุด แม้ว่าค่าพิสัยจะง่ายต่อการคำนวณ แต่มีข้อเสียคือค่าพิสัยจะไม่แน่นอนเมื่อใช้กับข้อมูลที่มีจำนวนมาก และค่าพิสัยจะขึ้นอยู่กับขนาดของข้อมูล การวัดค่ากึ่งกลางพิสัยซึ่งเป็นค่าที่ได้จากการหาค่าเฉลี่ยเลขคณิตของค่ามากที่สุดและค่าน้อยที่สุดก็เป็นอีกวิธีหนึ่งที่ใช้ในการวิเคราะห์ข้อมูล

การคำนวณสถิติค่าสถิติ

การคำนวณสถิติค่าสถิติ

การวัดการกระจายของข้อมูล การวัดการกระจายสัมบูรณ์ (absolute variation)

การวัดการกระจายของข้อมูลชุดเดียวเพื่อศึกษาว่าข้อมูลแต่ละค่ามีความแตกต่างกันมากน้อยเพียงไรการวัดการกระจายสัมบูรณ์ที่นิยมใช้มี 4 วิธี
4 ส่วนเบี่ยงเบนมาตรฐาน ( Standard Deviation )
3 ส่วนเบี่ยงเบนเฉลี่ย ( Mean Deviation )
2 ส่วนเบี่ยงเบนควอร์ไทล์(Quartile Deviation )
1 พิสัย (Range)

ค่าพิสัย (Range : R)

ข้อเสียของพิสัย
2) ค่าของพิสัยจะขึ้ นอยู่กับขนาดของข้อมูล ถ้าข้อมูลมีจำนวนมาก พิสัยจะมาก ถ้าข้อมูลมีจำนวนน้อยพิสัยจะน้อย
1) ในกรณีใช้พิสัยกับข้อมูลที่มีจำนวนมาก การวัดจะไม่แน่นอน
ค่ากึ่งกลางพิสัย (Mid Range)
ค่ากึ่งกลางพิสัย คือค่าที่ได้จากการนำข้อมูลที่มีค่ามากที่สุดและ น้อยที่สุดมาหาค่าเฉลี่ยเลขคณิต
การวัดค่ากลาง
ตัวแทนของข้อมูลทั้งหมดที่สามารถจะไป ใช้ในการวิเคราะห์
การหาการกระจายของข้อมูลโดยนำข้อมูลที่มีค่าสูงที่สุดลบกับข้อมูลที่มีค่าต่ำที่สุดเพื่อให้ได้ค่าที่เป็นช่วงของการกระจายซึ่งสามารถบอกถึงความกว้างของข้อมูลชุดนั้นๆ สำหรับสูตรที่ใช้ในการหาพิสัย
พิสัย (R) = ค่าสูงสุด – ค่าต่ำสุด
พิสัย (R) = Xmax – Xmin

ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation : S.D)

เป็นค่าวัดการกระจายที่สำคัญทางสถิติ เพราะเป็นค่าที่ใช้บอกถึง การกระจายของข้อมูลได้ดีกว่าค่าพิสัย และค่าส่วนเบี่ยงเบนเฉลี่ย

ค่าฐานนิยม (Mode : Mo)

การหาค่าฐานนิยม(Mo) เมื่อข้อมูลไม่ได้มีการแจกแจงความถี่
ในกรณีที่ข้อมูลไม่ได้มีการแจกแจงความถี่ วิธีการหาค่าฐานนิยม(Mo) สามารถทำได้โดยการนับจำนวนข้อมูล ซึ่งข้อมูลชุดใดมีจำนวนซ้ำกันมากที่สุดก็จะเป็นค่าฐานนิยม
เป็นค่ากลางซึ่งจะนำมาใช้ในกรณี ที่ข้อมูลมีการซ้ำกันมากๆ จนผิดปกติ
สามารถมีค่าได้มากกว่า 1 ค่า
สามารถใช้ได้กับข้อมูลที่เป็นข้อมูลเชิงคุณภาพ (Qualitative) และข้อมูลเชิงปริมาณ(Quantitative)
เป็นค่ากลางหรือตัวแทนของข้อมูลที่สามารถ อธิบายลักษณะที่เกิดขึ้นได้ดีกว่าค่าเฉลี่ยเลขคณิต และค่ามัธยฐาน

ค่ามัธยฐาน

การหาค่ามัธยฐานของข้อมูลที่แจกแจงความถี่แล้ว สามารถหา ค่ามัธยฐานได้จากสูตรเมื่อจัดเรียงข้อมูลชุดหนึ่งซึ่งมีN ค่า ตำแหน่งของมัธยฐาน
Mdn คือ ค่ามัธยฐาน L0 คือ ขอบเขตล่างของชั้นที่มีมัธยฐานอยู่ i คือ อันตรภาคชั้น (ช่วงห่างของข้อมูลแต่ละชั้น) N คือ จ านวนข้อมูลทั้งหมด Cf คือ ความถี่สะสมที่อยู่ก่อนถึงชั้นที่มีตำแหน่งมัธยฐาน F คือ ความถี่ของคะแนนในชั้นที่มีมัธยฐาน
ขั้นตอนการหาค่ามัธยฐานมี 2 ขั้นตอน ดังนี้
การหาค่ามัธยฐานเมื่อข้อมูลไม่ได้มีการแจกแจงความถี่และมี จำนวนข้อมูลเป็นจำนวนคู่
การหาค่ามัธยฐาน เมื่อข้อมูลไม่ได้มีการแจกแจงความถี่และมี จำนวนข้อมูลเป็นจำนวนคี่
2) ทำการหาตำแหน่งกึ่งกลางของข้อมูลที่ได้จากการหาขั้นตอนที่1
1) เรียงลำดับข้อมูลจากมากไปน้อย หรือจากน้อยไปมาก
เป็นค่ากลางของข้อมูลที่ได้จากการพิจารณาตำแหน่งของข้อมูลที่อยู่ตรงกลางโดยที่
ค่ามัธยฐานยังสามารถใช้เป็นตัวแทนของ ข้อมูลได้เป็นอย่างดี ในกรณีที่ข้อมูลมีการ กระจายที่ผิดปกติ
ข้อมูลต้องทำการเรียงลำดับตามปริมาณ จากมากไปน้อย หรือจากน้อยไปมากก็ได้

ค่าเฉลี่ยเลขคณิต (Arithmetic Mean)

เนื่องจากเราเชื่อว่าในช่วง 21-30 นั้น ย่อมมีทั้งคนที่ได้คะแนนมาก และน้อยอยู่รวมกัน จึงใช้วิธีที่บอกว่าแต่ละตัวมากน้อยเท่าไหร่ไม่รู้ แต่ สุดท้ายต้องเอามารวมกันอยู่ดี เราเลยประมาณได้ว่าทุกตัวมีค่าอยู่ตรง กลางพอดี
ข้อมูลแจกแจงความถี่ คือ ข้อมูลที่ให้มาเป็นช่วงไม่สามารถบอกได้ว่า แต่ละตัวมีค่าเท่าไหร่ เช่น ในช่วง 21- 30 มีจ านวน 10 คน เราไม่ สามารถบอกได้ว่าใน 10 คนนี้ แต่ละคนมีค่าเท่าใด แล้วเราจะหา ผลรวมได้อย่างไร?
ค่าเฉลี่ยเลขคณิตของข้อมูลไม่แจกแจงความถี่ (ungrouped data)
จะใช้กรณีที่มีข้อมูลไม่มากนักและเป็นข้อมูลที่มาจากตัวอย่าง

Subtopic

หลักการการหาค่าเฉลี่ย
ทำได้โดยนำค่าทั้งหมดที่มีรวมกัน แล้วนำมาหารด้วย จำนวนของข้อมูล

ค่าเฉลี่ยเลขคณิตแบบแจกแจงความถี่

ค่าเฉลี่ยเลขคณิตของข้อมูลไม่แจกแจงความถี่

ข้อจำกัด
ถ้าข้อมูลมีการกระจายมาก หรือข้อมูลบางตัวมีค่ามากหรือน้อยจนผิดปกติ หรือข้อมูลมีการเพิ่มขึ้ นเป็นเท่าตัว ค่าเฉลี่ยเลขคณิต จะไม่สามารถเป็ นค่ากลางหรือเป็ นตัวแทนที่ดีของข้อมูลได
ที่เราเรียกกันย่อๆ ว่า ค่าเฉลี่ย เป็นค่ากลาง ทางสถิติค่าหนึ่ง ที่นิยมใช้ในการวิเคราะห์สถิติ

ค่าเฉลี่ยเลขคณิตเป็นค่ากลางหรือเป็นตัวแทน ของข้อมูลที่ดีที่สุด

1)เป็นค่าที่ไม่เอนเอียง 2)เป็นค่าที่มีความคงเส้นคงวา 3)เป็นค่าที่มีความแปรปรวนต่ำที่สุด 4)เป็นค่าที่มีประสิทธิภาพสูงสุด

นำข้อมูลมาจัดเรียงใหม่จากค่าน้อยไปค่ามากได้ดังนี้ 71, 71, 78, 83, 85, 86, 88, 88,90, 90
จะพบว่าข้อมูลส่วนใหญ่ในช่วง 83 - 88 และค่าต่ำสุดและสูงสุด ของข้อมูลชุดนี้ ต่างกัน 19 คะแนน ดังนั้น ใช้ค่าเฉลี่ยคณิตเป็ นค่ากลาง หรือเป็นตัวแทนชุดนี้ ได้ดี
Underemne
เหมาะที่จะนำมาใช้เป็นค่ากลางของข้อมูล เมื่อข้อมูล นั้นๆ ไม่มีค่าใดค่าหนึ่งหรือหลายๆ ค่าซึ่งสูงหรือต่ำกว่าค่าอื่นๆ ที่เหลืออย่างผิดปกติ
คะแนนสอบวิชาคณิตศาสตร์ของ นักเรียน 10 คน 71 , 83, 90, 90, 85, 71, 78, 86, 88, 88

นำเสนอนำเสนอ

เรื่อง
ลักษระของสารสนเทศที่ดี