การทดสอบสมมติฐาน

บทช่วยสอนที่ง่ายและสั้น ๆ เกี่ยวกับการทดสอบสมมติฐานโดยใช้ Python

ภาพจาก: http://www.advanceinnovationgroup.com/blog/median-based-hypothesis-testing

ในบล็อกนี้ฉันจะให้บทเรียนสั้น ๆ เกี่ยวกับการทดสอบสมมติฐานโดยใช้วิธีการทางสถิติใน Python การทดสอบสมมติฐานเป็นส่วนหนึ่งของวิธีการทางวิทยาศาสตร์ที่เราทุกคนคุ้นเคยกับสิ่งที่เราอาจได้เรียนรู้ในช่วงต้นปีการศึกษาของเรา อย่างไรก็ตามในสถิติมีการทดลองจำนวนมากในตัวอย่างของประชากร

“ การพิจารณาว่าชุดตัวอย่างของการสังเกตอะไรบอกเราเกี่ยวกับคำอธิบายที่นำเสนอโดยทั่วไปเราต้องการให้มีการอนุมานหรือตามที่เราเรียกว่านักสถิติกับเหตุผลที่ไม่แน่นอน การให้เหตุผลที่มีความไม่แน่นอนเป็นหลักของการอนุมานทางสถิติและโดยทั่วไปแล้วจะใช้วิธีการทดสอบ Null Hypothesis Significance -Ovens

เป็นตัวอย่างสำหรับบล็อกนี้ฉันจะใช้ชุดข้อมูลฟุตบอลยุโรปที่พบใน Kaggle และจะทำการทดสอบสมมติฐาน ชุดข้อมูลสามารถพบได้ที่นี่

ขั้นตอนที่ 1

ทำการสังเกต

ขั้นตอนแรกคือการสังเกตปรากฏการณ์ ในกรณีนี้มันจะเป็น: มีผลกระทบของความก้าวร้าวในการป้องกันโดยเฉลี่ยต่อเป้าหมายที่อนุญาตหรือไม่?

ขั้นตอนที่ 2

ตรวจสอบงานวิจัย

ความคิดที่ดีในการเดินทางคือทำงานอย่างชาญฉลาดไม่ยาก สิ่งหนึ่งที่ควรทำคือดูว่ามีงานวิจัยเกี่ยวกับการสังเกตของคุณอยู่แล้วหรือไม่ ถ้าเป็นเช่นนั้นอาจช่วยตอบคำถามของเรา การตระหนักถึงการวิจัยหรือการทดลองที่มีอยู่แล้วจะช่วยให้เราจัดโครงสร้างการทดสอบของเราได้ดีขึ้นหรืออาจตอบคำถามของเราและไม่ต้องทำการทดสอบในตอนแรก

ขั้นตอนที่ 3

สร้างสมมุติฐานว่างเปล่าและสมมุติฐานทางเลือก

สมมติฐานทางเลือกคือการเดาที่ได้รับการศึกษาของเราและสมมติฐานว่างนั้นตรงกันข้าม หากสมมติฐานทางเลือกระบุว่ามีความสัมพันธ์อย่างมีนัยสำคัญระหว่างสองตัวแปรสถานะสมมุติฐานว่างจะไม่มีความสัมพันธ์ที่สำคัญ

สมมุติฐาน Null ของเราจะเป็น: ไม่มีความแตกต่างทางสถิติในเป้าหมายที่อนุญาตให้กับทีมที่มีคะแนนการรุกรานสูงกว่าหรือเท่ากับ 65 เทียบกับทีมต่ำกว่า 65

สมมติฐานทางเลือก: มีความแตกต่างทางสถิติในเป้าหมายที่อนุญาตให้กับทีมที่มีระดับความก้าวร้าวป้องกันมากกว่าหรือเท่ากับ 65 เมื่อเทียบกับทีมที่ต่ำกว่า 65

ขั้นตอนที่ 4

ตรวจสอบว่าสมมติฐานของเราเป็นการทดสอบแบบด้านเดียวหรือแบบทดสอบแบบสองด้าน

การทดสอบแบบหนึ่งด้าน

“ หากคุณใช้ระดับนัยสำคัญ 0.05 การทดสอบแบบด้านเดียวช่วยให้อัลฟาของคุณทั้งหมดทดสอบความสำคัญทางสถิติในทิศทางเดียวที่น่าสนใจ” ตัวอย่างของการทดสอบแบบ one-tailed คือ“ ทีมฟุตบอลที่มีคะแนนความก้าวร้าวต่ำกว่า 65 ทำให้เป้าหมายมีความหมายมากกว่าทีมที่มีคะแนนต่ำกว่า 65”

การทดสอบแบบสองทาง

“ หากคุณใช้ระดับนัยสำคัญ 0.05 การทดสอบแบบสองด้านจะช่วยให้ครึ่งหนึ่งของอัลฟาของคุณทดสอบความสำคัญทางสถิติในทิศทางเดียวและอีกครึ่งหนึ่งของอัลฟาของคุณเพื่อทดสอบนัยสำคัญทางสถิติในอีกทางหนึ่ง ซึ่งหมายความว่า 0.025 อยู่ในแต่ละส่วนของการกระจายของสถิติทดสอบของคุณ "

ด้วยการทดสอบสองด้านคุณกำลังทดสอบนัยสำคัญทางสถิติในทั้งสองทิศทาง ในกรณีของเราเรากำลังทดสอบนัยสำคัญทางสถิติทั้งสองทิศทาง

ขั้นตอนที่ 5

กำหนดระดับนัยสำคัญตามเกณฑ์ (อัลฟา)

(ค่าอัลฟา): ขีด จำกัด เล็กน้อยที่เราโอเคเมื่อปฏิเสธสมมติฐานว่าง ค่าอัลฟาสามารถเป็นค่าใด ๆ ที่เราตั้งไว้ระหว่าง 0 ถึง 1 อย่างไรก็ตามค่าอัลฟาที่พบมากที่สุดในวิทยาศาสตร์คือ 0.05 อัลฟาที่ตั้งไว้ที่ 0.05 หมายความว่าเราโอเคกับการปฏิเสธสมมติฐานว่างแม้ว่าจะมีโอกาส 5% หรือน้อยกว่าที่ผลลัพธ์จะเกิดจากการสุ่ม

ค่า P: ความน่าจะเป็นที่คำนวณได้ของการมาถึงข้อมูลนี้แบบสุ่ม

หากเราคำนวณค่า p และมันออกมาเป็น 0.03 เราสามารถตีความสิ่งนี้โดยบอกว่า“ มีโอกาส 3% ที่ผลลัพธ์ที่ฉันเห็นเป็นจริงเนื่องจากการสุ่มหรือโชคที่บริสุทธิ์”

ภาพจาก Learn.co

เป้าหมายของเราคือการคำนวณค่า p และเปรียบเทียบกับอัลฟาของเรา ยิ่งการทดสอบยิ่งต่ำลง

ขั้นตอนที่ 6

ทำการสุ่มตัวอย่าง

ที่นี่เรามีชุดข้อมูลของเราที่เรียกว่าฟุตบอล สำหรับการทดสอบของเราเราต้องการเพียงสองคอลัมน์ในชุดข้อมูลของเรา: team_def_aggr_rating และ goal_allowed เราจะกรองออกไปยังสองคอลัมน์เหล่านี้จากนั้นสร้างชุดย่อยสองชุดสำหรับทีมที่มีคะแนนการรุกรานสูงกว่าหรือเท่ากับ 65 และทีมที่มีคะแนนการรุกรานต่ำกว่า 65

เพียงเพื่อสรุปสำหรับการทดสอบสมมติฐานของเรา:

ผลกระทบของความก้าวร้าวของการป้องกันต่อเป้าหมายที่อนุญาตโดยเฉลี่ย สมมติฐานที่เป็นโมฆะ: ไม่มีความแตกต่างทางสถิติในเป้าหมายที่อนุญาตให้กับทีมที่มีระดับความก้าวร้าวในการป้องกันมากกว่าหรือเท่ากับ 65 เทียบกับทีมที่ต่ำกว่า 65 ทางเลือกสมมติฐาน: มีความแตกต่างทางสถิติในเป้าหมายที่อนุญาตกับทีมที่ มากกว่าหรือเท่ากับ 65 กับทีมที่ต่ำกว่า 65 การทดสอบอัลฟ่าแบบสองด้าน: 0.05

ตอนนี้เรามีตัวอย่างสองรายการที่เราสามารถทำการทดสอบทางสถิติได้ ก่อนขั้นตอนนั้นฉันจะพล็อตการแจกแจงสองแบบเพื่อให้ได้ภาพ

ขั้นตอนที่ 7

ดำเนินการทดสอบสองตัวอย่าง

t-test สองตัวอย่างถูกใช้เพื่อพิจารณาว่าค่าเฉลี่ยประชากรสองค่าเท่ากันหรือไม่ สำหรับสิ่งนี้เราจะใช้โมดูล Python ชื่อ statsmodels ฉันจะไม่ลงรายละเอียดเกี่ยวกับสถิติมากเกินไป แต่คุณสามารถดูเอกสารได้ที่นี่

ขั้นตอนที่ 8

ประเมินและสรุปผล

จำได้ว่าอัลฟาที่เราตั้งไว้คือ = 0.05 อย่างที่เราเห็นจากผลการทดสอบของเราว่าค่า p-value นั้นน้อยกว่าค่าอัลฟาของเรา เราสามารถปฏิเสธสมมติฐานว่างได้และด้วยความมั่นใจ 95% ยอมรับสมมุติฐานทางเลือกของเรา

ขอบคุณสำหรับการอ่าน! สำหรับข้อมูลเชิงลึกเกี่ยวกับการทดสอบสมมติฐานคุณสามารถตรวจสอบโครงการกลุ่มนี้ใน GitHub I ที่เกี่ยวข้องในการทดสอบสมมติฐานที่นี่

แหล่งข้อมูล:

เตาอบแมทธิว “ สถิติและ“ วิธีการทางวิทยาศาสตร์” ที่ดึงมาจาก YourStatsGuru https://www.yourstatsguru.com/secrets/scimethod-stats/?v=4442e4af0916

รู้เบื้องต้นเกี่ยวกับ SAS ยูซีแอลเอ: กลุ่มที่ปรึกษาทางสถิติ จาก https://stats.idre.ucla.edu/other/mult-pkg/faq/general/faq-what-are-the-differences-between-one-tailed-and-two-tailed-tests/ (เข้าถึงพฤษภาคม 16, 2019)

คู่มือสถิติวิศวกรรม https://www.itl.nist.gov/div898/handbook/eda/section3/eda353.htm