Validity และ Reliability สิ่งที่ต้องคำนึงถึงเมื่อจัดการประกวดแข่งขัน

Competition

Image credit: Pixabay.com

 

บล็อกตอนนี้ได้แรงบันดาลใจมาจากดราม่าการแข่งขันของแบรนด์นึงเมื่อเร็วๆ นี้ ใครที่เพิ่งอ่านดราม่ามา คงไม่ต้องให้ผมเอ่ยชื่อก็คงรู้ว่าแบรนด์ไหน แต่ไม่ขอเอ่ยชื่อแบรนด์เพราะไม่ใช่วัตถุประสงค์ของบล็อกตอนนี้แต่อย่างใด … สิ่งที่เกิดขึ้น โดยสรุปก็คือ ผู้เข้าแข่งขันออกมาตัดพ้อ ตำหนิ ฝาก Feedback ให้กับแบรนด์ เพราะกิจกรรมการแข่งขันนั้น มันไม่ได้วัดสิ่งที่พวกเขาอุตส่าห์เสียเวลา เสียเงิน เดินทางมาเพื่อเข้าร่วมประกวด มันเลยทำให้ผมนึกถึงสิ่งที่ได้ร่ำเรียนมาเรื่อง Validity และ Reliability ครับ

 

อะไรคือ Validity และ Reliability?!?

ในวิชาเรื่องการออกแบบสอบถามหรือเครื่องมือวัด (เพื่อใช้ในงานวิจัย เพื่อทำวิทยานิพนธ์) มันคือสองสิ่งสำคัญที่จะเป็นตัวบอกคุณภาพของแบบสอบถามหรือเครื่องมือวัดนั้นๆ ครับ คือ มันสามารถวัดได้ “เที่ยงตรง” แค่ไหน

  • Validity หรือ จะเรียกว่าความตรง หรือ ความถูกต้อง ก็ได้ (มันมาจากคำว่า Valid ที่แปลว่า มีเหตุผล มีมูล มีหลักฐาน หรือ ใช้ได้) แบบสอบถามหรือเครื่องมือวัดที่มี Validity นั้น จะหมายความว่ามันสามารถวัดในสิ่งที่ต้องการจะวัดได้ตรงประเด็น เช่น ถ้าเอาเครื่องชั่งน้ำหนักไปวัดน้ำหนัก ก็แสดงว่ามันมี Validity
  • Reliability หรือ จะเรียกว่าความเที่ยง หรือ ความน่าเชื่อถือ ก็ได้ (มาจาก Reliable ที่แปลว่า สามารถเชื่อถือได้ สามารถพึ่งพาได้) แบบสอบถามหรือเครื่องมือวัดที่มี Reliability นั้น จะหมายความว่าหากเอาไปวัดในสิ่งเดิมๆ กี่ทีๆ ก็จะได้ผลเท่าๆ กับของเดิม เช่น ด้วยความรู้เดิมๆ ไปทำข้อสอบภาษาอังกฤษ TOEFL กี่หนๆ ก็ได้คะแนนเท่าเดิม

ประเด็นก็คือ แบบสอบถามหรือเครื่องมือวัด มันอาจจะมี Reliability (คือ วัดกี่ที่ก็ได้เท่าเดิม) แต่อาจจะไม่มี Validity (ดันไม่ได้วัดในสิ่งที่ต้องการจะวัด) เลยก็ได้ เช่น ให้นักเรียนทำข้อสอบภาษาไทย เพื่อประเมินความสามารถด้านภาษาอังกฤษ ผลคือ ได้คะแนนอยู่ในช่วง 58-60 คะแนน แบบนี้เรียกว่ามี Reliability ค่อนข้างสูง แต่ว่า Validity ไม่มีเลย

หรือบางทีก็มี Validity แต่ดันไม่มี Reliability เลยก็ได้ เช่น เอาข้อสอบภาษาอังกฤษให้ทำ ชุดเดิน สามหนรวด แต่พอทำเสร็จ ปรากฏว่าได้คะแนน 13, 45, 98 ตามลำดับ ซึ่งไม่เท่ากันเลย แถมแตกต่างกันเยอะมาก แบบนี้แม้ว่าจะเป็นข้อสอบภาษาอังกฤษ มี Validity (เพราะวัดความสามารถทางภาษาอังกฤษโดยตรง) แต่ไม่มี Reliability (เพราะวัดกี่ทีๆ ก็ไม่ซ้ำ)

หลักการเดียวกันนี้ ก็เอามาประยุกต์ใช้กับการออกแบบการประกวดแข่งขันได้ครับ

 

การออกแบบกติกาการประกวดแข่งขันให้มี Validity และ Reliability

จริงๆ แล้ว การออกแบบกติกาให้มี Validity เนี่ยมันง่ายมากครับ เพราะหลายๆ อย่างเนี่ย มันมีวิธีวัดที่ชัดเจนอยู่แล้ว เช่น หากจะแข่งความแม่นในการชู้ตบาส ก็วัดกันด้วยการชู้ตลูกบาสเลย, หากจะแข่งความสามารถในการวาดรูป ก็ให้วาดรูปแข่งกันเลย, ถ้าอยากรู้ว่าใครกินจุ ก็ให้ลองแข่งกันกินสิ แบบนี้เป้นต้น ซึ่งหากนึกไม่ออกว่าจะตั้งกติกายังไง ก็สามารถไปปรึกษาผู้เชี่ยวชาญในสาขานั้นๆ ได้นะครับ

 

hypertension-867855_640

Image credit: Pixabay.com

 

ในหลายกรณีที่มีเครื่องมือวัดชัดเจน ก็ตั้งกติกาเพื่อให้ดูมี Validity ก็ไม่ยาก เช่น หากต้องการวัดความเร็วในการเคลื่อนที่ ก็มีเครื่องตรวจจับความเร็ว หากต้องการวัดน้ำหนักก็มีตาชั่ง … แต่ในกรณีของความสวยงามในการวาดภาพ หรือ ความสามารถในการร้องเพลงล่ะ?!? คำตอบก็คือ ก็ต้องใช้วิธีหากรรมการผู้ทรงคุณวุฒิในด้านนั้นๆ ที่สาธารณชนให้การยอมรับมาให้คะแนนครับ แบบนี้เรียกว่ามี Face validity เพราะอย่างน้อยๆ คนอื่นๆ ก็ยอมรับว่ามันวัดได้ตรงกับที่ต้องการอยู่นั่นเอง

ความยากต่อมาคือ การออกแบบการแข่งขันให้มี Reliability ต่างหาก … การแข่งบางอย่างมันออกแบบได้ไม่ยาก เช่น การแข่งเล่นเกม เพราะระดับความยากเท่าเดิม จะแข่งกี่รอบๆ ก็มักจะได้ได้ผลไม่แตกต่างจากเดิมมาก หากผู้เข้าแข่งขันสามารถทำได้เท่าๆ เดิม (เช่น การแข่งเกมขับรถ Asphalt 8: Airborne หรือเกม Cookie Run เป็นต้น)

 

The Voice Brasil

Image credit: Carlinhos Brown

 

การบางอย่าง มันก็ยากที่จะพิสูจน์เรื่อง Reliability ครับ ไม่ต้องยกตัวอย่างไกลมาก เอาที่คุ้นๆ กันเลยก็คือ การประกวดร้องเพลง เราจะเห็นกรรมการให้คะแนนกัน แต่เราไม่มีโอกาสพิสูจน์ว่าหากให้คนคนเดิม ร้องเพลงเดิมแบบเดิมๆ อีกครั้ง กรรมการจะให้คะแนนเท่าเดิม (ปกติถ้าจะพิสูจน์ ก็ต้องทำ Blind test สองหน หรือไม่ก็ต้องให้กรรมการให้คะแนนหนแรกเสร็จ แล้วทิ้งระยะเวลานึง ให้ฟังใหม่ ให้คะแนนใหม่อีกรอบ) … กรณีแบบนี้เขาเลยหาทางแก้ด้วยการเพิ่มจำนวนกรรมการผู้ให้คะแนนแทน โดยเลือกกรรมการที่มีความเชี่ยวชาญพอๆ กันมาให้คะแนน (แต่ในทางด้านการวิจัยจริงๆ แล้ว จะต้องมีการทดสอบสิ่งที่เรียกว่า Inter-rater reliability ก่อน แต่ในการจัดการแข่งขันก็ไม่ต้องทำถึงขนาดนั้น) จะเห็นได้ว่า การแข่งขันที่มีกรรมการหลายๆ คนนั้น กรรมการแต่ละคนก็มักจะให้คะแนนใกล้เคียงกัน มันคือเครื่องวัด Reliability นั่นเอง

 

สรุปหลักการง่ายๆ

เขียนมาซะยืดยาว อ่านแล้วอาจจะงง … ผมจะสรุปให้สั้นๆ กระชับๆ หน่อยแล้วกันนะ … การออกแบบกติกาการประกวดแข่งขันที่ดีนั้นควรที่จะ

  1. วัดสิ่งที่ต้องการจะวัด เช่น จะหาคนที่วาดรูปสวยสุด ก็ให้แข่งวาดรูป, จะหาคนเล่นเกม Cookie Run เก่งสุด ก็ให้แข่งเล่นเกม Cookie Run
  2. หากมีเครื่องมือวัดเฉพาะยิ่งดี เช่น เครื่องชั่งน้ำหนัก ไม้บรรทัด เกมที่ให้คะแนน พวกนี้มักจะมี Validity และ Reliability สูงดีอยู่แล้ว
  3. แต่หากไม่มีเครื่องมือวัด ก็ต้องใช้กรรมการให้คะแนน ต้องเลือกผู้ทรงคุณวุฒิในด้านนั้น และหากเป็นไปได้ ควรมีตั้งแต่ 3 คนขึ้นไป (เพื่อจะได้เห็นเทรนด์ของการให้คะแนน … หากไปในทางเดียวกัน ก็มี Reliaility)

ก็ขอฝากเอาไว้ให้แบรนด์ทั้งหลายเก็บไว้ไปคุยกับทีม Organizer ที่จัดงานนะครับ … การจัดงานแบบมืออาชีพ มีหลักการ มันจะทำให้ภาพลักษณ์ของแบรนด์ดูดีนะครับ

@kafaak

ในอดีตเมื่อครั้งยังไม่ต๊อกต๋อย เคยเป็นผู้บริหารฝ่ายผลิตของโรงงานอุตสาหกรรม แต่ภายหลังเลือกงานที่ให้เวลากับชีวิต เพื่อมาอัพเดตเทรนด์เทคโนโลยีมากกว่า ปัจจุบันเป็นทั้งไอทีต๊อกต๋อยในสถานศึกษา เป็นบล็อกเกอร์ต๊อกต๋อยที่เขียนไปเรื่อยทั้งเรื่องเทคโนโลยี โซเชียลมีเดีย การตลาดดิจิตอล และจิตวิทยา เป็นที่ปรึกษาด้านการตลาดดิจิตอลให้กับธุรกิจ SMEs หลายแห่ง และเป็นวิทยากรรับเชิญด้านเทคโนโลยี การตลาดดิจิตอล และโซเชียลมีเดีย เป็นบางครา

Leave a Reply

%d bloggers like this: