คำสาบานของ Hippocratic สำหรับวิทยาศาสตร์ข้อมูล? เราจะจัดการกับความรู้ด้านข้อมูลให้มากขึ้นอีก

คำสาบานของ Hippocratic สำหรับวิทยาศาสตร์ข้อมูล? เราจะจัดการกับความรู้ด้านข้อมูลให้มากขึ้นอีก

ฉันขอสาบานต่อ Hypatia โดย Lovelace โดย Turing โดย Fisher (และ/หรือ Bayes) และโดยนักสถิติและนักวิทยาศาสตร์ข้อมูลทั้งหมด ทำให้พวกเขาเป็นพยานว่าฉันจะทำตามความสามารถและวิจารณญาณของฉัน คำสาบานนี้และ การผูกมัดนี้ นี่อาจเป็นบรรทัดแรกของ “คำสาบานของ Hippocratic” สำหรับนักคณิตศาสตร์และนักวิทยาศาสตร์ข้อมูลหรือไม่? Hannah Fry รองศาสตราจารย์ด้านคณิตศาสตร์ของเมืองที่ University College London ให้เหตุผลว่านักคณิตศาสตร์และนัก

วิทยาศาสตร์ข้อมูลต้องการคำสาบานเช่นเดียวกับแพทย์ที่สาบาน

ว่าจะทำหน้าที่เพื่อประโยชน์สูงสุดของผู้ป่วยเท่านั้น “ในทางการแพทย์ คุณเรียนรู้เกี่ยวกับจริยธรรมตั้งแต่วันแรก ในวิชาคณิตศาสตร์ จะเป็นการดีที่สุด มันจะต้องอยู่ที่นั่นตั้งแต่วันแรกและอยู่ในระดับแนวหน้าของความคิดของคุณในทุกขั้นตอนที่คุณทำ” Fry แย้ง

แต่คำสาบานของ Hippocratic เวอร์ชันเทคโนโลยีจำเป็นหรือไม่? ในทางการแพทย์ คำสาบานเหล่านี้แตกต่างกันไปตามแต่ละสถาบัน และมีการพัฒนาอย่างมากในประวัติศาสตร์เกือบ 2,500 ปี แท้จริงแล้ว มีการถกเถียงกันว่าคำสาบานยังคงเกี่ยวข้องกับแพทย์ฝึกหัดหรือไม่ โดยเฉพาะอย่างยิ่งเมื่อเป็นกฎหมาย แทนที่จะเป็นชุดของหลักการกรีกโบราณ ซึ่งท้ายที่สุดแล้วพวกเขาต้องปฏิบัติตาม

อ่านเพิ่มเติม: จรรยาบรรณด้านไอที: แค่บริการปากหรืออะไรกัด?

วิทยาศาสตร์ข้อมูลมาถึงจุดที่คำมั่นสัญญาทางจริยธรรมมีความจำเป็นอย่างไร มีตัวอย่างมากมายของอัลกอริทึมที่ทำอันตราย ตัวอย่าง เช่น อัลกอริธึมการพิจารณาคดีอาญาได้แสดงให้เห็นแล้วว่ามีคำแนะนำอย่างไม่สมส่วนให้ส่งผู้มีรายได้น้อยและชนกลุ่มน้อยเข้าคุก

วิกฤตที่คล้ายกันได้นำไปสู่การเสนอคำมั่นสัญญาทางจริยธรรมมาก่อน ผลพวงของวิกฤตการเงินโลกในปี 2551 แถลงการณ์ของวิศวกรการเงิน Emanuel Derman และ Paul Wilmott ขอร้องให้ผู้สร้างแบบจำลองทางเศรษฐกิจสาบานว่าจะไม่ แต่ฉันจะทำให้สมมติฐานและการกำกับดูแลของมันชัดเจนขึ้น”

อคติสามารถเรียนรู้ได้ตั้งแต่ยังเป็นเด็ก อคติของอัลกอริทึมเหล่านี้เป็นผลมาจากการฝึกฝน คุณลักษณะทั่วไปของอัลกอริทึมเหล่านี้คือการใช้อัลกอริทึมกล่องดำ (มักเป็นกรรมสิทธิ์) ซึ่งหลายอัลกอริทึมได้รับการฝึกฝนโดยใช้ข้อมูลที่เอนเอียงทางสถิติ ในกรณีของกระบวนการยุติธรรมทางอาญา ผลลัพธ์ที่ไม่ยุติธรรมของอัลกอริทึมเกิด

ข้อเท็จจริงที่ว่าในอดีต ชนกลุ่มน้อยมีจำนวนมากเกินไปในประชากรเรือนจำ 

(ส่วนใหญ่เป็นผลมาจากอคติของมนุษย์ที่มีมานาน) ความลำเอียงนี้จึงถูกทำซ้ำและน่าจะรุนแรงขึ้นโดยอัลกอริทึม อัลกอริทึมแมชชีนเลิร์นนิงได้รับการฝึกฝนเกี่ยวกับข้อมูล และคาดว่าจะสร้างการคาดคะเนที่จำกัดเฉพาะข้อมูลเหล่านั้นได้เท่านั้น อคติเข้า, อคติออก.

การให้คำมั่นสัญญาอย่างมีจริยธรรมจะช่วยผู้ออกแบบอัลกอริทึมเหล่านี้หรือไม่? บางที แต่การตระหนักรู้มากขึ้นเกี่ยวกับอคติทางสถิติอาจเพียงพอแล้ว ปัญหาของการเป็นตัวแทนที่เป็นกลางในการสุ่มตัวอย่างเป็นรากฐานที่สำคัญของสถิติมาช้านาน และการฝึกอบรมในหัวข้อเหล่านี้อาจทำให้นักออกแบบถอยกลับและตั้งคำถามถึงความถูกต้องของการคาดคะเนของพวกเขา

Fry เองเคยให้ความเห็นเกี่ยวกับปัญหานี้ในอดีตโดยกล่าวว่า จำเป็นที่ผู้คนจะต้อง “ให้ความสนใจว่าอคติที่คุณมีต่อข้อมูลสามารถลงเอยด้วยการป้อนเข้าสู่การวิเคราะห์ที่คุณกำลังทำอยู่ได้อย่างไร”

แม้ว่าปัญหาของการเป็นตัวแทนที่เป็นกลางจะไม่ใช่เรื่องใหม่ในทางสถิติ แต่การใช้อัลกอริธึมที่มีประสิทธิภาพสูงที่เพิ่มขึ้นในพื้นที่ที่มีความขัดแย้งทำให้ “ความรู้ด้านข้อมูล” มีความเกี่ยวข้องมากขึ้นกว่าเดิม

ส่วนหนึ่งของปัญหาคือความง่ายในการประยุกต์ใช้อัลกอริทึมการเรียนรู้ของเครื่อง ทำให้การรู้ข้อมูลไม่ได้เฉพาะกับนักวิทยาศาสตร์ทางคณิตศาสตร์และคอมพิวเตอร์อีกต่อไป แต่กับสาธารณชนโดยรวม ความรู้ทางสถิติและข้อมูลพื้นฐานที่แพร่หลายจะช่วยให้ตระหนักถึงปัญหาที่มีอคติทางสถิติ และเป็นขั้นตอนแรกในการป้องกันการใช้อัลกอริทึมที่ไม่เหมาะสม

อ่านเพิ่มเติม: อัลกอริทึมมีอยู่ทุกที่ แต่เราจะต้องเชื่อถืออัลกอริทึมเหล่านี้อย่างไร

ไม่มีใครสมบูรณ์แบบ และแม้ว่าความรู้ด้านข้อมูลที่ได้รับการปรับปรุงจะช่วยได้ แต่ก็ยังมองข้ามอคติที่ไม่ได้ตั้งใจไปได้ อัลกอริทึมอาจมีข้อผิดพลาด วิธีหนึ่งที่ง่าย (ในการอธิบาย) ในการป้องกันปัญหาดังกล่าวคือการเปิดเผยต่อสาธารณะ โค้ดโอเพ่นซอร์สดังกล่าวสามารถให้ความรับผิดชอบร่วมกันในการตรวจสอบอคติและข้อผิดพลาด

ความพยายามในลักษณะนี้เริ่มปรากฏขึ้น ตัวอย่างเช่นโครงการความโปร่งใสและความรับผิดชอบของเว็บที่มหาวิทยาลัยพรินซ์ตัน แน่นอนว่าอัลกอริธึมที่เป็นกรรมสิทธิ์จำนวนมากนั้นมีความน่าเชื่อถือในเชิงพาณิชย์ ซึ่งทำให้ความโปร่งใสเป็นเรื่องยาก กรอบการกำกับดูแลจึงมีแนวโน้มที่จะมีความสำคัญและจำเป็นในด้านนี้ แต่มีเงื่อนไขเบื้องต้นสำหรับผู้ปฏิบัติงาน นักการเมือง นักกฎหมาย และคนอื่นๆ เพื่อทำความเข้าใจประเด็นเกี่ยวกับการนำแบบจำลองไปใช้อย่างแพร่หลาย และอคติทางสถิติโดยธรรมชาติ

จริยธรรมมีความสำคัญอย่างไม่ต้องสงสัย และในโลกที่สมบูรณ์แบบจะเป็นส่วนหนึ่งของการศึกษา แต่ระดับมหาวิทยาลัยมีขอบเขตจำกัด เราโต้แย้งว่าความรู้ด้านข้อมูลและสถิติเป็นข้อกังวลเร่งด่วนมากกว่า และอาจช่วยป้องกันการปรากฏตัวของ “อัลกอริทึมที่ผิดจรรยาบรรณ” ในอนาคต

เว็บแท้ / ดัมมี่ออนไลน