แอลฟาโกะ![]() แอลฟาโกะ (อังกฤษ: AlphaGo) เป็นโปรแกรมคอมพิวเตอร์ที่เล่นเกมกระดานหมากล้อม[1] ที่ได้รับการพัฒนาโดย กูเกิล ดีปไมด์ ของ แอลฟาเบต อิงก์ ในกรุงลอนดอน แอลฟาโกะมีรุ่นสืบทอดที่มีอานุภาพมากกว่าถึงสามรุ่น ได้แก่ แอลฟาโกะ มาสเตอร์, แอลฟาโกะ ซีโร[2] และ แอลฟาซีโร ในเดือนตุลาคม ค.ศ. 2015 แอลฟาโกะกลายเป็นโปรแกรมคอมพิวเตอร์โกะตัวแรกที่ชนะนักหมากล้อมอาชีพโดยไม่มีแต้มต่อบนกระดานขนาด 19 × 19 เต็มรูปแบบ[3][4] ในเดือนมีนาคม ค.ศ. 2016 มันสามารถเป็นฝ่ายชนะอี เซ-ดล ในการแข่งขันห้าเกม ซึ่งเป็นครั้งแรกที่โปรแกรมคอมพิวเตอร์โกะสามารถเป็นฝ่ายชนะมืออาชีพระดับ 9 ดั้งโดยไม่มีแต้มต่อ[5] แม้ว่าจะเป็นฝ่ายแพ้อี เซ-ดล ในเกมที่สี่ แต่อีก็ยอมแพ้ในเกมสุดท้าย ส่งผลให้แอลฟาโกะเป็นฝ่ายชนะด้วยผล 4 ต่อ 1 ในการยอมรับถึงชัยชนะ แอลฟาโกะได้รับรางวัล 9 ดั้งกิตติมศักดิ์จากสมาคมหมากล้อมแห่งประเทศเกาหลี[6] รายการดังกล่าวและนัดท้าชิงกับอี เซ-ดล ได้รับการบันทึกไว้ในภาพยนตร์สารคดีที่มีชื่อเดียวกันว่า แอลฟาโกะ[7] กำกับโดยเกร็ก โคหส์ ผลงานนี้ได้รับเลือกจากวารสารไซเอินซ์ในตำแหน่งรองชนะเลิศของความก้าวหน้าแห่งปี ในวันที่ 22 ธันวาคม ค.ศ. 2016[8] ที่การประชุมสุดยอดหมากล้อมแห่งอนาคต ค.ศ. 2017 แอลฟาโกะเป็นฝ่ายชนะเคอ เจี๋ย ซึ่งเป็นผู้เล่นอันดับ 1 ของโลกในเวลานั้น ในการแข่งขันสามเกม หลังจากนั้น แอลฟาโกะได้รับรางวัล 9 ดั้งระดับมืออาชีพจากสมาคมหมากล้อมแห่งประเทศจีน[9] แอลฟาโกะใช้ขั้นตอนวิธีคำนวณแบบการค้นหาต้นไม้มงเต การ์โล เพื่อหาตาเดินของมันโดยขึ้นอยู่กับความรู้ที่ได้ "เรียนรู้" ก่อนหน้านี้โดยการเรียนรู้ของเครื่อง โดยเฉพาะโครงข่ายประสาทเทียม (กระบวนการการเรียนรู้เชิงลึก) โดยการฝึกฝนที่ครอบคลุมแบบถ้วนทั่ว ทั้งจากการเล่นของมนุษย์และคอมพิวเตอร์[10] โครงข่ายประสาทได้รับการฝึกเพื่อคาดการณ์การเลือกเดินของตัวแอลฟาโกะเองและเป็นฝ่ายชนะเกม โครงข่ายประสาทนี้ช่วยเพิ่มพลังของการคำนวณแบบการค้นหาต้นไม้ ส่งผลให้มีการเลือกเดินมีคุณภาพสูงขึ้น และการเล่นด้วยตัวเองที่แข็งแกร่งขึ้นในการทำซ้ำครั้งต่อไป หลังจากการแข่งขันระหว่างแอลฟาโกะกับเคอ เจี๋ย แอลฟาโกะได้อำลาวงการในขณะที่ดีปไมด์ดำเนินการวิจัยเอไอในด้านอื่น ๆ ต่อไป[11] การเริ่มต้นจาก 'หน้าว่าง' ด้วยระยะเวลาการฝึกสั้น ๆ เท่านั้น ยังทำให้แอลฟาโกะ ซีโร ประสบความสำเร็จ 100–0 เกม จากการเป็นฝ่ายชนะชนะแชมป์อย่างแอลฟาโกะ ในขณะที่รุ่นสืบทอดอย่างแอลฟาซีโร ซึ่งทำการสอนด้วยตัวเอง ก็ยังได้รับการยอมรับในฐานะมืออันดับต้น ๆ ของโลก ทั้งในหมากล้อมและอาจรวมถึงในหมากรุกสากล ประวัติหมากล้อมได้รับการพิจารณาว่ายากมากสำหรับคอมพิวเตอร์ที่จะเป็นฝ่ายชนะกว่าเกมอื่น ๆ เช่นหมากรุก เนื่องจากจำนวนการแตกกิ่งก้านที่มีขนาดใหญ่มากจึงทำให้ยากที่จะใช้วิธีการดั้งเดิมของเอไอ เช่น การตัดออกแบบแอลฟา–เบตา, การท่องต้นไม้ และการค้นหาวิทยาการศึกษาสำนึก[3][12] เกือบสองทศวรรษหลังจากที่ดีปบลูคอมพิวเตอร์ของไอบีเอ็มชนะแชมป์หมากรุกโลกอย่างแกรี คาสปารอฟ ในดีปบลูพบคาสปารอฟ โปรแกรมหมากล้อมที่แข็งแกร่งใช้เทคนิคปัญญาประดิษฐ์ถึงระดับ 5 ดั้งสมัครเล่นเท่านั้น[10] และยังไม่สามารถเอาชนะผู้เล่นหมากล้อมระดับอาชีพได้โดยไม่มีแต้มต่อ[3][4][13] ส่วนในปี ค.ศ. 2012 โปรแกรมซอฟต์แวร์เซน ได้ทำงานบนคอมพิวเตอร์สี่กลุ่ม และเป็นฝ่ายชนะมาซากิ ทาเกมิยะ (9 ดั้งอาชีพ) สองครั้งด้วยแต้มต่อห้าและสี่เม็ด[14] ครั้นในปี ค.ศ. 2013 ซอฟต์แวร์เครซีสโตน เป็นฝ่ายชนะโยชิโอะ อิชิดะ (9 ดั้งอาชีพ) ด้วยแต้มต่อสี่เม็ด[15] อ้างอิงจากเดวิด ซิลเวอร์ ของดีปไมด์ โครงการวิจัยแอลฟาโกะก่อตั้งขึ้นประมาณปี ค.ศ. 2014 เพื่อทดสอบเครือข่ายประสาทเทียมที่ใช้การเรียนรู้เชิงลึกสามารถเข้าแข่งขันในหมากล้อมได้[16] แอลฟาโกะแสดงถึงการปรับปรุงที่สำคัญกว่าโปรแกรมหมากล้อมรุ่นก่อน โดยใน 500 เกมได้เผชิญกับโปรแกรมหมากล้อมอื่น ๆ ที่มีอยู่ รวมทั้งเครซีสโตนและเซน[17] แอลฟาโกะที่ทำงานบนคอมพิวเตอร์เครื่องเดียวได้เป็นฝ่ายชนะทุกเกมยกเว้นเพียงเกมเดียว[18] ในการจับคู่ที่คล้ายกัน แอลฟาโกะทำงานบนคอมพิวเตอร์หลายเครื่องได้ชนะเกมทั้งหมด 500 เกมที่เล่นกับโปรแกรมหมากล้อมอื่น ๆ และ 77 เปอร์เซนต์ของเกมที่เล่นกับแอลฟาโกะทำงานบนคอมพิวเตอร์เครื่องเดียว เวอร์ชันเผยแพร่ในเดือนตุลาคม ค.ศ. 2015 ใช้ 1,202 หน่วยประมวลผลกลาง และ 176 หน่วยประมวลผลกราฟิกส์[10] แมตช์ปะทะฝาน ฮุยในเดือนตุลาคม ค.ศ. 2015 รุ่นเผยแพร่ของแอลฟาโกะชนะแชมป์หมากล้อมของยุโรปอย่างฝาน ฮุย[19] ซึ่งเป็นนักหมากล้อมอาชีพระดับ 2 ดั้ง (จากที่มีทั้งหมด 9 ดั้ง) ห้าต่อศูนย์เกม[4][20] นี่เป็นครั้งแรกที่โปรแกรมหมากล้อมคอมพิวเตอร์เป็นฝ่ายชนะผู้เล่นระดับอาชีพบนกระดานขนาดเต็มโดยไม่มีแต้มต่อ[21] การประกาศข่าวดังกล่าวล่าช้าไปจนถึงวันที่ 27 มกราคม ค.ศ. 2016 เพื่อให้ตรงกับการตีพิมพ์บทความในวารสารเนเจอร์[10] โดยมีการอธิบายถึงการใช้อัลกอริทึม[4] แมตช์ปะทะอี เซ-ดลแอลฟาโกะได้เล่นกับอี เซ-ดล ซึ่งเป็นนักหมากล้อมระดับอาชีพ 9 ดั้งชาวเกาหลีใต้ หนึ่งในผู้เล่นที่ดีที่สุดในหมากล้อม[13] กับห้าเกมที่จัดที่โรงแรมโฟร์ซีซันส์ในกรุงโซล ประเทศเกาหลีใต้เมื่อวันที่ 9, 10, 12, 13 และ 15 มีนาคม ค.ศ. 2016[22][23] ซึ่งมีวิดีโอสตรีมถ่ายทอดสด[24] ส่วนเอจา ฮวง ซึ่งเป็นสมาชิกทีมดีปไมด์ และนักเล่นหมากล้อม 6 ดั้งสมัครเล่น ได้วางเม็ดบนกระดานหมากล้อมให้แก่แอลฟาโกะ ซึ่งทำงานผ่านระบบคลาวด์ของกูเกิลพร้อมกับเซิร์ฟเวอร์ที่ตั้งอยู่ในสหรัฐ[25] การแข่งขันใช้กติกาแบบจีนกับโคมิ 7.5 แต้ม และแต่ละฝ่ายมีเวลาในการคิดสองชั่วโมงบวกกับระยะเวลาเบียวโยมิ 60 วินาที[26] เวอร์ชันของแอลฟาโกะที่เล่นกับอีใช้จำนวนกำลังประมวลผลเหมือนกับที่ใช้ในการแข่งขันกับฝาน ฮุย[27] นิตยสารดิอีโคโนมิสต์รายงานว่าใช้ 1,920 หน่วยประมวลผลกลาง และ 280 หน่วยประมวลผลกราฟิกส์[28] ในขณะที่เล่น อี เซ-ดล มีชัยชนะหมากล้อมชิงแชมป์ระหว่างประเทศสูงสุดเป็นอันดับ 2 ของโลก[29] แม้ว่าจะไม่มีวิธีการอย่างเป็นทางการในการจัดอันดับหมากล้อมระดับนานาชาติ แต่แหล่งข่าวบางแห่งได้ให้อี เซ-ดล เป็นผู้เล่นที่ดีที่สุดอันดับที่สี่ในโลกในขณะนั้น[30][31] ส่วนแอลฟาโกะไม่ได้รับการฝึกโดยเฉพาะเพื่อเผชิญหน้ากับอี[32] แอลฟาโกะเป็นฝ่ายชนะสามเกมแรกตามการยอมจำนนของอี[33][34] อย่างไรก็ตาม อีเป็นฝ่ายชนะแอลฟาโกะในเกมที่สี่ ที่ชนะจากฝ่ายตรงข้ามยอมจำนนในตาที่ 180 จากนั้น แอลฟาโกะยังคงชนะได้เป็นครั้งที่สี่ จากการชนะเกมที่ห้าโดยอีกฝ่ายยอมจำนน[35] รางวัลนี้มีมูลค่า 1 ล้านดอลลาร์สหรัฐ เนื่องด้วยแอลฟาโกะเป็นฝ่ายชนะสี่ในห้าเกม และดังนั้น รางวัลจะนำไปมอบให้แก่องค์กรการกุศล รวมทั้งยูนิเซฟ ส่วนอี เซ-ดล ได้รับเงิน 150,000 ดอลลาร์สำหรับการเข้าร่วมในเกมทั้งหมดห้าเกมและเพิ่มอีก 20,000 ดอลลาร์สำหรับการชนะของเขา[26] ในเดือนมิถุนายน ค.ศ. 2016 ในการนำเสนอที่จัดขึ้นที่มหาวิทยาลัยในประเทศเนเธอร์แลนด์ เอจา ฮวง หนึ่งในทีมดีปไมด์ เปิดเผยว่าได้แก้ไขปัญหาที่เกิดขึ้นในระหว่างเกมที่ 4 ระหว่างแอลฟาโกะกับอี และหลังจากตาเดินที่ 78 (ซึ่งได้รับการขนานนามว่า "การเคลื่อนย้ายของพระเจ้า" โดยระดับอาชีพหลายคน) มันจะเล่นได้อย่างแม่นยำและรักษาความได้เปรียบของหมากดำ ก่อนถึงตาเดินที่ 78 แอลฟาโกะเป็นผู้นำตลอดเกมและการเดินของอีไม่ได้รับการยกย่องว่าเป็นหนึ่งในเกมที่ชนะ แต่เกิดจากพลังการประมวลผลของโปรแกรมถูกเบี่ยงเบนและสับสน[36] ฮวงอธิบายว่าเครือข่ายวิถีทางของแอลฟาโกะของการหาคำสั่งเดินที่แม่นยำที่สุดและความต่อเนื่อง ไม่ได้นำแอลฟาโกะไปสู่ความต่อเนื่องที่ถูกต้องหลังจากตาเดินที่ 78 เนื่องจากเครือข่ายประเมินค่าไม่ได้ระบุว่าตาเดินที่ 78 ของอีจะเป็นไปได้มากที่สุด และดังนั้นเมื่อเดินตาดังกล่าว ทำให้แอลฟาโกะไม่สามารถปรับให้ถูกต้องเพื่อความต่อเนื่องทางตรรกะได้[37] หกสิบเกมออนไลน์เมื่อวันที่ 29 ธันวาคม ค.ศ. 2016 บัญชีใหม่บนเซิร์ฟเวอร์ทาอีเจ็มชื่อ "มาจิสเตอร์" (Magister) (ซึ่งแสดงเป็น 'มาจิสต์' (Magist) ในเวอร์ชันภาษาจีนของเซิร์ฟเวอร์) จากประเทศเกาหลีใต้ได้เริ่มเล่นเกมกับนักกีฬามืออาชีพ จากนั้นได้เปลี่ยนชื่อบัญชีเป็น "มาสเตอร์" (Master) ในวันที่ 30 ธันวาคม แล้วย้ายไปที่เซิร์ฟเวอร์ฟอกซ์โกะในวันที่ 1 มกราคม ค.ศ. 2017 ครั้นเมื่อวันที่ 4 มกราคม ทางดีปไมด์ได้ยืนยันว่าทั้ง "มาจิสเตอร์" และ "มาสเตอร์" เป็นการเล่นโดยแอลฟาโกะในเวอร์ชันที่อัปเดตแล้ว[38][39] ณ วันที่ 5 มกราคม ค.ศ. 2017 สถิติออนไลน์ของแอลฟาโกะคือแพ้ 60 ครั้งและแพ้ 0 ครั้ง[40] รวมถึงสามชัยชนะเหนือผู้เล่นอันดับหนึ่งของหมากล้อมอย่างเคอ เจี๋ย[41] ที่ได้รับการบรรยายสรุปอย่างเงียบ ๆ ล่วงหน้าว่ามาสเตอร์เป็นเวอร์ชันหนึ่งของแอลฟาโกะ[40] หลังจากแพ้ต่อมาสเตอร์ กู่ ลี่ เสนอเงินรางวัล 100,000 หยวน (14,400 ดอลลาร์สหรัฐ) ให้แก่ผู้เล่นคนแรกที่สามารถเอาชนะมาสเตอร์ได้[39] มาสเตอร์เล่นที่ 10 เกมต่อวัน หลายคนสงสัยอย่างรวดเร็วว่าเป็นผู้เล่นเอไอเนื่องจากมีการพักระหว่างเกมน้อยหรือไม่มีเลย คู่ต่อสู้ของมันรวมถึงแชมป์โลกหลายราย เช่น เคอ เจี๋ย, พัก จ็อง-ฮวัน, ยูตะ อิยามะ, ตั้ว เจียซี, หมี่ ยวี่ถิง, สือ เยวี่ย, เฉิน เย่าเย่, หลี่ ชินเฉิง, กู่ ลี่, ฉาง เฮ่า, ถัง เหวยซิง, ฟั่น ถิงอี้ว์, โจว รุ่ยหยาง, เจียง เหวยเจี๋ย, โจว จุ้น-ซุน, คิม จี-ซ็อก, คัง ทง-ยุน, พัก ย็อง-ฮุน และว็อน ซ็อง-จิน; แชมป์ของประเทศหรือรองแชมป์โลก เช่น เหลียน เซี่ยว, ถัน เซี่ยว, เม่ง ไท่หลิง, ตั่ง อี้เฟย, หวง หยุนซง, หยาง ติ่งซิน, กู จื่อเหา, ชิน จินซอ, โช ฮัน-ซึง และอัน ซ็องจุน เกมทั้งหมด 60 เกมยกเว้นหนึ่งเกมเป็นเกมเร็ว กับสามเกมแบบเบียวโยมิ 20 หรือ 30 วินาที มาสเตอร์ได้เสนอให้ขยายเบียวโยมิไปหนึ่งนาทีเมื่อเล่นกับเนี่ย เว่ยผิง ในการพิจารณาจากอายุของเขา หลังจากชนะเกมที่ 59 มาสเตอร์ได้เปิดเผยตัวเองในแชทรูมที่ได้รับการควบคุมโดย ดร. เอจา ฮวง จากทีมดีปไมด์[42] แล้วเปลี่ยนสัญชาติของมันเป็นสหราชอาณาจักร หลังจากเกมเหล่านี้เสร็จสิ้น เดมิส ฮัสซาบิส ซึ่งเป็นผู้ร่วมก่อตั้งกูเกิล ดีปไมด์ ได้กล่าวในทวีตว่า "เรากำลังรอคอยที่จะเล่นเกมอย่างเป็นทางการและเต็มรูปแบบในเวลาต่อมา [ค.ศ. 2017] โดยร่วมมือกับองค์กรหมากล้อมและผู้เชี่ยวชาญ"[38][39] ผู้เชี่ยวชาญด้านหมากล้อมรู้สึกประทับใจกับประสิทธิภาพการทำงานของแอลฟาโกะ และสไตล์การเล่นที่ไม่ได้เป็นมนุษย์ เคอ เจี๋ย กล่าวว่า "หลังจากที่มนุษยชาติใช้เวลาหลายพันปีในการปรับปรุงกลยุทธ์ของเรา คอมพิวเตอร์บอกเราว่ามนุษย์เป็นฝ่ายผิดอย่างสิ้นเชิง... ผมจะส่งเสียงเท่าที่จะบอกได้ว่าไม่ใช่มนุษย์คนเดียวที่ได้สัมผัสกับขอบแห่งความจริงของหมากล้อม"[40] การประชุมสุดยอดหมากล้อมแห่งอนาคตในการประชุมสุดยอดหมากล้อมแห่งอนาคต ซึ่งจัดขึ้นที่อูเจิ้นในเดือนพฤษภาคม ค.ศ. 2017 แอลฟาโกะได้เล่นสามเกมกับเคอ เจี๋ย ซึ่งเป็นนักหมากล้อมอันดับ 1 ของโลก รวมทั้งสองเกมกับมืออาชีพจีนชั้นนำหลายคน ได้แก่ เกมหมากล้อมแบบจับคู่หนึ่งเกม และที่พบกับทีมห้าผู้เล่นที่เป็นมนุษย์อีกหนึ่งเกม[43] กูเกิล ดีปไมด์ มอบรางวัล 1.5 ล้านดอลลาร์เป็นรางวัลแก่ผู้ชนะสำหรับการจับคู่สามเกมระหว่างเคอ เจี๋ย และแอลฟาโกะ ขณะที่ฝ่ายแพ้ได้รับเงิน 300,000 ดอลลาร์[44][45][46] ซึ่งแอลฟาโกะชนะทั้งสามเกมกับเคอ เจี๋ย[47][48] รวมทั้งแอลฟาโกะได้รับรางวัล 9 ดั้งระดับมืออาชีพจากสมาคมหมากล้อมแห่งประเทศจีน[9] หลังจากที่ชนะการแข่งขันสามเกมกับเคอ เจี๋ย ผู้เป็นนักหมากล้อมอันดับสูงสุด แอลฟาโกะก็ได้อำลาวงการ และทางดีปไมด์ยังยกเลิกการทำงานของทีมที่ทำงานเกี่ยวกับเกมเพื่อมุ่งเน้นไปที่การวิจัยเอไอในด้านอื่น ๆ ต่อไป[11] หลังจากการประชุมสุดยอด ดีปไมด์ได้เผยแพร่แมตช์แอลฟาโกะปะทะแอลฟาโกะ 50 เกมเต็มความยาว เป็นของขวัญให้แก่ชุมชนหมากล้อม[49] แอลฟาโกะ ซีโร และแอลฟาซีโรทีมแอลฟาโกะเผยแพร่บทความในวารสารเนเจอร์ เมื่อวันที่ 19 ตุลาคม ค.ศ. 2017 โดยแนะนำแอลฟาโกะ ซีโร ซึ่งเป็นเวอร์ชันที่ไม่มีข้อมูลของมนุษย์และแข็งแกร่งกว่าเวอร์ชันก่อน ๆ ของมนุษย์ที่ชนะการแข่งขัน[50] โดยการเล่นเกมกับตัวเอง แอลฟาโกะ ซีโร เหนือกว่าจุดแข็งของแอลฟาโกะ อี ภายในสามวันด้วยการชนะ 100 เกมต่อ 0 อีกทั้งถึงระดับของแอลฟาโกะ มาสเตอร์ ภายใน 21 วัน และเหนือกว่ารุ่นเก่าทั้งหมดใน 40 วัน[51] ในเอกสารที่เผยแพร่ในอาร์ซิฟเมื่อวันที่ 5 ธันวาคม ค.ศ. 2017 ดีปไมด์อ้างว่ามันใช้แนวทางแอลฟาโกะ ซีโร โดยทั่วไปจนกลายเป็นแอลฟาซีโรอัลกอริทึมเดียว ซึ่งประสบความสำเร็จภายใน 24 ชั่วโมงในระดับที่เหนือกว่าของการเล่นในเกมหมากรุกสากล, หมากรุกญี่ปุ่น และหมากล้อม โดยการเอาชนะโปรแกรมแชมป์โลก ทั้งสต็อกฟิช, เอลโม และแอลฟาโกะ ซีโร เวอร์ชัน 3 วัน[52] แกรนด์มาสเตอร์ ฮิการุ นากามูระ รู้สึกประทับใจเล็กน้อยในการชนะหมากรุกสากลของแอลฟาซีโร โดยกล่าวว่า "ความเข้าใจของผมคือแอลฟาซีโรนั้นใช้ซูเปอร์คอมพิวเตอร์ของกูเกิล และสต็อกฟิชไม่ทำงานบนฮาร์ดแวร์นั่น สต็อกฟิชนั้นทำงานบนแล็ปท็อปของผม หากคุณต้องการมีการแข่งขันที่เทียบเคียงคุณต้องมีสต็อกฟิชทำงานบนซูเปอร์คอมพิวเตอร์เช่นกัน"[53] ผู้เล่นหมากรุกสากลระดับแถวหน้าของสหรัฐอย่างโวล์ฟ มอร์โรว์ ก็รู้สึกไม่ประทับใจเช่นกัน โดยอ้างว่าแอลฟาซีโรอาจจะไม่ทำให้รอบรองชนะเลิศของการแข่งขันที่เป็นธรรมเหมือนกับทีซีอีซีที่เอนจินทั้งหมดเล่นบนฮาร์ดแวร์ที่เท่าเทียมกัน มอร์โรว์กล่าวเพิ่มเติมว่าแม้ว่าเขาอาจจะไม่สามารถเอาชนะแอลฟาซีโรได้หากแอลฟาซีโรเล่นเปืดเกมเช่นการป้องกันของเปตรอฟ ซึ่งแอลฟาซีโรจะไม่สามารถเอาชนะเขาได้ในเกมหมากรุกทางจดหมายเช่นกัน[54] เครื่องมือการสอนเมื่อวันที่ 11 ธันวาคม ค.ศ. 2017 ดีปไมด์ได้เปิดตัวเครื่องมือการสอนแอลฟาโกะในเว็บไซต์ของตน[55] เพื่อวิเคราะห์อัตราการชนะของการเปิดหมากล้อมที่แตกต่างกันตามที่แอลฟาโกะ มาสเตอร์ คำนวณ[56] เครื่องมือการสอนรวบรวม 6,000 การเปิดหมากล้อมจาก 230,000 เกมของมนุษย์ในแต่ละเกมที่วิเคราะห์ด้วย 10,000,000 แบบจำลองโดยแอลฟาโกะ มาสเตอร์ หลายการเปิดประกอบด้วยการแนะนำการดำเนินเกมของมนุษย์[56] เวอร์ชันแอลฟาโกะเวอร์ชันก่อน ๆ ได้รับการทดสอบเกี่ยวกับฮาร์ดแวร์ที่มีซีพียูและจีพียูหลายแบบ โดยทำงานในแบบอะซิงโครนัสหรือโหมดแบบกระจาย สองวินาทีของการคิดในการเดินแต่ละตา ผลการให้คะแนนอีโลแสดงที่รายการด้านล่าง[10] โดยในการแข่งขันที่มีเวลาต่อการเดินมากขึ้นระดับการให้คะแนนเมื่อชนะก็จะมากขึ้น
ในเดือนพฤษภาคม ค.ศ. 2016 กูเกิลได้เปิดตัว "หน่วยประมวลผลเทนเซอร์" ซึ่งเป็นฮาร์ดแวร์ที่เป็นกรรมสิทธิ์ของตนเอง ซึ่งระบุว่าได้รับการติดตั้งในโครงการภายในหลายแห่งที่กูเกิลแล้ว รวมทั้งการแข่งขันแอลฟาโกะกับอี เซ-ดล[57][58] ในการประชุมสุดยอดหมากล้อมแห่งอนาคตเมื่อเดือนพฤษภาคม ค.ศ. 2017 ดีปไมด์เผยว่าเวอร์ชันของแอลฟาโกะที่ใช้ในการประชุมสุดยอดครั้งนี้คือแอลฟาโกะ มาสเตอร์[59][60] และเปิดเผยว่าได้วัดความแรงของซอฟต์แวร์เวอร์ชันต่าง ๆ ส่วนแอลฟาโกะ อี ซึ่งเป็นเวอร์ชันที่ใช้กับอี สามารถต่อให้แอลฟาโกะ ฝาน ซึ่งเป็นเวอร์ชันที่ใช้กับฝาน ฮุย ด้วยแต้มต่อสามเม็ด และแอลฟาโกะ มาสเตอร์ ที่มีแต้มต่อสามเม็ดอีกแบบที่แข็งแกร่งขึ้น[61]
ขั้นตอนวิธีตั้งแต่ปี ค.ศ. 2016 ขั้นตอนวิธีของแอลฟาโกะใช้การรวมกันของการเรียนรู้ของเครื่องและเทคนิคการคำนวณแบบการค้นหาต้นไม้ รวมกับการฝึกแบบกว้าง ทั้งจากการเล่นของมนุษย์และคอมพิวเตอร์ มันใช้การคำนวณแบบการค้นหาต้นไม้มงเต การ์โล ที่นำโดย "เครือข่ายคุณค่า" และ "เครือข่ายนโยบาย" ซึ่งดำเนินการโดยใช้โครงข่ายประสาทเทียมแบบลึก[3][10] จำนวนจำกัดของการตรวจจับคุณลักษณะเฉพาะเกมก่อนการประมวลผล (ตัวอย่างเช่น เพื่อเน้นว่าการเดินตรงกับรูปแบบนากาเดะ) ได้นำมาใช้กับอินพุตก่อนที่จะถูกส่งไปยังโครงข่ายประสาทเทียม[10] ระบบโครงข่ายประสาทเทียมได้รับการปลุกเครื่องในขั้นต้นจากความชำนาญในการเล่นเกมของมนุษย์ แอลฟาโกะได้รับการฝึกขั้นต้นเพื่อเลียนแบบการเล่นของมนุษย์โดยพยายามจับคู่การเคลื่อนไหวของผู้เล่นระดับอาชีพจากเกมประวัติศาสตร์ที่บันทึกไว้ โดยใช้ฐานข้อมูลประมาณ 30 ล้านรูปแบบการวางหมาก[19] เมื่อมันถึงระดับหนึ่งของความสามารถ มันก็ได้รับการฝึกเพิ่มเติมโดยการตั้งค่าให้เล่นเกมจำนวนมากกับอินสแตนซ์อื่น ๆ ของตัวเอง โดยใช้การเรียนแบบเสริมกำลังเพื่อพัฒนาการเล่นของมัน[3] และเพื่อหลีกเลี่ยงการเสียเวลาของฝ่ายตรงข้าม โปรแกรมจะถูกกำหนดไว้เป็นพิเศษเพื่อยอมแพ้หากมีการประเมินความน่าจะเป็นของชัยชนะภายใต้เกณฑ์บางอย่าง สำหรับการแข่งขันกับอี เกณฑ์การยอมแพ้ถูกกำหนดไว้ที่ 20 เปอร์เซ็นต์[63] รูปแบบการเล่นโทบี แมนนิง ซึ่งเป็นผู้ตัดสินสำหรับแมตช์แอลฟาโกะพบฝาน ฮุย ได้อธิบายถึงรูปแบบของโปรแกรมว่า "อนุรักษ์นิยม"[64] รูปแบบการเล่นของแอลฟาโกะมีความเป็นไปได้ในการชนะมากกว่าด้วยแต้มน้อยกว่า เหนือความเป็นไปได้ในการแพ้มากกว่าด้วยแต้มมากกว่า[16] กลยุทธ์ของการเพิ่มความน่าจะเป็นของการชนะ แตกต่างจากสิ่งที่ผู้เล่นที่เป็นมนุษย์มนุษย์มีแนวโน้มที่จะทำเพื่อเพิ่มผลกำไรจากพื้นที่ และแจกแจงบางส่วนด้วยการเคลื่อนไหวแปลก ๆ ของมัน[65] มันทำการเดินเปิดเกมหลายแบบที่มนุษย์ไม่เคยหรือไม่ค่อยทำ ในขณะที่มักหลีกเลี่ยงการเปิดเกมในเส้นที่สองที่มนุษย์ชอบทำ มันชอบใช้หมากกดไหล่ โดยเฉพาะอย่างยิ่งหากฝ่ายตรงข้ามมีสมาธิมากกว่า[ต้องการอ้างอิง] การตอบสนองต่อชัยชนะในปี ค.ศ. 2016สังคมปัญญาประดิษฐ์ชัยชนะในเดือนมีนาคมปี ค.ศ. 2016 ของแอลฟาโกะเป็นก้าวสำคัญในการวิจัยปัญญาประดิษฐ์[66] หมากล้อมได้รับการยกย่องว่าเป็นปัญหาที่ยากในการเรียนรู้ด้วยเครื่องซึ่งคาดว่าจะเป็นไปไม่ได้สำหรับเทคโนโลยีในยุคนั้น[66][67][68] ผู้เชี่ยวชาญส่วนใหญ่คิดว่าโปรแกรมหมากล้อมที่มีประสิทธิภาพอย่างแอลฟาโกะจะต้องใช้เวลาห่างออกไปอย่างน้อยห้าปี[69] โดยผู้เชี่ยวชาญบางคนคิดว่าจะใช้เวลาอย่างน้อยอีกหนึ่งทศวรรษก่อนที่คอมพิวเตอร์จะเอาชนะแชมป์หมากล้อม[10][70][71] ผู้สังเกตการณ์ส่วนใหญ่ในตอนต้นของการแข่งขัน ค.ศ. 2016 คาดว่าอีจะชนะแอลฟาโกะ[66] พร้อมด้วยเกมเช่นหมากฮอส (ที่ได้ "แก้ปัญหา" โดยทีมผู้เล่นหมากฮอสชีนุก), หมากรุกสากล และปัจจุบันที่หมากล้อมชนะโดยคอมพิวเตอร์ ชัยชนะในเกมกระดานยอดนิยม ไม่สามารถใช้เป็นหลักไมล์สำคัญสำหรับปัญญาประดิษฐ์ในวิถีที่พวกเขาเคยใช้ได้อีกต่อไป เมอร์รีย์ แคมป์เบล แห่งดีปบลู กล่าวถึงชัยชนะของแอลฟาโกะว่า "จุดจบแห่งยุค... พวกเขาได้แสดงให้เห็นว่าเกมกระดานทำได้มากหรือน้อยกว่า และถึงเวลาแล้วที่ต้องก้าวต่อไป"[66] เมื่อเปรียบเทียบกับดีปบลูหรือกับวัตสัน ขั้นตอนวิธีพื้นฐานของแอลฟาโกะนั้นมีวัตถุประสงค์ทั่วไปมากกว่า และอาจเป็นหลักฐานว่าชุมชนทางวิทยาศาสตร์กำลังก้าวหน้าไปสู่ปัญญาประดิษฐ์ทั่วไป[16][72] ผู้แสดงความคิดเห็นบางคนเชื่อว่าชัยชนะของแอลฟาโกะเป็นโอกาสที่ดีสำหรับสังคมในการเริ่มพูดคุยการเตรียมการสำหรับผลกระทบที่เป็นไปได้ในอนาคตของเครื่องที่มีความฉลาดเอนกประสงค์ (ตามที่ระบุไว้โดยผู้ประกอบการอย่างกาย ซูเตอร์ แอลฟาโกะเองรู้เพียงวิธีเล่นหมากล้อม และไม่มีความฉลาดทางวัตถุประสงค์ทั่วไป: "[มัน] ไม่สามารถตื่นขึ้นมาในเช้าวันหนึ่งและตัดสินใจว่าต้องการเรียนรู้วิธีใช้อาวุธปืน"[66]) ในเดือนมีนาคม ค.ศ. 2016 สจวร์ต รัสเซลล์ นักวิจัยปัญญาประดิษฐ์กล่าวว่า "กระบวนการของปัญญาประดิษฐ์นั้นก้าวหน้าไปเร็วกว่าที่คาดไว้มาก (ซึ่ง) ทำให้คำถามเกี่ยวกับผลระยะยาวที่เร่งด่วนมากขึ้น" และกล่าวเพิ่มเติมว่า "เพื่อให้มั่นใจว่าระบบปัญญาประดิษฐ์ที่มีประสิทธิภาพยิ่งขึ้นยังคงอยู่ภายใต้การควบคุมของมนุษย์... มีงานให้ทำมากมาย"[73] นักวิชาการบางคน เช่น สตีเฟน ฮอว์กิง ได้เตือน (ในเดือนพฤษภาคม ค.ศ. 2015 ก่อนการแข่ง) ว่าการที่ปัญญาประดิษฐ์พัฒนาตัวเองในอนาคตบางอย่างสามารถรับความฉลาดทั่วไปที่เกิดขึ้นจริง โดยนำไปสู่การยึดอำนาจของปัญญาประดิษฐ์ที่ไม่คาดฝัน ส่วนนักวิชาการคนอื่นไม่เห็นด้วย: ฌ็อง-กาเบรียล กานัสเซีย ผู้เชี่ยวชาญด้านปัญญาประดิษฐ์เชื่อว่า "สิ่งต่าง ๆ เช่น 'สามัญสำนึก'... อาจไม่สามารถถอดแบบได้"[74] และกล่าวว่า "ฉันไม่เห็นว่าทำไมเราจะเราจะต้องพูดเกี่ยวกับความกลัว ในทางตรงกันข้าม สิ่งนี้ทำให้เกิดความหวังในหลาย ๆ ด้านเช่นสุขภาพและการสำรวจอวกาศ"[73] และริชาร์ด ซัตตัน นักวิทยาศาสตร์คอมพิวเตอร์ กล่าวว่า "ผมไม่คิดว่าผู้คนควรจะกลัว... แต่ผมคิดว่าผู้คนควรจะให้ความสนใจ"[75] ในประเทศจีน แอลฟาโกะคือ "ช่วงเวลาแห่งสปุตนิก" ซึ่งช่วยโน้มน้าวให้รัฐบาลจีนจัดลำดับความสำคัญและเพิ่มเงินทุนสำหรับปัญญาประดิษฐ์อย่างมาก[76] ในปี ค.ศ. 2017 ทีมดีปไมด์แอลฟาโกะได้รับเหรียญสถาปนา ไอเจซีเอไอ มาร์วิน มินสกี สำหรับความสำเร็จที่โดดเด่นในปัญญาประดิษฐ์ “แอลฟาโกะเป็นความสำเร็จที่ยอดเยี่ยม และเป็นตัวอย่างที่สมบูรณ์แบบในสิ่งที่เหรียญมินสกีเริ่มยอมรับ” ศาสตราจารย์ ไมเคิล วูลดริดจ์ ประธานคณะกรรมการรางวัลไอเจซีเอไอกล่าว “สิ่งที่ทำให้ไอเจซีเอไอประทับใจเป็นพิเศษคือแอลฟาโกะประสบความสำเร็จในสิ่งที่ทำผ่านการผสมผสานที่ยอดเยี่ยมของเทคนิคปัญญาประดิษฐ์คลาสสิก รวมถึงเทคนิคการเรียนรู้ของเครื่องจักรที่ล้ำสมัยซึ่งดีปไมด์มีความเกี่ยวข้องอย่างใกล้ชิด โดยเป็นการสาธิตของปัญญาประดิษฐ์ร่วมสมัยที่น่าทึ่ง และเรายินดีที่จะสามารถยอมรับด้วยรางวัลนี้”[77] สังคมหมากล้อมหมากล้อมเป็นเกมยอดนิยมในประเทศจีน, ญี่ปุ่น และเกาหลี รวมถึงการแข่งขันปี ค.ศ. 2016 นั้น อาจมีผู้ชมทั่วโลกถึงหลายร้อยล้านคน[66][78] ผู้เล่นหมากล้อมระดับสูงหลายคนได้แสดงลักษณะการเล่นนอกรีตของแอลฟาโกะ ในฐานะที่เป็นการเดินที่น่าสงสัยซึ่งเริ่มสร้างความสับสนให้กับผู้ชม แต่มีเหตุผลในความเข้าใจถึงปัญหาหลังเหตุการณ์:[70] "ผู้เล่นทั้งหมดยกเว้นผู้เล่นหมากล้อมที่ดีที่สุดสร้างสรรค์รูปแบบของพวกเขาโดยเลียนแบบผู้เล่นระดับบน ส่วนแอลฟาโกะดูเหมือนว่าจะมีการเคลื่อนไหวต้นฉบับที่สร้างด้วยตนเองทั้งหมด"[66] แอลฟาโกะดูเหมือนจะแข็งแกร่งขึ้นอย่างไม่คาดคิด แม้จะเปรียบเทียบกับการแข่งขันในเดือนตุลาคม ค.ศ. 2015[79] ที่คอมพิวเตอร์ได้เอาชนะมืออาชีพของหมากล้อมเป็นครั้งแรกโดยที่ไม่มีข้อได้เปรียบจากแต้มต่อ[80] วันรุ่งขึ้นหลังจากความพ่ายแพ้ครั้งแรกของอี ผู้สื่อข่าวอย่างช็อง อารัม ได้นำหมากล้อมไปสู่หนึ่งในหนังสือพิมพ์รายวันที่ใหญ่ที่สุดของเกาหลีใต้ โดยกล่าวว่า "เมื่อคืนนี้มืดมนมาก... หลายคนดื่มแอลกอฮอล์"[81] ส่วนสมาคมหมากล้อมแห่งประเทศเกาหลี ซึ่งเป็นองค์กรที่ดูแลหมากล้อมระดับอาชีพในเกาหลีใต้ ได้มอบรางวัล 9 ดั้งกิตติมศักดิ์แก่แอลฟาโกะสำหรับการแสดงทักษะความคิดสร้างสรรค์และผลักดันความก้าวหน้าของเกม[82] เคอ เจี๋ย อายุ 18 ปีของประเทศจีน ที่ได้รับการยอมรับว่าเป็นผู้เล่นที่ดีที่สุดในโลกในเวลานั้น[30][83] ซึ่งเริ่มแรกอ้างว่าเขาจะสามารถเอาชนะแอลฟาโกะได้ แต่ปฏิเสธที่จะเล่นกับมันเพราะกลัวว่าจะ "คัดลอกสไตล์ของผม"[83] ในขณะที่การแข่งขันดำเนินไป เคอ เจี๋ย กลับไปกลับมา โดยกล่าวว่า "มีโอกาสสูงที่ผม (อาจ) แพ้" หลังจากการวิเคราะห์สามแมตช์แรก[84] แต่คืนความมั่นใจหลังจากแอลฟาโกะแสดงข้อบกพร่องในแมตช์ที่สี่[85] โทบี แมนนิง ผู้ตัดสินการแข่งขันของแอลฟาโกะกับฝาน ฮุย และอี ฮา-จิน เลขาธิการใหญ่ของสหพันธ์หมากล้อมนานาชาติ ทั้งสองให้เหตุผลในอนาคตว่าผู้เล่นหมากล้อมจะได้รับความช่วยเหลือจากคอมพิวเตอร์เพื่อเรียนรู้สิ่งที่พวกเขาทำผิดในเกมและพัฒนาทักษะของพวกเขา[80] หลังจากเกมที่สอง อีบอกว่าเขารู้สึก "พูดไม่ออก": "จากจุดเริ่มต้นของการแข่งขัน, ผมไม่สามารถทำการยกมือขึ้นสำหรับการเดินครั้งเดียว มันเป็นชัยชนะทั้งหมดของแอลฟาโกะ"[86] อีขอโทษสำหรับความพ่ายแพ้ของเขา โดยกล่าวหลังจากเกมที่สามว่า "ผมประเมินความสามารถแอลฟาโกะผิดไปและรู้สึกไร้พลัง"[66] เขาย้ำว่าความพ่ายแพ้ครั้งนี้เป็น "ความพ่ายแพ้ของอี เซ-ดล" และ "ไม่ใช่ความพ่ายแพ้ของมนุษยชาติ"[32][74] อีกล่าวว่าการพ่ายแพ้ต่อเครื่องจักรของเขาในที่สุดนั้น "หลีกเลี่ยงไม่ได้" แต่ก็กล่าวด้วยว่า "หุ่นยนต์จะไม่เข้าใจความงามของเกมแบบเดียวกับที่มนุษย์เราทำ"[74] อีกล่าวถึงชัยชนะในเกมที่สี่ของเขาว่า "ชัยชนะอันล้ำค่าที่ผม (จะ) ไม่ยอมแลกเพื่ออะไรเลย"[32] ระบบที่คล้ายกันเฟซบุ๊กยังทำงานบนระบบการเล่นหมากล้อมของตัวเองด้วยดาร์กฟอเรสต์ ซึ่งขึ้นอยู่กับการรวมการเรียนรู้ของเครื่องและการค้นหาต้นไม้มงเต การ์โล[64][87] ถึงแม้ว่าผู้เล่นที่แข็งแกร่งได้เผชิญกับโปรแกรมหมากล้อมคอมพิวเตอร์อื่น ๆ ตั้งแต่ต้นปี ค.ศ. 2016 มันก็ยังไม่พ่ายแพ้ต่อผู้เล่นระดับอาชีพ[88] ทั้งนี้ ดาร์กฟอเรสต์แพ้ซอฟต์แวร์เครซีสโตนและเซน ซึ่งคาดว่ามีความแข็งแกร่งที่คล้ายกับเครซีสโตนและเซน[89] ดีปเซนโกะ ซึ่งเป็นระบบที่พัฒนาขึ้นพร้อมการสนับสนุนจากเว็บไซต์แบ่งปันวิดีโออย่างโดวังโงะและมหาวิทยาลัยโตเกียว ได้เป็นฝ่ายแพ้ 2–1 เกมในเดือนพฤศจิกายน ค.ศ. 2016 แก่ผู้เชี่ยวชาญหมากล้อมอย่างโช ชีฮุน ผู้ครองสถิติชนะหมากล้อมสูงสุดในประเทศญี่ปุ่น[90][91] ตามเอกสารปี ค.ศ. 2018 ในวารสารเนเจอร์ ได้อ้างถึงแนวทางของแอลฟาโกะในฐานะพื้นฐานสำหรับวิธีการใหม่ในการคำนวณโมเลกุลของยาที่อาจเกิดขึ้น[92] เกมตัวอย่างแอลฟาโกะ มาสเตอร์ (หมากขาว) ปะทะถัง เหวยซิง (31 ธันวาคม ค.ศ. 2016) แอลฟาโกะเป็นฝ่ายชนะโดยอีกฝ่ายยอมจำนน หมากขาวที่ 36 ได้รับการยกย่องอย่างกว้างขวาง
อิทธิพลของหมากล้อมภาพยนตร์สารคดีแอลฟาโกะ[93][94] ได้หยิบยกความหวังว่าอี เซ-ดล และฝาน ฮุย จะได้รับประโยชน์จากประสบการณ์การเล่นแอลฟาโกะ แต่ ณ เดือนพฤษภาคม ค.ศ. 2018 เรตติงของพวกเขาเปลี่ยนไปเล็กน้อย ซึ่งอี เซ-ดล อยู่ในอันดับที่ 11 ของโลก และฝาน ฮุย อันดับที่ 545[95] อย่างไรก็ตามสังคมหมากล้อมอาจพัฒนาขึ้นในวิธีการเล่นเกม[ต้องการอ้างอิง] หมายเหตุอ้างอิง
แหล่งข้อมูลอื่นวิกิมีเดียคอมมอนส์มีสื่อที่เกี่ยวข้องกับ แอลฟาโกะ
|
Portal di Ensiklopedia Dunia