วันศุกร์ที่ 20 ตุลาคม พ.ศ. 2560

พัฒนาไปอีกขั้น AlphaGo Zero ปัญญาประดิษฐ์เล่นหมากล้อม ตัวใหม่จาก Deepmind


Google Deepmind เปิดตัว AlphaGo Zero ปัญญาประดิษฐ์เล่นหมากล้อมตัวใหม่ 


ที่พัฒนาฝีมือเล่นโกะ(หมากล้อม)โดยไม่ต้องอาศัยคนสอน ฝึกด้วยตัวเองเพียง 3 วัน ก็สามารถเก่งกว่า AlphaGo เวอร์ชันเก่าที่เอาชนะเซียนโกะหมากล้อมโลกอย่าง Ke Jie

แม้ว่า AlphaGo ปัญญาประดิษฐ์จาก DeepMind บริษัทลูกของ Google ประกาศอำลาวงการโกะ(หมากล้อม) หลังเอาชนะมือ 1 ในวงการหมากล้อมโลกอย่าง Ke Jie 3 เกมรวดเมื่อช่วงกลางปีที่ผ่านมา ทำให้จะไม่มี AlphaGo ออกมาประลองฝีมือกับมนุษย์อีกต่อไป

แต่ DeepMind ยังไม่หยุดพัฒนา AI เล่นโกะเพียงเท่านั้น เพราะล่าสุดได้เปิดตัว AlphaGo Zero ปัญญาประดิษฐ์ตัวใหม่ ที่มาพร้อมกับความสามารถในการสอนตัวเอง แถมยังเล่นโกะได้เก่งกว่า AlphaGo เวอร์ชันก่อนซะอีกครับ

โดยกว่าที่ AlphaGo เวอร์ชันก่อนจะบรรลุสกิล ระดับความสามารถในการเล่นโกะที่ค่อนข้างเก่งเกินมนุษย์นั้น มันต้องเรียนรู้บันทึกหมากเกมโกะ(หมากล้อม)ที่มนุษย์เคยเล่นไว้กว่า 100,000 กระดาน เพื่อศึกษาแนวทางการเล่นโกะ และนำมาประยุกต์ใช้ แต่สำหรับ AlphaGo เวอร์ชั่น Zero นี้ฉลาดกว่านั้น เพราะมันถูกโปรแกรมให้รู้แค่เพียงกฏการเล่นโกะเบื้องต้นเท่านั้น ส่วนวิธีการเล่น รวมไปถึงเทคนิคต่างๆในการวางหมากนั้น Zero จะพัฒนาทักษะด้วยการประลองฝีมือกับตัวเองไปเรื่อยๆ เป็นจำนวนหลายล้านกระดาน

หลังจากที่ฝึกฝนตัวเองได้อยู่ 3 วัน พบว่า AlphaGo Zero มีความเก่งกาจจนสามารถเอาชนะ AlphaGo เวอร์ชันที่เคยคว่ำแชมป์เซียนโกะโลก 18 สมัยอย่าง Lee Sedol ได้สำเร็จ ด้วยผล 100-0 เกม

หลังจากฝึกต่อไปเป็นเวลา 40 วัน ปรากฏว่า Zero สามารถเอาชนะ AlphaGo เวอร์ชัน Master ซึ่งนับว่าเป็นเวอร์ชันที่ล้ำหน้ามากที่สุด และยังเป็น AlphaGo ที่เอาชนะมือ 1 โลกอย่าง Ke Jie มาแล้ว ด้วยอัตราการชนะ (Win-rate) ถึง 90% ด้วยกัน ทำให้ Zero (น่าจะ) เป็นผู้เล่นโกะ(หมากล้อม)ที่แข็งแกร่งที่สุดในประวัติศาสตร์ไปโดยปริยาย

David Silver หัวหน้าโปแกรมเมอร์ผู้พัฒนา AlphaGo Zero เปิดเผยว่า Zero สามารถค้นพบแผนการเล่นโกะ ที่มนุษย์เคยพัฒนามาเป็นเวลากว่าพันๆ ปีได้ด้วยตัวมันเอง โดยในช่วงแรก Zero เริ่มต้นการเล่นโกะอย่างไร้ชั้นเชิง คล้ายกับมือสมัครเล่น แต่เมื่อเวลาผ่านไป มันเริ่มเล่นโกะได้ทัดเทียมกับมือโปร แถมยังมีการพัฒนาเทคนิคการเล่นโกะที่ไม่เคยเห็นมาก่อนด้วย




ซึ่งทาง DeepMind หวังว่า Zero จะเป็นแรงบันดาลใจให้แก่ผู้เล่นโกะมืออาชีพ ด้วยการแนะนำวิธีรูปแบบการเดินหมากแบบใหม่ๆ ให้แก่มนุษย์ เพื่อนำไปปรับใช้ในเกมการแข่งขันหมากล้อมได้

AlphaGo Zero นอกเหนือจากจะมีความสามารถการเล่นโกะที่เหนือกว่า AlphaGo เวอร์ชั่นก่อนหน้าแล้ว มันยังมีฟีเจอร์ด้านอื่นที่ดีกว่าด้วย อย่างเช่น การใช้พลังงานในการประมวลผลที่น้อยลง ด้วยการใช้ชิป TPU (หน่วยประมวลผล AI ที่สร้างโดย Google) เพียงแค่ 4 ตัว ต่างจากเวอร์ชันก่อนที่ต้องใช้ชิป TPU ถึง 48 ตัว อีกทั้ง

ด้วยความที่ Zero สามารถสอนตัวเองได้ ทำให้นักวิจัยสามารถนำไปต่อยอดเพื่อพัฒนาอัลกอริทึมรูปแบบใหม่ ที่ไม่จำเป็นต้องป้อนข้อมูลเป็นจำนวนมากๆ เพื่อสอน AI นั่นเอง

ทั้งนี้ ทาง Demis Hassabis ผู้ร่วมก่อตั้ง DeepMind เปิดเผยว่า เนื่องจาก Zero ไม่ได้ถูกโปรแกรมมาเพื่อให้เล่นโกะโดยเฉพาะ ทางผู้พัฒนาจึงสามารถโปรแกรม Zero ให้เรียนรู้ศาสตร์ด้านอื่นได้ เช่น ค้นคว้าเรื่องยา หรือฟิสิกส์อนุภาพ เป็นต้น ซึ่งก็น่าติดตามกันต่อไปว่า Zero จะเข้ามามีบทบาทในด้านใด และจะถูกนำไปใช้ในเรื่องไหนบ้างครับ


บทความโดย เทคโมบล็อก
บันทึกหมาก AlphaGo Games




ไม่มีความคิดเห็น:

แสดงความคิดเห็น