2020: การเพิ่มขึ้นของเครื่องจักร

0 Comments

นับฉันเข้ากับโดรน Netflix ที่ชื่นชอบ Queen’s Gambit (2020) โดย James Grosjean แต่ฉันเป็นคนที่ชอบเล่นหมากรุกมาโดยตลอด ในช่วงปีที่เรียนมหาวิทยาลัยฉันอาจจะกินครัวซองต์ช็อคโกแลตหนึ่งพันชิ้นในขณะที่มองดูผู้คนทั้งหมดในจัตุรัสกลางเมือง Murray Turnbull (หรือที่เรียกว่า “The Chess Master”) – “$ 2″ ถ้าคุณชนะหรือเสมอ ” เป็นเกียรติของฉันที่ได้ถ่ายภาพที่ล้อมรอบด้วยกระจก Memorial Hall เมื่อ Karpov ผู้ยิ่งใหญ่จำลองกระดาน 40 แผ่นในมหาวิทยาลัย ฉันเป็นส่วนหนึ่งของนิตยสาร Student ตอนที่คาสปารอฟแถลงโต้เถียงในตอนนั้นว่าเธอจะกลายเป็นแชมป์คอมพิวเตอร์ที่ยิ่งใหญ่ก่อนที่จะกลายเป็นผู้หญิง บันทึกการสนทนาเกี่ยวกับการละเมิดที่อาจเกิดขึ้นของคาสปารอฟสำหรับฟอรัมอื่นและอีกวันหนึ่งฉันใช้คำพูดของเขาเป็นการคาดการณ์โดยอาศัยการสังเกตเชิงประจักษ์ของชุมชนหมากรุกเท่านั้น การมีส่วนร่วมกับคอมพิวเตอร์ไม่ได้อยู่ในระดับต่ำเสมอไปและเพิ่มขึ้นอย่างมีนัยสำคัญ แต่คอมพิวเตอร์มีความแข็งแกร่งและเติบโตอย่างรวดเร็วอยู่แล้ว เครื่องจักรนำไปสู่ความเท่าเทียมใหม่ – ที่ซึ่งทุกเพศถูกบดขยี้เหมือนมด Germelo Theorem บอกเราว่าด้วยข้อมูลที่ครบถ้วน (ผู้เล่นทั้งสองสามารถเห็นชิ้นส่วนทั้งหมดบนกระดานหมากรุก) มันมีจำนวน จำกัด (เกมจะจบลงหลังจากมีการเคลื่อนไหวจำนวนหนึ่ง) และหากทั้งสองฝ่ายเล่นได้วิธีแก้ปัญหาที่ถูกต้อง แต่ละเกมจะมีผลลัพธ์เหมือนกัน หมากรุกมีความซับซ้อนมากพอเราไม่แน่ใจว่าผลลัพธ์คืออะไร แต่เรารู้สึกว่าทุกครั้งที่ไวท์ชนะไม่มีปฏิกิริยาที่เป็นสีดำในการเปลี่ยนแปลงผลลัพธ์ในกรณีนี้ เกมของ Connect Four อยู่ภายใต้สมมติฐานของ Germelo และการวิเคราะห์ได้ระบุว่าในเกมนั้น Sneaky Sis จะชนะเสมอถ้าเธอไปก่อนและเล่นได้ดีที่สุด หากคุณเป็น AP ที่ชื่นชอบ Q Gambit และหิวกระหายสิ่งต่างๆมากขึ้นในช่วงการระบาดที่ไม่สิ้นสุดนี้งานชิ้นต่อไปของคุณคือการดู alphaGo ซึ่งเป็นสารคดีเกี่ยวกับการเพิ่มขึ้นของคอมพิวเตอร์ในเกม Go ยุคโบราณซึ่งมีความซับซ้อนมากกว่า หมากรุก. ไม่ได้ล้อเล่นหนังเรื่องนี้เป็นเครื่องบรรณาการให้กับผู้ที่สนใจในสาขานี้และชื่นชมกับละครอารมณ์เข้มข้นของแชมป์มนุษยชาติ Lee Sedol – ที่ดีที่สุดเท่าที่เคยมีมา ภาพยนตร์เรื่องนี้ถ่ายทอดความทุกข์ยากความกล้าหาญความฉลาดและความอ่อนน้อมถ่อมตนของ Sedol เนื่องจากเกมต่อสู้กับเครื่องจักรนี้ไม่ได้เป็นเพียงเกม แต่เป็นการก่อตัวของระเบียบโลกใหม่ เซดอลไม่ใช่โปรแกรมเมอร์ไม่ได้ชื่นชมสิ่งที่เขาทำ แต่ในฐานะผู้เชี่ยวชาญในงานฝีมือของเขาเขาสัมผัสได้ถึงน้ำหนักที่ไม่หยุดยั้งและไม่สามารถยอมรับได้ของคู่ต่อสู้บนกระดาน หลังจากที่คุณสนุกกับ AlphaGo ฉันขอแนะนำให้คุณดูการแข่งขันโป๊กเกอร์ระหว่างโรงเรียนเก่า Don Negreanu และ Doug Polk คอมพิวเตอร์โคลนสมัยใหม่ (อันที่จริง Google แนะนำ) ผู้เล่นที่ดีที่สุดในโลกคือเครื่องจักรดังนั้นควรเลียนแบบเทคนิคการหลบหลีกที่ชาญฉลาดเช่น Polk พอดีหรือตาย. ครั้งหนึ่งฉันเคยแลกเปลี่ยนสั้น ๆ กับ Howard Lederer ฉันถามเขาเกี่ยวกับบอทในเว็บไซต์โป๊กเกอร์ เขาไม่สนใจสิ่งนี้: “โป๊กเกอร์ไม่เหมือนหมากรุกโป๊กเกอร์เป็นเกมที่มีข้อมูลไม่สมบูรณ์คอมพิวเตอร์ไม่ดี” ฉันไม่สามารถพูดได้ว่าเขาเป็นคนโง่ไร้เดียงสาหรือเป็นนักเลงหน้าม้าสำหรับโป๊กเกอร์เอียงเต็มเวลามาถึงเวลาที่จะดำเนินต่อไป การสนทนาโดยการปฏิเสธข้อผิดพลาดแรกเกี่ยวกับคอมพิวเตอร์ GTO (Game-Theory Optimal) และข้อผิดพลาดในการลบล้างอื่น ๆ ทั้งหมดเช่นไดโนเสาร์โป๊กเกอร์และผู้เล่นโป๊กเกอร์ที่ประกาศตัวเองมีทฤษฎีบทอื่น ๆ ที่กล่าวว่ามีวิธีแก้ปัญหาสำหรับเกมและ การแก้ปัญหาคอมพิวเตอร์มักจะเกี่ยวข้องกับ “เทคนิคผสม” ซึ่งหมายความว่ามีองค์ประกอบแบบสุ่มในเทคนิค (เช่นความน่าจะเป็น 1/3 ของกรรไกร) คอมพิวเตอร์ดีกว่ามนุษย์ เมื่อคำนวณความคาดหวังเกี่ยวกับผลลัพธ์ที่อาจเกิดขึ้นโดยเฉพาะอย่างยิ่งเมื่อคุณรู้แน่ชัดว่าการแจกแจงความน่าจะเป็นในเกมไพ่เป็นอย่างไร ตัวอย่างเช่นคอมพิวเตอร์รู้ว่าความน่าจะเป็นของการวาดแบ็คดอร์ฟลัชคืออะไรและต้องใช้อัตราต่อรองเท่าใดในการปรับการไล่ Header Up ไม่ใช่เกมที่ง่ายไปกว่า Poker Go แม้ว่าโป๊กเกอร์จะไม่สมบูรณ์และ Go เต็มไปด้วยข้อมูล (ข้อมูลสามัญสำนึก) ข้อผิดพลาด # 2: ความยอดเยี่ยมของคอมพิวเตอร์มาจากการจดจำทุกมือที่ฉันเล่นและปรับให้เหมาะสม “บอทหาประโยชน์” จะวิเคราะห์การเล่นก่อนหน้าของคุณและปรับตามจุดอ่อนที่รับรู้บอต GTO มาตรฐาน (ที่เราเรียกว่า “แนชโบ๊ท”) เทียบเท่ากับ BS ในแบล็คแจ็ค ไม่ว่าคุณจะเล่นในมือที่ผ่านมาอย่างไรกลยุทธ์ GTO จะไม่เปลี่ยนแปลง ไม่ต้องการข้อมูลนั้นและไม่สนใจ ข้อผิดพลาด # 3: วิธีแก้ปัญหา GTO นั้น “ถูกต้อง” เท่านั้นหาก GTO อื่นเล่นกับเรือเพราะเรือ “พัฒนา” เมื่อเรือได้รับการพัฒนา – เรือ “เรียนรู้” โดยการเล่นกับมัน นี่เป็นเรื่องโกหก “ เรือเล่นกับเธอเพื่อเรียนรู้โป๊กเกอร์” เป็นการบิดเบือนความจริงเกี่ยวกับกระบวนการพัฒนา สื่อชอบที่จะทริกเกอร์ clickbait เพื่อทริกเกอร์ HAL และ Skynet เพื่อให้แต่ละผลลัพธ์ในการประมวลผลเป็นความก้าวหน้าในรุ่น เรือ GTO ไม่รู้อะไรเกี่ยวกับโป๊กเกอร์ การใช้กลยุทธ์ GTO เป็นแบบฝึกหัดที่คำนวณได้ซึ่งเกิดขึ้นได้จากหน่วยความจำขนาดใหญ่ที่มีอยู่ในคอมพิวเตอร์ในปัจจุบันและการพัฒนาอัลกอริทึมที่มีประสิทธิภาพเพื่อดำเนินการความเร็วของ CPU และการคำนวณ (“ลดความเสียใจ”) เราไม่เคยใช้อัลกอริทึมเพื่ออธิบาย “แมชชีนเลิร์นนิง” หรือ “AI” – เราเรียกมันว่า “การไต่เนิน” หรือ “การเพิ่มประสิทธิภาพสูงสุด” หรือ “การเพิ่มประสิทธิภาพ” ในแต่ละขั้นตอนของอัลกอริทึมแบบวนซ้ำกลยุทธ์ปัจจุบันได้รับการพัฒนาสำหรับทุกที่นั่งบนโต๊ะในคอมพิวเตอร์และเทคนิคปัจจุบันนี้นิยมเรียกว่า “ตัวมันเอง”: “PokerSnoi เล่นกับมัน” แต่จริงๆแล้วมันคือการปีนเขาซ้ำ ๆ การมาบรรจบกันที่จุดสูงสุด – กลยุทธ์ที่เหมาะสำหรับโป๊กเกอร์ สูงสุดนั้นไม่ทำให้ฝ่ายตรงข้ามคนใดคนหนึ่งเป็นพิเศษ มีวิธีอื่นที่เราสามารถคำนวณวิธีแก้ปัญหาได้ (แม้ว่าจะไม่เร็วเท่า) และก็ใช้ได้ กลยุทธ์ GTO นี้คือ “หนังสือ” สำหรับโป๊กเกอร์และจะไม่สะดวกไม่ว่าฝ่ายตรงข้ามจะเป็นอย่างไร ไม่มีกลยุทธ์ที่จะได้เปรียบกับมัน ความผิดพลาด # 4: บ็อต GTO คิดว่าฉันเล่นได้บางวิธี แต่ฉันโกงมันโดยการเล่นนอกชุด 72 ของฉันออกจากตำแหน่ง ไม่ถูกต้อง บ็อต GTO ไม่ได้ทำอะไรเกี่ยวกับวิธีการเล่นของคุณ มันไม่สนใจหรอก มันอยู่ยงคงกระพันกับกลวิธีใด ๆ ของฝ่ายตรงข้าม สมมติว่าคุณกำลังจะต่อสู้กับฟลอยด์เมย์เวทเธอร์และคุณพูดว่า“ ฟลอยด์คาดหวังให้ฉันอยู่ในสภาพร่างกายที่ไร้ที่ติ เขาบอกว่าฉันจะฝึกหนักในอีกหกเดือนข้างหน้า ฉันนอกใจเขา – ฉันดู Netflix และกินโดนัทในอีกหกเดือนข้างหน้า “ ฟลอยด์ไม่รู้ว่าคุณได้รับการฝึกฝนมากแค่ไหน เขารู้ดีว่าหากเขาแสดงรูปร่างที่สมบูรณ์แบบไม่มีฝ่ายตรงข้ามที่จะได้เปรียบเขา คุณหมายความว่าจะพูดว่า “บอทบอกว่าฉันเล่นเก่งฉันหลอกเรือด้วยการเล่นโป๊กเกอร์ที่ไม่ดี!” ใช่คุณแสดงให้พวกเขาเห็นแน่นอน! ความผิดพลาด # 5: ฉันได้พบจุดอ่อนเช่นจากตำแหน่งดังกล่าวและเช่นนี้และตำแหน่งเช่นนี้บอท X ต้องทำ แต่เป็น y เรือไม่มีอาการอ่อนแรง คุณกำลังจับมือบางอย่างและผลลัพธ์บางอย่าง แต่ขึ้นอยู่กับความเป็นไปได้ของสถานการณ์นั้นและมือทั้งหมดที่คุณสามารถเห็นได้จากมุมมองของเรือเกมนั้นถูกต้องและไม่มีช่องโหว่ที่คุณสามารถทำได้ การดูละครอย่างโดดเดี่ยวเป็นเรื่องอันตรายมาก เรือเคลื่อนที่เพื่อปรับสมดุลของช่วงเพื่อให้คุณไม่สามารถอยู่รอดได้ในสถานการณ์อื่น ๆ หรือหากมีการ์ดหลายใบในแม่น้ำ หากคุณไม่เห็นข้อบกพร่องอยู่ที่การคิดโป๊กเกอร์ของคุณเองไม่ใช่ที่เรือ ความผิดพลาด # 6: ถ้าฉันเล่นไปสักพักฉันจะรู้ว่ามันเล่นยังไงและหาจุดอ่อน ไม่ถูกต้อง ไม่มีความอ่อนแอ. ในความเป็นจริงเราสามารถประกาศกลยุทธ์ของเรือและมันก็ไม่แตกต่างกัน ถ้าฉันบอกคุณว่าฉันกำลังจะเล่นกรรไกรเป่ายิ้งฉุบด้วยความน่าจะเป็น 1/3 ของแต่ละอันการที่คุณรู้เทคนิคของฉันไม่ได้ทำให้คุณได้รับขอบ ไม่มีส้น Achilles ข้อผิดพลาด # 7: บอทเกณฑ์ล่วงหน้าที่แนะนำในคาสิโนสามารถเอาชนะได้มากขึ้นดังนั้นอาจเป็นบอท GTO เช่นกัน นี่ไม่ใช่การเปรียบเทียบที่มีความหมาย บ็อตคาสิโนบางตัวได้รับคำสั่งไม่ให้เล่นเกม A เพราะมันแข็งแกร่งเกินมนุษย์ทั่วไป หากคาสิโนเล่นเกม B การตั้งค่าบอทสูงถึง 5% เมื่อเทียบกับผู้เล่นส่วนใหญ่คนที่เก่งจริงๆสามารถสร้างรายได้จากบอท GTSO นั้น (บอทย่อยที่เหมาะสมที่สุดของทฤษฎีเกม) แต่นั่นเป็นสิ่งที่แตกต่างออกไป ฉันไม่สนใจว่าคุณเป็นใคร: ถ้าคุณรบกวน Pokersnoy คุณจะแพ้ ข้อผิดพลาด # 8: บ็อต GTO สามารถเอาชนะผู้เล่นที่อ่อนแอได้ แต่บอทมีปัญหากับคู่ต่อสู้ชั้นนำเช่น Phil Ivy หรือ Don Negreanu ไม่ถูกต้อง สิ่งที่สวยงามอย่างหนึ่งของเรือ GTO ก็คือไม่สำคัญว่าคู่ต่อสู้จะเป็นใคร อย่างดีที่สุดใคร ๆ ก็เล่นเรือได้ วงแหวนของบ็อต GTO เหมือนกับซิงก์เงินจะไหลตามเข็มนาฬิกาและคราดจะไล่ตรงกลางโต๊ะ ปัญหาในทางปฏิบัติที่มืออาชีพในโลกแห่งความเป็นจริงมีเมื่อทักษะของพวกเขาไม่เพียงพอที่จะก้าวไปสู่หุ้นที่มีอยู่ซึ่งผู้เล่นอาจแข็งแกร่ง แต่ตอนนี้ผู้เล่นสามารถเลียนแบบกลยุทธ์ GTO ที่โต๊ะใดก็ได้ในโลกไม่มีสิทธิ์และไม่ต้องกังวลเรื่องปลา อย่างดีที่สุดเกมนี้มีความเท่าเทียมกัน (นอกคราด) และในทางปฏิบัติกลยุทธ์ GTO ช่วยให้คุณได้เปรียบกับทุกคนที่คุณพบในป่า ข้อผิดพลาด # 9: Don Negre เป็นมือโปรโป๊กเกอร์ที่มีสร้อยข้อมือ N มานานเขาจึงจัดการกับคอมพิวเตอร์ nits เช่น Doug Polk ที่ไม่เข้าใจความแตกต่างของโป๊กเกอร์จริง ถ้าผู้ชายอย่าง Polk จำ “แผนภูมิ” และเลียนแบบกลยุทธ์ GTO ได้เขาก็ไม่จำเป็นต้องเข้าใจสิ่งที่ไม่ดี เขาไม่จำเป็นต้องรู้ว่าคำว่า “แตกต่างกันนิดหน่อย” หมายถึงอะไร ประสบการณ์เล่นโป๊กเกอร์ของมืออาชีพอย่าง Negreanu ทำให้เขาได้พบกับละครที่ดีที่สุดในสถานการณ์ที่ซับซ้อน เนื่องจากประสบการณ์ดังกล่าวไม่ได้ใช้งานอีกต่อไปคอมพิวเตอร์จึงคิดได้ว่าการเล่นที่เหมาะสมคืออะไร บางทีในปี 1950 ประสบการณ์ของผู้เล่นทำให้เขาตัดสินใจได้ว่าการตี 14 VT นั้นดีกว่าการยืน หลังจากนักขี่ม้าสี่คนคำนวณแผนภูมิ BS ประสบการณ์แบล็คแจ็คนั้นก็ไม่เกี่ยวข้อง หนังสือเล่มนี้ทำให้ประสบการณ์ไม่จำเป็น ตอนนี้ Doug Polk ไม่ใช่ GTO bot เขาเป็นมือโปรระดับแนวหน้าที่ใช้เทคนิค GTO ดังนั้นสิ่งเดียวที่จะเอาชนะ Polk คือการค้นหาและใช้ประโยชน์จาก Negrene หากการจำลอง GTO ของ Polk ไม่แม่นยำและรูมีขนาดใหญ่ ฉันสงสัยมัน. หากพวกเขาเล่นสดมันจะเป็นอีกช็อตหนึ่งและหาก Polk มีข้อความทางกายภาพที่ให้ข้อมูลเกี่ยวกับไพ่หลุมของพวกเขา Negreanu ก็สามารถอ่านได้ ಅಥವಾ ಪೋಲ್ಕ್‌ಗೆ ಟಿಲ್ಟ್ ಸಮಸ್ಯೆಗಳಿದ್ದರೆ ಮತ್ತು ಜಿಟಿಒಗೆ ಕೆಟ್ಟ ಕಾರ್ಡ್‌ಗಳಿದ್ದರೆ ದೂರವಿರಲು ಪ್ರಾರಂಭಿಸಿದರೆ. ಸಾಧ್ಯತೆ ಇಲ್ಲ. ಅಥವಾ, ಬಹುಶಃ ಆಟವು ಸಾಕಷ್ಟು ಚಿಕ್ಕದಾಗಿದ್ದು, ಸಣ್ಣ ಮಾದರಿಯಲ್ಲಿ ನೆಗ್ರೇನು ಅದೃಷ್ಟವನ್ನು ಪಡೆಯುತ್ತಾನೆ. ಆಲ್ಫಾಗೊ ವಿರುದ್ಧ ಆಡಿದ ನಂತರ, ಲೀ ಸೆಡೋಲ್ ತನ್ನ ಆಟವನ್ನು ಉನ್ನತೀಕರಿಸಿದನು ಮತ್ತು ಎಲ್ಲರನ್ನೂ ಪುಡಿಮಾಡಲು ಪ್ರಾರಂಭಿಸಿದನು (ಅವನು ಈಗಾಗಲೇ ಮಾಡಿಲ್ಲ), ಆದರೆ ನಂತರ ಆಟದಿಂದ ನಿವೃತ್ತನಾದನು! ಅವರು ಅತ್ಯುತ್ತಮವಾಗಿದ್ದಾರೆಂದು ಒಪ್ಪಿಕೊಂಡರು (ಏನು ಪರಿಕಲ್ಪನೆ!), ಮತ್ತು ಯಾವುದೇ ಮಾನವನು ಮತ್ತೆ ಭೂಮಿಯ ಮೇಲಿನ ಅತ್ಯುತ್ತಮ ಆಟಗಾರ ಆಲ್ಫಾಗೊಗೆ ಸವಾಲು ಹಾಕುವುದಿಲ್ಲ. ನೆಗ್ರೇನುಗೆ ಅದೇ ಎಪಿಫ್ಯಾನಿ ಇದೆಯೇ ಎಂದು ನಾವು ನೋಡುತ್ತೇವೆ. ಇತ್ತೀಚಿನ ಟ್ವೀಟ್ ನನಗೆ ಆಶ್ಚರ್ಯವನ್ನುಂಟುಮಾಡುತ್ತದೆ, ಏಕೆಂದರೆ ನೆಗ್ರೇನು ಬೋಟ್ ನಾಟಕವನ್ನು ಪ್ರಶ್ನಿಸುತ್ತಿರುವಂತೆ ತೋರುತ್ತಿತ್ತು, ಮತ್ತು ಪ್ರತಿಭೆ ಮತ್ತು ಕತ್ತಲೆಯ ನಡುವೆ ತೆಳುವಾದ ಗೆರೆ ಇದೆ ಎಂದು ಸೂಚಿಸುತ್ತದೆ. ಜಿಟಿಒ ಕಾರ್ಯತಂತ್ರದಲ್ಲಿ ನ್ಯೂನತೆ ಇದೆ ಎಂದು ಅವರು ಇನ್ನೂ ಆಶಿಸುತ್ತಿದ್ದಾರೆಂದು ನಾನು ಭಾವಿಸುತ್ತೇನೆ. ಇಲ್ಲ. ಕೊನೆಯದಾಗಿ ನಾನು ಕೇಳಿದೆ, ನೀಗ್ರೇನು ಸ್ಪರ್ಧೆಯಲ್ಲಿ ಸೆಳೆಯುತ್ತಿದ್ದಾನೆ, ಮತ್ತು ಒಂದು ಕಾರಣವೆಂದರೆ, ಒಂದು ಕಾರಣವೆಂದರೆ, ನೆಗ್ರೇನು ಪೋಕರ್ಸ್‌ನೋವಿಯೊಂದಿಗೆ ಅಭ್ಯಾಸ ಮಾಡುತ್ತಿದ್ದಾನೆ ಮತ್ತು ಹೊಂದಿಕೊಳ್ಳುತ್ತಿದ್ದಾನೆ! ನೆಗ್ರೇನು ಜಿಟಿಒ ಕಾರ್ಯತಂತ್ರವನ್ನು ತ್ವರಿತವಾಗಿ ಕಲಿಯಲು ಸಾಧ್ಯವಾದರೆ, ಅವನು ಮೈದಾನದೊಳಕ್ಕೆ ನೆಲಸಮ ಮಾಡಬಹುದು, ಇದು ಒಂದು ದೊಡ್ಡ ಸಾಧನೆಯಾಗಿದೆ. ಡೈನೋಸಾರ್ ವಿಕಾಸದ ಮೂಲಕ ಬದುಕುಳಿಯುವ ಏಕೈಕ ಮಾರ್ಗವಾಗಿದೆ. ನಾವು 2021 ರಲ್ಲಿ ನೋಡುತ್ತೇವೆ.

[Next time, I’ll discuss some of the limitations and weaknesses of the poker bots, unless we thrash them out in the Comments below.]

คาสิโน 1988
คาสิโน ทรูวอลเล็ต
คาสิโน99
88 คาสิโน
88คาสิโน