AI Poker Bot Pluribus ชนะหลักหลักใน NLHE ผู้เล่นหลายคนเสียค่าใช้จ่าย $ 144 เท่านั้นในการรัน

0 Comments
การแข่งขันประจำวันเดือนกุมภาพันธ์ 2564



ทีมนักวิจัยที่แนะนำ Libratus ในปี 2017 และในครั้งนี้ประสบความสำเร็จในการชนะการแข่งขันโป๊กเกอร์ที่สำคัญในเกม NLHE ครั้งที่ 6 Facebook ทำงานร่วมกับนักวิจัยจากมหาวิทยาลัย Carnegie Mellon ซึ่งเป็นมหาวิทยาลัย CMU นำโดยศาสตราจารย์ Tuomas Sandholm และ Noam Brown นักศึกษาระดับปริญญาตรีของเขา จัดงานเปิดตัว AI poker ของ บริษัท คอมพิวเตอร์เวอร์ชันใหม่ชื่อ “Pluribus” กับผู้เล่นโป๊กเกอร์ชั้นนำในอุตสาหกรรมผลการแข่งขันที่เผยแพร่เมื่อต้นเดือนที่ผ่านมาในวารสาร Science เป็นที่น่าประทับใจ บอทเอาชนะคู่ต่อสู้ได้สำเร็จซึ่งเป็นสิ่งที่ AI อื่นไม่เคยชนะมาก่อน (โปรแกรม AI ก่อนหน้านี้สามารถชนะได้ในเกมโป๊กเกอร์ที่มีผู้เล่นสองคนเท่านั้น) คาดว่าผลของโครงการนี้จะส่งผลกระทบสำคัญต่อการวิจัย AI และเกมโป๊กเกอร์เอง TrialsPoker dual ถือเป็นเกมที่รองรับความท้าทายของข้อมูลที่ซ่อนอยู่ได้เป็นอย่างดีดังนั้นนักวิจัยจึงใช้สิ่งนี้เป็นความท้าทายในการสร้างและเพิ่มพูนทักษะของผู้สร้าง แน่นอนว่าไม่มีเครื่องจักรใดที่ประสบความสำเร็จในการเอาชนะผู้เล่นที่เป็นมนุษย์ในสล็อต Texas Hold’em ส่วนใหญ่ (รูปแบบโป๊กเกอร์ที่ได้รับความนิยมมากที่สุด) จนกระทั่ง Pluribus เข้ามา Pluribus ต่อสู้เพื่อทำกำไรโป๊กเกอร์ที่ดีที่สุดในระบบ 6-max NLHE ผู้ที่ได้รับผลประโยชน์คือผู้เชี่ยวชาญ 6-max ซึ่งได้รับรางวัลอย่างน้อย 1 ล้านเหรียญในธุรกิจโป๊กเกอร์ พลูริบัสได้รับการทดสอบสองครั้ง ในการทดสอบครั้งแรกมีการเผชิญหน้ากับผู้คน 5 คนที่มี AI หนึ่งคน (5H + 1AI) ในขณะที่ในการทดสอบครั้งที่สองมีเพียงคนเดียวที่สัมผัสกับยาพลูริบัสห้าตัว (1H + 5AI) โดยพิจารณาว่าไม่อนุญาตให้ใช้บอทเพื่อการสื่อสาร และไม่รู้ว่าพวกเขากำลังเล่นกับใครจึงป้องกันการโต้ตอบใด ๆ ความสำเร็จของ Pluribus ผลจากการทดลองสองครั้งแสดงให้เห็นว่าอัตราความสำเร็จของ Pluribus สูงกว่าอย่างมีนัยสำคัญเมื่อเทียบกับผู้เล่นโป๊กเกอร์ ผู้เล่นบางคนที่เข้าร่วมการทดสอบ ได้แก่ Anthony Gregg, Dong Kim, Greg Merson, Jacob Toole, Jason Les, Jimmy Chou, Linus Loeliger, Michael Gagliano, Nick Petrangelo, Sean Ruane, Seth Davies และ Trevor Savage พร้อมด้วยและ ผู้เล่นแต่ละคนใช้ชื่อเล่นขณะเล่น ในการทดสอบ 5H + 1AI มีการตีมือ 10,000 ครั้งเป็นเวลา 12 วันในขณะที่ในการทดสอบ 1H + 5AI พระคาร์ดินัลดาร์เรนเอเลียสและคริสเฟอร์กูสันตีมือ 5,000 มากกว่าพลูริบัสห้าสำเนา เมื่อรวบรวมผลลัพธ์ปรากฎว่าบอทสามารถเอาชนะผู้คนได้ประมาณ $ 5 ต่อมือและประมาณ $ 1,000 ต่อชั่วโมงตามบล็อกโพสต์ Facebook AI ของ Noam Brown Video Showcase Pluribus vs Pros: สิ่งที่ผู้เล่นโป๊กเกอร์มืออาชีพคิดว่า AI Pluribus นี่คือสิ่งที่ผู้เข้าร่วมทดสอบพูดถึงบอทโป๊กเกอร์ใหม่ Seth Davies: “สิ่งที่น่าทึ่งที่สุดในการเล่นกับ Pluribus คือการตอบสนองต่อกลยุทธ์ preflop ของเขาซึ่งแตกต่างจากมนุษย์ Pluribus ใช้ขนาดของ preflop เป็นจำนวนมากการพยายามตอบสนองต่อรายการที่ไม่เปิดเผยถือเป็นความท้าทายที่น่าสนใจซึ่งแตกต่างจากเกมของมนุษย์ ” Jason Les: “นี่คือสัตว์ประหลาดที่สมบูรณ์แบบผมบอกได้เลยว่าเขาเก่งกว่าคนทั่วไปและนั่นคือเหตุผลว่าทำไมมันถึงเล่นยากมากคุณมักจะอยู่ในสถานการณ์ที่กดดันมากมายที่ AI กำลังทำให้คุณและคุณ รู้ว่าดูเหมือนจะสร้างความเสียหายมากมายที่นี่ “จิมมี่โชว:” ทุกครั้งที่ฉันตีบอทฉันรู้สึกว่าฉันเอาอะไรใหม่ ๆ มาใส่ในเกมในฐานะคน ๆ หนึ่งฉันคิดว่าเราจะแสดงให้ มันง่ายกว่าสำหรับตัวเราเองเกี่ยวกับเกมเราจัดเตรียมทักษะด้วยวิธีที่เรียบง่ายและน่าจดจำหนึ่งในทางลัดเหล่านี้ซับซ้อนมาก / ปรับให้เข้ากับการตัดสินใจใด ๆ ได้ “คริสเฟอร์กูสัน:” พลูริบัสเป็นคู่ต่อสู้ที่ยากมากมันยากมากที่จะวาง นอกจากนี้เขายังเล่นการพนันในแม่น้ำได้ดีมากเขาเก่งมากในการลบมูลค่าออกจากมือของเขา “Darren Elias:” ฉันเป็นคนเดียวและประเภทของโป๊กเกอร์ AI ห้าซึ่งฉันเล่นทุกวัน พันมือ พัฒนาขึ้นอย่างรวดเร็วกลายเป็นผู้เล่นระดับปานกลางไปสู่ผู้เล่นโป๊กเกอร์ระดับโลกภายในไม่กี่วันและหลายสัปดาห์ ช่างเป็นประสบการณ์ที่น่าสยดสยอง “ตอนนี้ไม่มีปัญหาถ้าเกมโป๊กเกอร์ที่ดีที่สุดในโลกไม่มีหน้าโป๊กเกอร์หลักของ Pluribus หรือระบบของมันถูกสร้างขึ้นโดยการเล่นด้วยตนเองหรือการแข่งขันและแบบพอเพียงนี่คือ วิธีที่ใช้ในการสร้าง OpenAI Five ซึ่งเป็นเครือข่ายห้าเครือข่ายที่ฝึกฝนมาเป็นเวลา 45,000 ปีและสามารถเอาชนะทีม eSports มืออาชีพในวิดีโอเกม Dota 2 Pluribus สอนตัวเองจากการแอบแฝงโดยใช้รูปแบบของการเพิ่มขีดความสามารถในการเรียนรู้ เช่นเดียวกับที่ใช้โดย Go AI ของ DeepMind AlphaZero เริ่มต้นด้วยการเล่นไพ่แบบสุ่มและปรับปรุงตามที่กำหนดว่ากิจกรรมใดมีกำไรมากที่สุดเมื่อแต่ละมือจะจำได้ว่าเล่นอย่างไรและเขาสงสัยว่าเขาจะทำเงินได้มากขึ้นด้วยบริการต่างๆหรือไม่เช่น เป็นการอัพเกรดแทนที่จะหยุดการพนันหากวิธีการนั้นให้ผลลัพธ์ที่ดีเขาก็มีแนวโน้มที่จะเลือกสิ่งเหล่านั้นในอนาคต โป๊กเกอร์ด้วยตัวเอง Pluribus ได้คิดค้นกลยุทธ์ดั้งเดิมที่เธอทำตามในเกมของเธอ สำหรับทุกการตัดสินใจของเขา Pluribus จะเปรียบเทียบลักษณะของเกมกับสไตล์ของเขาและคาดการณ์การเคลื่อนไหวเล็กน้อยเพื่อดูว่าเกมจะออกมาเป็นอย่างไร นั่นจะเป็นตัวกำหนดว่าเขาสามารถปรับปรุงได้หรือไม่ ด้วยการเรียนรู้ด้วยตัวเองโดยไม่ต้องป้อนข้อมูลจากมนุษย์ Pluribus ใช้เทคนิคบางอย่างที่ผู้เล่นที่เป็นมนุษย์ไม่เคยคิดจะใช้ ความสำเร็จของพลูริบัสส่วนใหญ่เกิดจากคุณภาพ เมื่อเล่นโป๊กเกอร์จะทำงานบนโปรเซสเซอร์หลัก (CPU) สองตัวซึ่งแตกต่างจากซีพียู 100 ตัวของ Libratus และบอท DeepMind Go ดั้งเดิมซึ่งใช้ซีพียูเกือบ 2,000 ตัวเมื่อพวกเขาเอาชนะผู้เล่นรายใหญ่ได้เป็นครั้งแรก เมื่อพลูริบัสเล่นด้วยตัวเองเขาเล่นจับมือกันเป็นเวลาเกือบ 20 วินาทีซึ่งเร็วกว่าผู้เล่นมืออาชีพเกือบสองเท่า สิ่งที่น่าสนใจอีกอย่างเกี่ยวกับ Pluribus คือซอฟต์แวร์ทำงานบนเซิร์ฟเวอร์คลาวด์ที่มีราคาเพียง 144 เหรียญในการทำงาน สำหรับการเปรียบเทียบ Libratus ใช้พลังงานจากซูเปอร์คอมพิวเตอร์มูลค่า 9.65 ล้านดอลลาร์ซึ่งมีราคาแพงมากในการทำงาน แน่นอนว่าการทดสอบนี้ไม่ได้จบลงแค่โป๊กเกอร์ แม้ว่าจะเป็นความสำเร็จที่ยอดเยี่ยมที่สามารถเอาชนะผลกำไรไพ่โป๊กเกอร์ที่ดีที่สุดของบุคคลในเกมมือถือหกเกม แต่ก็แสดงให้เห็นว่าความสามารถในการควบคุมคอมพิวเตอร์ของเขาอาจมีจุดประสงค์ที่แตกต่างจากการเล่นไพ่ ผลการวิจัยยืนยันความจริงที่ว่า AI สามารถทำงานในระดับ ‘มนุษย์’ ในสภาพแวดล้อมที่มีปัญหาหลากหลายและการเข้าถึงข้อมูลที่ จำกัด และสามารถใช้กันอย่างแพร่หลายตั้งแต่วาณิชธนกิจและกลยุทธ์การเจรจาไปจนถึงเทคโนโลยียานยนต์ด้วยตนเอง ตอนนี้ Pluribus ได้เข้าร่วมอันดับเกมเช่น Chess and Go ซึ่งเป็นสองเกมที่อัจฉริยะเอาชนะผู้เล่นที่มีชื่อเสียงระดับโลก ที่มา: https: //science.sciencemag.org/content/early/2019/07/10/science.aay2400


ปอยเปต คาสิโน
เกมส์ยิ่งปลา คาสิโน ได้เงินจริงไหม
เล่น คาสิโน
คาสิโน191
คาสิโน 88

Leave a Reply

Your email address will not be published. Required fields are marked *