পাইথন এবং কেরাস ব্যবহার করে কীভাবে আপনার নিজের আলফাফেরো এআই তৈরি করবেন

কানেক্ট 4 কৌশল শিখতে একটি মেশিনকে শেখান

এই নিবন্ধে, আমি তিনটি বিষয় কভার করার চেষ্টা করব:

  1. দুটি কারণে আলফাজেরো কৃত্রিম বুদ্ধিমত্তার জন্য একটি বিশাল লাফ ফরোয়ার্ড
  2. কানেক্ট 4 গেম খেলতে আলফাজিরো পদ্ধতিটির একটি প্রতিলিপি কীভাবে তৈরি করবেন
  3. অন্যান্য গেমগুলিতে যোগদানের জন্য কীভাবে কোডটি কাস্টমাইজ করা যায়

আলফাগো → আলফাগো জিরো → আলফাজিও

মার্চ ২০১ In-এ, ডিপমাইন্ডস আলফাগো 18 টি সময়ের গো ওয়ার্ল্ড চ্যাম্পিয়ন লি সেডলকে 4-1 ব্যবধানে পরাজিত করেছে এমন একটি সিরিজে যা 200 মিলিয়নেরও বেশি দর্শক দেখেছিল। একটি মেশিন গোপনীয়তা অর্জনের জন্য একটি অতিমানবীয় কৌশল শিখেছে, এমন অর্জন যা আগে অসম্ভব বলে মনে হয়েছিল, বা এটি অর্জনের আগে কমপক্ষে এক দশক আগে।

লি শেডলের বিপরীতে আলফাগো এর গেম 3

এটি নিজেই একটি উল্লেখযোগ্য অর্জন ছিল। তবে, 18 ই অক্টোবর, 2017-এ ডিপমাইন্ড আরও একটি বিশাল পদক্ষেপ নিয়েছিল।

"মাস্টারিং দ্য গেম অফ গো উইন্ড হিউম্যান নলেজ" প্রকাশনাটি আলফাগো জিরো অ্যালগরিদমের উপর একটি নতুন বাঁক প্রকাশ করেছে যা আলফাগোকে 100-0 ব্যবধানে পরাজিত করেছিল। অবিশ্বাস্যভাবে, এটি কেবলমাত্র স্ব-খেলার মাধ্যমে তাবুল রস (খালি অবস্থা) শুরু করে এবং ধীরে ধীরে এমন কৌশলগুলি সন্ধান করে যা পূর্ববর্তী অবতারগুলিকে পরাস্ত করতে পারে তার দ্বারা এটি করেছে। অতিমানবিক এআই তৈরির জন্য বিশেষজ্ঞ মানব গেমগুলির ডেটাবেস থাকা দরকার ছিল না।

ঠিক 48 দিন পরে, 5 ই ডিসেম্বর, 2017-এ ডিপমাইন্ড 'জেনারেল রিইনফোর্সমেন্ট লার্নিং অ্যালগরিদম ব্যবহার করে সেল্ফ-প্লে দ্বারা মাস্টারিং দাবা এবং শোগী' শীর্ষক আরেকটি প্রকাশনা প্রকাশ করেছেন, যা দেখায় যে কীভাবে স্টাফিশ এবং এলমো বিশ্ব চ্যাম্পিয়ন প্রোগ্রামগুলিকে সামঞ্জস্য করতে আলফাগো জিরোকে অনুকূলিত করা যায়? দাবা এবং শোগি বীট। প্রথম শেখার প্রক্রিয়াটি প্রথম থেকেই গেমটিকে বিশ্বের সেরা কম্পিউটার প্রোগ্রামে উপস্থাপন করা হয়েছিল, 24 ঘন্টােরও কম সময় নিয়েছিল।

আলফাজেরোর জন্ম হয়েছিল - সাধারণ অ্যালগরিদম যার সাহায্যে আপনি কিছু দ্রুত এবং মানব বিশেষজ্ঞ কৌশল সম্পর্কিত পূর্ব জ্ঞান ছাড়াই অর্জন করতে পারেন।

এই সাফল্য সম্পর্কে দুটি আশ্চর্যজনক জিনিস রয়েছে:

১. আলফাজেরোকে ইনপুট দেওয়ার জন্য মানব ইনপুট লাগবে না

এর গুরুত্ব যথেষ্ট জোর দেওয়া যায় না। এর অর্থ হ'ল আলফাগো জিরোর অন্তর্নিহিত পদ্ধতিটি পুরো গেমের সাথে নিখুঁত তথ্যের সাথে প্রয়োগ করা যেতে পারে (গেমের নিয়মাবলী ছাড়াই কোনও পূর্ববর্তী জ্ঞানের প্রয়োজন নেই বলে গেমের স্থিতি সর্বদা উভয় খেলোয়াড়ের কাছে পুরোপুরি পরিচিত।

এইভাবে, ডিপমাইন্ড আসল আলফাগো জিরো কাগজের ঠিক 48 দিন পরে দাবা এবং শোগি কাগজপত্র প্রকাশ করতে সক্ষম হয়েছিল। শব্দের সত্যিকার অর্থে, কেবলমাত্র ইনপুট ফাইলটি পরিবর্তন করতে হয়েছিল যা গেম মেকানিক্সের বর্ণনা দেয় এবং নিউরাল নেটওয়ার্ক এবং মন্টে কার্লো ট্রি অনুসন্ধানের সাথে সম্পর্কিত হাইপারপ্রেমেটারগুলিকে অনুকূল করে তোলে।

2. অ্যালগরিদম হাস্যকরভাবে মার্জিত

যদি আলফাজেরো অত্যধিক জটিল অ্যালগরিদম ব্যবহার করে যা বিশ্বের কয়েক মুষ্টিমেয় মানুষ বুঝতে পারে তবে এটি একটি অবিশ্বাস্য কীর্তি হতে পারে। কী অসাধারণ তা হ'ল কাগজে থাকা অনেক ধারণাগুলি পূর্ববর্তী সংস্করণগুলির তুলনায় অনেক কম জটিল complex তাঁর হৃদয়ে নিখরচায় নিখুঁতভাবে সহজ মন্ত্রটি নিহিত রয়েছে:

আপনার মাথার ভবিষ্যতের সম্ভাব্য দৃশ্যের মধ্য দিয়ে খেলুন, প্রতিশ্রুতিবদ্ধ পাথগুলিকে অগ্রাধিকার দিন এবং বিবেচনা করুন যে অন্যরা কীভাবে আপনার ক্রিয়ায় প্রতিক্রিয়া জানাতে পারে এবং অজানা অন্বেষণ করতে থাকবে।
অপরিচিত অবস্থায় পৌঁছানোর পরে, অবস্থানটি সম্ভবত আপনি কতটা অনুকূল বলে মনে করেন তা নির্ধারণ করুন এবং মানসিক পথে পূর্বের অবস্থানগুলির মাধ্যমে স্কোরকে ক্যাসকেড করুন যা এই বিন্দুতে নিয়ে গেছে।
ভবিষ্যতের সুযোগগুলি সম্পর্কে চিন্তাভাবনা করার পরে, আপনি প্রায়শই গবেষণা করেছেন এমন ক্রিয়াগুলি গ্রহণ করুন।
গেমের শেষে, ফিরে যান এবং কোথায় ভবিষ্যতের অবস্থানগুলির মূল্যকে ভুল ব্যাখ্যা করেছেন তা নির্ধারণ করুন এবং সেই অনুযায়ী আপনার বোঝাপড়াটি আপডেট করুন।

আপনি কীভাবে গেমস খেলতে শিখেন এমন শব্দটি কি মনে হয় না? আপনি যদি কোনও খারাপ পদক্ষেপ নিচ্ছেন তবে এটি হয় কারণ আপনি ফলাফলের ভবিষ্যতের মানটিকে ভুলভাবে বিবেচনা করেছেন বা আপনার বিরোধী কোনও নির্দিষ্ট পদক্ষেপ নেবে এমন সম্ভাবনাটি ভুল করে দিয়েছেন। এগুলি হ'ল আলফাজেরোকে গেমপ্লে করার দুটি দিকই প্রশিক্ষণ দেওয়া হয়েছিল।

আমি কীভাবে নিজের আলফা জিরো তৈরি করব?

প্রথমে আলফাগো জিরো কীভাবে কাজ করে তা শিখতে আলফাগো জিরো চিট শিটটি দেখুন। আমরা কোডের প্রতিটি টুকরো দিয়ে যাচ্ছি তা উল্লেখ করার মতো। এখানে একটি দুর্দান্ত নিবন্ধও রয়েছে যা আলফাজিরো কীভাবে কাজ করে তা আরও বিশদে ব্যাখ্যা করে।

কোড

আমি উল্লেখ করি কোডটি ধারণ করে এই গিট সংগ্রহস্থলটিকে ক্লোন করুন।

শেখার প্রক্রিয়া শুরু করতে, রান.আইপিনব জুপিটার নোটবুকের শীর্ষ দুটি ডিসপ্লে চালান। এটির স্মৃতি পূরণের জন্য পর্যাপ্ত খেলার অবস্থান প্রতিষ্ঠার সাথে সাথেই নিউরাল নেটওয়ার্ক প্রশিক্ষণ শুরু করে। অতিরিক্ত স্ব-খেল এবং প্রশিক্ষণের মাধ্যমে, এটি প্রতিটি অবস্থান থেকে গেমের মান এবং পরবর্তী পদক্ষেপের পূর্বাভাস দিতে ধীরে ধীরে আরও ভাল হয়ে যায়, ফলস্বরূপ আরও ভাল সিদ্ধান্ত এবং একটি চৌকস সামগ্রিক গেম হয়।

আমরা এখন কোডটি ঘনিষ্ঠভাবে দেখতে যাচ্ছি এবং এমন কিছু ফলাফল দেখাব যা দেখায় যে সময়ের সাথে সাথে এআই আরও শক্তিশালী হয়।

এনবি - উপরের নথিগুলিতে উপলভ্য তথ্যের উপর ভিত্তি করে আলফাজিরো কীভাবে কাজ করে তা এটি আমার নিজের বোঝার। নিম্নলিখিতগুলির মধ্যে কোনওটি যদি ভুল হয় তবে আমি ক্ষমা চাই এবং আমি এটি সংশোধন করার চেষ্টা করব!

কানেক্ট 4

আমাদের অ্যালগরিদমটি যে গেমটি শিখবে তা হ'ল কানেক্ট 4 (বা ফোর ইন এ রো)। গোয়ের মতো জটিল নয় ... তবে এখনও মোট 4,531,985,219,092 গেমের অবস্থান রয়েছে।

কানেক্ট 4

গেমের নিয়মগুলি সোজা are খেলোয়াড়রা উপরের উপলভ্য কলামগুলির মধ্যে একটিতে তাদের রঙের একটি টুকরো প্রবেশ করে পালা করে take প্রথম খেলোয়াড়ের তার চারটি রং এককভাবে রয়েছে - হয় উল্লম্ব, অনুভূমিকভাবে বা ত্রিভুজ - জয় হয়। পুরো গ্রিডটি যদি পর পর চারটি তৈরি না করে পূর্ণ হয় তবে গেমটি টানা হবে।

কোড ফাইলগুলি তৈরি করে এমন মূল ফাইলগুলির সংক্ষিপ্তসার এখানে:

গেম.পি

এই ফাইলটিতে কানেক্ট 4 এর গেমের নিয়ম রয়েছে।

প্রতিটি বর্গ নিম্নলিখিত হিসাবে 0 থেকে 41 পর্যন্ত একটি নম্বর বরাদ্দ করা হয়:

কানেক্ট 4 এর জন্য ক্রিয়া ক্ষেত্র

গেম.পি ফাইলটি একটি বাছাই করা ক্রিয়াকলাপের পরে একটি গেমের অবস্থা থেকে অন্য গেমের স্থিতিতে পরিবর্তনের জন্য যুক্তি সরবরাহ করে। উদাহরণস্বরূপ, গেম বোর্ড এবং অ্যাকশন 38 যদি খালি থাকে তবে মিডিয়া কলামের নীচে প্রারম্ভিক প্লেয়ারের চরিত্রটি নিয়ে টেকএকশন পদ্ধতিটি একটি নতুন গেমের স্থিতি ফেরত দেয়।

আপনি একই এপিআই অনুসারে যে কোনও গেম ফাইলের সাথে গেম.পি ফাইলটি প্রতিস্থাপন করতে পারেন এবং অ্যালগরিদম মূলত আপনি প্রদত্ত বিধিগুলি ব্যবহার করে কৌশলটি শিখবেন।

run.ipynb

এটিতে কোডটি রয়েছে যা শেখার প্রক্রিয়া শুরু করে। এটি গেমের নিয়মগুলি লোড করে এবং তারপরে মূল অ্যালগরিদম লুপ দিয়ে যায় যা তিনটি পর্যায় নিয়ে গঠিত:

  1. নিজে খেলুন
  2. নিউরাল নেটওয়ার্ক পুনরায় প্রশিক্ষণ
  3. নিউরাল নেটওয়ার্কের মূল্যায়ন

এই লুপটিতে দুটি এজেন্ট জড়িত রয়েছে, সেরা_প্লেয়ার এবং বর্তমান_প্লেয়ার।

সেরা_প্লেয়ারটিতে সর্বাধিক শক্তিশালী নিউরাল নেটওয়ার্ক রয়েছে এবং এটি স্ব-গেমের স্মৃতি তৈরি করতে ব্যবহৃত হয়। বর্তমান খেলোয়াড় তার স্মরণে তার নিউরাল নেটওয়ার্ক প্রশিক্ষণ দেয় এবং তারপরে সেরা খেলোয়াড়ের বিরুদ্ধে নিক্ষিপ্ত হয়। এটি জিতলে, সেরা_প্লেয়ারের নিউরাল নেটওয়ার্কটি বর্তমান_প্লেয়ারের নিউরাল নেটওয়ার্কে স্যুইচ করা হয় এবং লুপটি আবার শুরু হয়।

এজেন্ট.পি

এর মধ্যে এজেন্ট শ্রেণি (গেমের একজন খেলোয়াড়) অন্তর্ভুক্ত। প্রতিটি প্লেয়ার তাদের নিজস্ব নিউরাল নেটওয়ার্ক এবং মন্টে কার্লো অনুসন্ধান ট্রি দ্বারা আরম্ভ করা হয়।

সিমুলেশন পদ্ধতিটি মন্টি কার্লো ট্রি অনুসন্ধান প্রক্রিয়া চালায়। বিশেষত, এজেন্ট গাছের একটি পাতার নোডে চলে যায়, তার নিউরাল নেটওয়ার্ক দিয়ে নোডকে মূল্যায়ন করে এবং তারপরে গাছের মাধ্যমে নোডের মান পূরণ করে।

বর্তমান অবস্থান থেকে কোনটি আন্দোলন সবচেয়ে অনুকূল। তারপরে নির্বাচিত অ্যাকশনটি পদক্ষেপ নিতে খেলায় ফিরে আসে।

প্লেব্যাক পদ্ধতিতে, নিউরাল নেটওয়ার্কটি পূর্ববর্তী গেমগুলির স্মৃতি ব্যবহার করে পুনরায় প্রশিক্ষিত হয়।

মডেল.পি

কেরাস দিয়ে তৈরি বাকী কনভলিউশন নেটওয়ার্কের একটি উদাহরণ

এই ফাইলটিতে রেসিডুয়াল_সিএনএন ক্লাস রয়েছে, যা সংজ্ঞায়িত করে যে কীভাবে নিউরাল নেটওয়ার্কের একটি উদাহরণ তৈরি করা হয়।

আলফাগোজিরো নিবন্ধে নিউরাল নেটওয়ার্ক আর্কিটেকচারের একটি সংকুচিত সংস্করণ ব্যবহার করা হয়েছে - যেমন। এইচ। একটি কনভলিউশন স্তর, এর পরে অনেকগুলি অবশিষ্ট স্তর থাকে, যা পরে মান এবং নীতি শিরোনামে বিভক্ত হয়।

কনফিগারেশন ফাইলে বিশ্লেষণ ফিল্টারগুলির গভীরতা এবং সংখ্যা নির্দিষ্ট করা যেতে পারে।

কেরাস লাইব্রেরিটি টেনসরফ্লো থেকে ব্যাকএন্ড সহ নেটওয়ার্ক তৈরি করতে ব্যবহৃত হয়।

রান.আইপিনব নোটবুকটিতে, নিউরাল নেটওয়ার্কে স্বতন্ত্র কনভলিউশন ফিল্টার এবং ঘনভাবে সংযুক্ত স্তরগুলি দেখতে নিম্নলিখিতটি করুন:

কারেন্ট_প্লেয়ার.মোডেল.ভিউ লেয়ার্স ()
নিউরাল নেটওয়ার্ক থেকে কনভলিউশন ফিল্টার

এমসিটিএস.পি

এটিতে নোড, এজ এবং এমসিটিএস ক্লাস রয়েছে যা মন্টে কার্লো অনুসন্ধান গাছ গঠন করে।

এমসিটিএস ক্লাসে পূর্বে উল্লিখিত মুভটোলিফ এবং ব্যাকফিল পদ্ধতি রয়েছে এবং প্রতিটি সম্ভাব্য পদক্ষেপে এজ ক্লাস স্টোরের পরিসংখ্যানের উদাহরণ রয়েছে।

config.py

এখানে আপনি সর্বাধিক গুরুত্বপূর্ণ পরামিতি সেট করেছেন যা অ্যালগরিদমকে প্রভাবিত করে।

এই ভেরিয়েবলগুলি সামঞ্জস্য করা রানটাইম, নিউরাল নেটওয়ার্কের যথার্থতা এবং অ্যালগরিদমের সামগ্রিক সাফল্যকে প্রভাবিত করে। উপরের প্যারামিটারগুলি একটি উচ্চ মানের কানেক্ট 4 প্লেয়ার তৈরি করে তবে তারা অনেক সময় নেয়। পরিবর্তে, অ্যালগরিদম গতি বাড়ানোর জন্য নিম্নলিখিত পরামিতিগুলি ব্যবহার করে দেখুন।

funcs.py

প্লেম্যাচগুলি এবং প্লেম্যাচস বিটউইনভিউয়ার্স ফাংশন রয়েছে, যা দুটি এজেন্টের মধ্যে ম্যাচ খেলতে ব্যবহৃত হয়।

আপনার সৃষ্টির বিরুদ্ধে খেলতে নিম্নলিখিত কোডটি (রান.আইপিনব নোটবুকেও) চালান।

ফানকস প্লে থেকে গেম আমদানি গেম থেকে আমদানি ম্যাচবেটউইনভিউশনস ভার্সনগুলি এলজি হিসাবে আমদানি করুন
env = গেম () প্লেম্যাচস বিটিউইন ভার্সন (এনএভিও, 1 # কম্পিউটারটি যার অধীনে অবস্থিত সংস্করণ নম্বর, -1 # প্রথম প্লেয়ারের সংস্করণ নম্বর (মানুষের জন্য -1), 12 # দ্বিতীয় প্লেয়ারের সংস্করণ নম্বর (মানুষের জন্য -1), 10 # কয়টি গেম খেলতে হবে, lg.logger_tourney # যেখানে গেমটি সংরক্ষণ করা উচিত, 0 # কোন খেলোয়াড়কে আগে যেতে হবে - 0 এলোমেলো জন্য)

প্রারম্ভিক.পি

আপনি যখন অ্যালগরিদম চালান, সমস্ত মডেল এবং স্টোরেজ ফাইলগুলি রুট ডিরেক্টরিতে এক্সিকিউশন ফোল্ডারে সংরক্ষণ করা হয়।

পরে এই চেকপয়েন্ট থেকে অ্যালগরিদম পুনরায় আরম্ভ করতে, এক্সিকিউশন ফোল্ডারটি রান_আরচাইভ ফোল্ডারে স্থানান্তর করুন এবং ফোল্ডারের নামটিতে একটি এক্সিকিউশন নম্বর যুক্ত করুন। তারপরে প্রাথমিক নম্বর.পি ফাইলটিতে রান নম্বর, মডেল সংস্করণ নম্বর এবং স্টোরেজ সংস্করণ নম্বর প্রবেশ করুন যা রান_আরচাইভ ফোল্ডারে সংশ্লিষ্ট ফাইলগুলির অবস্থানের সাথে সম্পর্কিত। আপনি যদি যথারীতি অ্যালগরিদম চালনা করেন তবে এটি এই চেকপয়েন্ট থেকে শুরু হবে।

মেমরি.পি

মেমোরি ক্লাসের একটি উদাহরণ পূর্ববর্তী গেমগুলির স্মৃতি সঞ্চয় করে, যা অ্যালগরিদম বর্তমান প্লেয়ারের নিউরাল নেটওয়ার্কটিকে পুনরুদ্ধার করতে ব্যবহার করে।

ক্ষতি.py

এই ফাইলটিতে একটি ব্যবহারকারী-সংজ্ঞায়িত ক্ষতি ফাংশন রয়েছে যা ক্রস এনট্রপি ক্ষতি ফাংশনে যাওয়ার আগে অবৈধ পদক্ষেপের পূর্বাভাসগুলি মাস্ক করে।

সেটিংস.পি

রান এবং রান_আর্কাইভ ফোল্ডারগুলির অবস্থান।

logger.py

লগ ফাইলগুলি এক্সিকিউশন ফোল্ডারে লগ ফোল্ডারে সংরক্ষণ করা হয়।

লগিং সক্রিয় করতে, এই ফাইলটিতে লগার_ডিজিয়েবল ভেরিয়েবলের মানগুলি মিথ্যাতে সেট করুন।

লগ ফাইলগুলি দেখতে আপনাকে অ্যালগরিদম কীভাবে কাজ করে এবং এর "চিন্তাভাবনা" তা বুঝতে সহায়তা করবে। উদাহরণস্বরূপ, এখানে লগার.এমসিটিএস ফাইল থেকে একটি উদাহরণ।

লগার.এমসিটিএস ফাইল থেকে আউটপুট

তেমনিভাবে, লগার.ট্যুরনে ফাইলটিতে আপনি মূল্যায়ন পর্বের সময় প্রতিটি আন্দোলনের সাথে যুক্ত সম্ভাবনাগুলি দেখতে পাবেন:

লগার.ট্যুরনি ফাইল থেকে আউটপুট

ফলাফল

আপনি যদি কয়েক দিনের মধ্যে অনুশীলন করেন, আপনি মিনিব্যাচ পুনরাবৃত্তির সংখ্যার সাথে সম্পর্কিত নিম্নলিখিত ক্ষতির গ্রাফ পাবেন:

মিনি-ব্যাচের পুনরাবৃত্তির সংখ্যার বিরুদ্ধে লোকসান

শীর্ষ লাইনটি পলিসির শিরোনামে ত্রুটি (এমআরসিটিএস মোশন সম্ভাবনার ক্রস এনট্রপি বনাম নিউরাল নেটওয়ার্ক থেকে আউটপুট) is নীচের লাইনটি মান শিরোনামের ত্রুটি (আসল গেমের মান এবং নিউরাল নেটওয়ার্ক যা মানটির পূর্বাভাস দেয় তার মধ্যে গড় বর্গ ত্রুটি)। কেন্দ্রের লাইনটি দুটিরই গড়।

স্পষ্টতই, নিউরাল নেটওয়ার্ক প্রতিটি গেম স্টেটের মান এবং সম্ভবত পরবর্তী পদক্ষেপগুলির পূর্বাভাস দিতে আরও ভাল সক্ষম। এটি কীভাবে ক্রমবর্ধমান শক্তিশালী গেমটির দিকে পরিচালিত করে তা দেখানোর জন্য, আমি 17 খেলোয়াড়ের মধ্যে একটি লিগ চালিয়েছিলাম যা নিউরাল নেটওয়ার্কের প্রথম পুনরাবৃত্তি থেকে 49 তম বিভাগ পর্যন্ত। প্রতিটি জুটি দু'বার খেলেছে, উভয় খেলোয়াড়কেই প্রথম খেলার সুযোগ রয়েছে।

এখানে শেষ ফলাফল:

স্পষ্টতই নিউরাল নেটওয়ার্কের পরবর্তী সংস্করণগুলি পূর্ববর্তী সংস্করণগুলির চেয়ে সেরা এবং তাদের বেশিরভাগ গেম জিতে। এটাও মনে হয় যে শেখাটি এখনও পরিপক্ক নয় - খেলোয়াড়রা অনুশীলন চালিয়ে যাওয়ার সাথে সাথে তারা আরও শক্তিশালী হতে থাকবে এবং আরও জটিল কৌশলগুলি শিখতে থাকবে।

উদাহরণস্বরূপ, একটি স্পষ্ট কৌশল যা সময়ের সাথে নিউরাল নেটওয়ার্ক অনুকূল হয়ে উঠেছে তা হল মাঝের স্তম্ভটি তাড়াতাড়ি নেওয়া। অ্যালগরিদমের প্রথম সংস্করণ এবং 30 তম সংস্করণের মধ্যে পার্থক্যটি নোট করুন:

1. নিউরাল নেটওয়ার্ক সংস্করণ

30. নিউরাল নেটওয়ার্ক সংস্করণ

এটি একটি ভাল কৌশল কারণ অনেক লাইনের মধ্য কলামের প্রয়োজন। আপনি যদি প্রথম দিকে এটি দাবি করেন তবে আপনার প্রতিপক্ষ এটির সুবিধা নিতে সক্ষম হবে না। এটি মানব ইনপুট ছাড়াই নিউরাল নেটওয়ার্ক থেকে শিখেছি।

অন্য একটি খেলা শিখুন

গেমস ফোল্ডারের অভ্যন্তরে মেটাস্কোয়ারস নামে একটি গেমের জন্য একটি গেম.পি ফাইল। এটি করার জন্য, এক্স এবং ও মার্কারগুলি বিভিন্ন আকারের স্কোয়ার তৈরি করতে একটি গ্রিডে স্থাপন করা হয়। বৃহত স্কোয়ার ছোট স্কোয়ারের চেয়ে বেশি পয়েন্ট করে এবং গ্রিড পূর্ণ হলে সবচেয়ে বেশি পয়েন্ট পাওয়া খেলোয়াড় জিততে পারে।

আপনি যদি মেটাস্কুয়ার্স গেম.পি ফাইলের জন্য কানেক্ট 4 গেম.পি ফাইলটি স্যুইপ করেন তবে একই অ্যালগোরিদম পরিবর্তে কীভাবে মেটাস্কোয়ারগুলি খেলতে শিখবে।

সারসংক্ষেপ

আশা করি আপনি এই নিবন্ধটি দরকারী পাবেন। আপনি যদি কোড বেজ বা নিবন্ধের কোনও বিষয়ে টাইপস বা কোনও প্রশ্ন খুঁজে পান তবে নীচের মন্তব্যে আমাকে জানতে দিন। আমি যত তাড়াতাড়ি সম্ভব আপনার কাছে ফিরে আসব।

আপনি যদি আমাদের সংস্থা ব্যবসায়ের জন্য উদ্ভাবনী তথ্য বিজ্ঞানের সমাধানগুলি বিকাশ করে সে সম্পর্কে আরও জানতে চান, তবে আমাদের ওয়েবসাইটের মাধ্যমে বা সরাসরি লিংকডইন এর মাধ্যমে আমাদের সাথে নির্দ্বিধায় যোগাযোগ করুন।

... এবং যদি আপনি এটি পছন্দ করেন তবে কয়েকটি হার্টি তালি নির্দ্বিধায় ছেড়ে দিন :)

ফলিত ডেটা সায়েন্স একটি লন্ডন ভিত্তিক পরামর্শক সংস্থা যা ব্যবসায়ের জন্য বিস্তৃত ডাটা সায়েন্স সমাধান প্রয়োগ করে এবং পরিমাপযোগ্য মান সরবরাহ করে। আপনি যদি আপনার ডেটা দিয়ে আরও কিছু করতে চান তবে আসুন এটি সম্পর্কে কথা বলুন।