আমি বিভক্ত

যন্ত্রটি মানুষকে ছাড়িয়ে গেছে: ডিপ ব্লু থেকে আলফা গো পর্যন্ত অ্যালগরিদমের চ্যালেঞ্জ

ডিপ ব্লু এবং বিশ্বচ্যাম্পিয়ন গ্যারি কাসপারভের মধ্যে দাবা ম্যাচের পর থেকে, কৃত্রিম বুদ্ধিমত্তা বিশ বছর ধরে মানুষকে চ্যালেঞ্জ করে চলেছে কিন্তু 2016 সালে ওভারটেকিং হল বাস্তবতা: ডিপ মাইন্ড অ্যালগরিদম GO বিশ্ব চ্যাম্পিয়নকে পরাজিত করেছে এবং এবার কোনো বিতর্ক ছাড়াই

বছরটি হল 1996। খবরের একটি টুকরো দ্রুত বিশ্বজুড়ে যায়, আলোড়ন ও প্রশংসা জাগিয়ে তোলে: প্রথমবারের মতো একটি কম্পিউটার দাবাবোর্ডে বিশ্ব চ্যাম্পিয়নের বিরুদ্ধে জয়লাভ করতে সক্ষম হয়। এটি ছিল ফেব্রুয়ারী 10, 1996 যখন আইবিএম দ্বারা বিশেষভাবে দাবা খেলার জন্য ডিজাইন করা এবং নির্মিত একটি কম্পিউটার ডিপ ব্লু, খেতাবধারী গ্যারি কাসপারভকে পরাজিত করে, ম্যান-ক্যালকুলেটর চ্যালেঞ্জের উদ্বোধনী খেলায়। এটি একটি ঐতিহাসিক তারিখ, কৃত্রিম বুদ্ধিমত্তা এমন একটি লক্ষ্য অর্জন করে যা বেশিরভাগের নাগালের বাইরে, পৌঁছানো অসম্ভব, মেশিনে বাধা বলে মনে করা হয়। যদিও প্রথম খেলায় আইবিএম সুপার কম্পিউটার কাসপারভের চেয়ে ভালো হয়েছে, তবে সংঘর্ষের চূড়ান্ত ফলাফলটি রাশিয়ান চ্যাম্পিয়নের জয় দেখে। পরবর্তী ম্যাচে ডিপ ব্লু প্রাথমিক সাফল্যের পুনরাবৃত্তি করতে পারেনি এবং শেষ পর্যন্ত কাসপারভের জন্য তিনটি জয় এবং দুটি ড্র রয়েছে। লোকটি গাড়িকে 4-2 মারছে।

অনেকে স্বস্তির নিঃশ্বাস ফেলে, মানবতা তার আদিমতা রক্ষা করে। মানুষের ক্ষতির জন্য কম্পিউটারকে ছাড়িয়ে যাওয়া সম্ভবত আর বিজ্ঞান কল্পকাহিনীর একচেটিয়া বিষয় নয়, তবে অন্তত এটি এখনও আসা বাকি। আর কিছু ভুল নয়! পরের বছর দুই প্রতিযোগীর মধ্যে প্রতিশোধ দেখা যায় এবং এবার ডিপ ব্লু বিজয়ী হয়। তাই 1997 সালের মে মাসে কম্পিউটার মানুষকে হারায়: 3,5-2,5। একটি সীমা অতিক্রম করা হয়েছে, একটি প্রাচীর ভেঙে গেছে।

গ্যারি কাসপারভ সম্প্রতি প্রকাশিত 300 পৃষ্ঠার একটি বইয়ে "গভীর চিন্তা: যেখানে কৃত্রিম বুদ্ধিমত্তা শেষ এবং মানব সৃজনশীলতা শুরু" শিরোনামে এই হারানো চ্যালেঞ্জটি পুনর্গঠন করেছেন।

তবে ঘটনাটি বিতর্কমুক্ত নয়। প্রথমত, ডিপ ব্লু যে ঘরে ম্যাচটি খেলা হয় তার ভিতরে অবস্থিত নয়, তবে কয়েক কিলোমিটার দূরে এবং ফলস্বরূপ, কম্পিউটার থেকে সরাসরি ডেটা পাঠানো হয় না। এই সত্য এবং অন্যান্য উপাদানগুলি কাসপারভকে দাবি করতে পরিচালিত করে যে ম্যাচের সময় ডিপ ব্লুকে সাহায্য করা হয়েছিল। একটি উপাদান যা চ্যালেঞ্জের সময় বেশ কয়েকবার ফিরে আসে এবং পূর্ববর্তী চুক্তি অনুসারে মেশিনের কার্যকলাপ সম্পর্কিত প্রিন্টআউট প্রদানের জন্য কাসপারভের অনুরোধে IBM-এর প্রত্যাখ্যান, শুধুমাত্র সন্দেহকে আরও শক্তিশালী করে এবং সন্দেহের উদ্রেক করে। পরাজিত ব্যক্তি অবশেষে পুনরায় ম্যাচের জন্য জিজ্ঞাসা করে, কিন্তু আইবিএম সম্পূর্ণ প্রত্যাখ্যানের বিরোধিতা করে, নিশ্চিতভাবে ডিপ ব্লু প্রত্যাহার করে।

20 বছর পরে ডিপ মাইন্ড অ্যালগরিদম আসে

2003 সালের একটি তথ্যচিত্রে, গেম ওভার: কাসপারভ অ্যান্ড দ্য মেশিন, কিছু সাক্ষীর সাথে সাক্ষাত্কার দেওয়া হয়েছে যারা সুপার কম্পিউটারের বিজয়ের উপর একটি ভারী ছায়া ফেলেছিল। এগুলি থেকে এটি আবির্ভূত হবে যে, শেষ পর্যন্ত, ডিপ ব্লু স্টক মার্কেটে তার স্টকের মূল্য বাড়ানোর জন্য IBM দ্বারা বাস্তবায়িত একটি চক্রান্তের প্রতিনিধিত্ব করেছিল। কাসপারভের উপর বিজয়ের এক দিনে, IBM শেয়ার 15% বেড়েছে।

সুতরাং মেশিনের বিজয়, বিশেষত, প্রাথমিকভাবে বিশ্বাস করার চেয়ে সম্ভবত অনেক বেশি মানবিক। বা সুযোগের ফলাফল, যেমনটি নেট সিলভার দাবি করেছে। তাঁর বইতে (দ্য সিগন্যাল অ্যান্ড দ্য নয়েজ। পূর্বাভাসের শিল্প ও বিজ্ঞান) তিনি ডিপ ব্লু-এর সাফল্যকে একেবারে অযৌক্তিক পদক্ষেপের জন্য দায়ী করেছেন, যা যন্ত্র দ্বারা তৈরি সুযোগের ফলাফল। এমন একটি পদক্ষেপ যা কাসপারভের মানবতাকে অপূরণীয়ভাবে অস্থিতিশীল করে তুলবে, তার আস্থা ও যৌক্তিকতাকে ক্ষুণ্ন করবে।

বিশ বছর পর, আলফাগো আরেকটি সীমা ভঙ্গ করে। ডিপ মাইন্ড অ্যালগরিদম 2016 এর প্রথম মাসগুলিতে পরাজিত হয়েছে, এবার বিতর্ক বা কৌশল ছাড়াই, প্রথমে ইউরোপীয় চ্যাম্পিয়ন এবং তারপর বিশ্ব জিও চ্যাম্পিয়ন। জয় স্পষ্ট এবং দ্ব্যর্থহীন। এবং যন্ত্রটি যে সত্যিকার অর্থে মানুষকে ছাড়িয়ে যেতে সক্ষম তা এই সত্য দ্বারা প্রমাণিত হয় যে, 29 ডিসেম্বর 2016 থেকে 4 জানুয়ারী 2017 এর মধ্যে এক সপ্তাহের মধ্যে, আলফাগো, ছদ্মবেশে, গ্রহের সেরা খেলোয়াড়দের বিরুদ্ধে টানা ষাটটি জয়লাভ করতে সক্ষম হয়েছিল। মাংস.

গণনা ক্ষমতা: 10170 

সম্প্রতি অবধি এটি বিশ্বাস করা হয়েছিল যে কিছু নির্দিষ্ট অঞ্চল মানুষের একচেটিয়া ডোমেইন থাকবে বা, সবচেয়ে খারাপ পরিস্থিতিতে, আগামী দীর্ঘ সময়ের জন্য থাকবে। এর মধ্যে দাবা এবং গো উভয়ই ছিল। উভয় খেলাই, যদিও তাদের নগণ্য নিয়ম এবং আপাতদৃষ্টিতে সহজ গতিশীলতা রয়েছে, আসলে একটি উচ্চ অসুবিধা লুকিয়ে থাকে। একটি অসুবিধা যা চালের সংমিশ্রণের সংখ্যা এবং এর ফলে সম্ভাব্য গেম কনফিগারেশনের দ্বারা প্রদত্ত। এত বড় সংখ্যা যে একজনকে বিশ্বাস করতে বাধ্য করে যে কোনও কম্পিউটারই এই ধরনের জটিলতা আয়ত্ত করতে সক্ষম হবে না। তাই এটি সাধারণ মতামত ছিল যে দাবা, এবং আরও বেশি গো, মানুষের বুদ্ধিমত্তা এবং সর্বোপরি অন্তর্দৃষ্টির অধিকার থাকবে। এখনও কম যেমন একটি আকস্মিক আত্মসমর্পণ প্রত্যাশিত ছিল.

কিন্তু যদি ডিপ ব্লু ব্রুট ফোর্সের মাধ্যমে জয়লাভ করতে সক্ষম হয়, একটি শক্তিশালী কম্পিউটিং শক্তির (প্রতি সেকেন্ডে 220 মিলিয়ন চাল গণনা করতে সক্ষম), আলফাগোর জন্য বিষয়টি ভিন্ন। গো-তে দাবার চেয়ে অনেক বেশি সংখ্যক কম্বিনেশন রয়েছে। প্রতিটি পদক্ষেপের জন্য, গড়ে, সম্ভাবনা দশগুণ বেশি। একা গণনার ক্ষমতা, যদিও বিশাল, প্রায় 10170টি বিভিন্ন পরিস্থিতিতে বিবেচনা করার জন্য এবং একই সাথে গেমটির দ্বারা সৃষ্ট ত্রুটিগুলি সম্পর্কে সঠিক হওয়ার জন্য যথেষ্ট হবে না।

তাহলে কিভাবে আলফাগো বিশ্ব চ্যাম্পিয়নকে হারাতে পেরেছে? সহজ, শেখার।

গভীর শিক্ষা, মেশিনের গোপন অস্ত্র

ডিপ মাইন্ডের প্রতিষ্ঠাতা ডেমিস হাসাবিস যেমন বলেছেন, কম্পিউটারকে আরও স্মার্ট করার দুটি উপায় রয়েছে। একটি প্রথম পদ্ধতি প্রোগ্রামিং একটি প্রদত্ত সমস্যার একটি নির্ধারিত সমাধান প্রদান করে এবং মেশিনটিকে এটি কার্যকর করতে দেয়। দ্বিতীয়টি, এবং এটি AlphaGo-এর ক্ষেত্রে, "... কম্পিউটারকে নিজের থেকে শেখার, অভিজ্ঞতার মাধ্যমে শেখার ক্ষমতা প্রদান করে। … আমি তোমাকে শিখাবো কিভাবে শিখতে হয়, আমি তোমাকে সমাধান দেব না»।

AlphaGo-এর সাফল্যের পেছনের রহস্যকে বলা হয় ডিপ লার্নিং। "অ্যালগরিদমের তিনটি বৈশিষ্ট্য রয়েছে, সবগুলোই নিউরোবায়োলজি থেকে নেওয়া হয়েছে: রিইনফোর্সমেন্ট লার্নিং, কনভোল্যুশনাল নিউরাল নেটওয়ার্ক এবং সিলেক্টিভ মেমরি লুপ।"

আরেকটি বিশেষত্ব যা আলফাগোকে ডিপ ব্লু থেকে আলাদা করে তা হল যে ডিপ মাইন্ড প্রাণীটিকে বিশেষভাবে এবং একচেটিয়াভাবে Go-এর জন্য তৈরি করা হয়নি৷ অন্তর্নিহিত অ্যালগরিদম সময়ের সাথে সাথে বিভিন্ন ধরণের গেম শিখতে এবং মানিয়ে নিতে সক্ষম হতে প্রমাণিত হয়েছে৷ এর অগ্রগতি এবং এর অধিগ্রহণ প্রকৃতপক্ষে সতর্ক ও সূক্ষ্ম পরিকল্পনার কারণে নয়, বরং অভিজ্ঞতার ফল। এটা কি জানে, আলফাগো নিখুঁত স্বায়ত্তশাসনে খেলার মাধ্যমে আবিষ্কার করেছে এবং আত্মীকরণ করেছে। "নতুন প্রজন্মের অ্যালগরিদমের বৈশিষ্ট্য হল, মানুষের মতো, তারা তাদের সাফল্য এবং ব্যর্থতা থেকে শিক্ষা নেয়।"

49টি ভিন্ন Atari 2600 গেমে প্রশিক্ষিত, ডিপ মাইন্ডের অ্যালগরিদম শুধুমাত্র অন্যান্য প্রতিযোগী অ্যালগরিদম নয়, মানুষকেও ছাড়িয়ে গেছে। "... এই গেমগুলির মধ্যে 29টিতে অ্যালগরিদম একজন মানুষের পেশাদার পরীক্ষককে 75 শতাংশ বা তার বেশি ছাড়িয়েছে, কখনও কখনও তাদের খুব বড় ব্যবধানে পরাজিত করেছে।"

জ্ঞানীয় কম্পিউটিং

AlphaGo দেখায় যে আমরা এখন প্রবেশ করছি যা IBM ডেটা প্রক্রিয়াকরণের তৃতীয় যুগ হিসাবে বর্ণনা করে: জ্ঞানীয় কম্পিউটিং এর। প্রথম যুগ, টেবুলেটিং কম্পিউটিং, একেবারে শুরু থেকে 50 সাল পর্যন্ত, কম্পিউটারগুলি ইনপুট এবং আউটপুট উভয়ের জন্য পাঞ্চড কার্ড ব্যবহার করে অপরিহার্য গাণিতিক ক্রিয়াকলাপ সম্পাদন করতে সক্ষম ছিল। দ্বিতীয় যুগ, যেটি প্রোগ্রামিং কম্পিউটিং, 50 থেকে বর্তমান দিন পর্যন্ত, ইলেকট্রনিক কম্পিউটারের যুগ। মেশিনগুলি কমান্ড (যদি/তখন) এবং যৌক্তিক কাঠামো প্রক্রিয়া করতেও সক্ষম, তবে তাদের অবশ্যই নির্দিষ্ট নিয়ম অনুসরণ করে এটি করার নির্দেশ দেওয়া উচিত এবং তাই প্রোগ্রাম করা দরকার।

কগনিটিভ কম্পিউটিং, জোনাস নুউকে (IBM) ব্যাখ্যা করেছেন, «... "যদি/তাহলে" যুক্তিতে অন্তর্নিহিত অনমনীয়তা ভেঙে ফেলার জন্য জন্মগ্রহণ করা হয়েছিল ... জ্ঞানীয় কম্পিউটিং হল একটি সম্ভাব্য বিশদ বিবরণ, যার ফলাফল কঠোরভাবে "হ্যাঁ বা" হওয়ার পরিবর্তে একটি বর্ণালীতে পরিবর্তিত হয় না, সঠিক বা ভুল"»।

কগনিটিভ কম্পিউটিং-এর উপর আইবিএম যে জোর দিয়েছে তা হল, অন্তত আংশিকভাবে, স্ব-আগ্রহী, এটি একটি শক্তিশালী বিপণন যন্ত্রের একটি কগ যা কাসপারভের বিরুদ্ধে জয়ে সন্তুষ্ট ছিল না। আলফাগো, প্রকৃতপক্ষে, একটি পূর্বসূরী আছে বা, আপনি যদি চান, ডিপ ব্লু একটি উত্তরসূরী ছিল. একটি সুপারকম্পিউটার যেটি আরেকটি বাধা ভেঙ্গেছে, তাকে অন্য একটি শিকারের রিজার্ভ কেড়ে নিয়েছে, তাকে আরও নিশ্চিততা থেকে বঞ্চিত করেছে: এক কথায়, ওয়াটসন।

আমরা পরবর্তী পোস্টে ওয়াটসনের সাথে মোকাবিলা করব

মন্তব্য করুন