09/03/2024
“এই যে চ্যাটজিপিটিকে নিয়ে লোকে এত লাফাচ্ছে, এর ভ্যালুটা কী? আমাদের ডেইলি লাইফে এই চ্যাটজিপিটির কী কন্ট্রিবিউশন আছে? লোকে চ্যাটজিপিটিকে দিয়ে কবিতা লেখাচ্ছে, গান লেখাচ্ছে, নয়ত চুটকি বলাচ্ছে। মানে পাতি খিল্লি করার জন্য ইউজ করছে। এদিকে শুনছি এআই নাকি পৃথিবীর ভবিষ্যৎ। তা এই চ্যাটজিপিটির মধ্যে লোকে কোন বালের ভবিষ্যতটা দেখছে পাচ্ছে সেটা তো বস আমি বুঝতে পারছি না।” চানাচুর খেতে খেতে বললাম আমি।
“এই নিয়ে একটু ঘাঁটাঘাঁটি করলেই বুঝতে পারবি জিনিসটা কতটা রিভোলিউশনারি।” পেগে একটা চুমুক মেরে নান্টুদা বলল।
নান্টুদার অফিসে একটা প্রোজেক্টের গো-লাইভ ছিল কাল। শুক্রবার থেকে শনিবার রাত পর্যন্ত নান্টুদা তার টিমের সাথে রাউন্ড-দ্য-ক্লক কাজ করেছে। শনিবার ভোররাতের দিকে সব ঠিকঠাক ভাবে ডেলিভার হয়েছে। নান্টুদা তাই আজ খুব খুশি। তার উপর টানা দু’দিন দু’রাত কাজ করে বেশ ক্লান্ত ও। তাই আজ রবিবারের সন্ধ্যেতে একটা দাড়ুপার্টি হওয়ারই ছিল, এবং সেটাই এখন হচ্ছে।
লোক বেশি নয়। আমি, নান্টুদা, স্যান্ডি আর পুকাই। দাড়ু এবং চাটের পয়সা, বলা বাহুল্য, নান্টুদাই দিচ্ছে। আমরা শুধু সিগারেট নিয়ে এসেছি কয়েক প্যাকেট। বসন্তের সন্ধ্যেতে পুকাইদের ছাদে পার্টি বেশ ভালোই জমে উঠেছে।
ছোলামাখার চাট খেতে খেতে চ্যাটজিপিটির কথা উঠল। চ্যাটজিপিটি নিয়ে আজকাল খুব হইচই হচ্ছে। কী একটা এআই, মানে আর্টিফিশিয়াল ইন্টেলিজেন্স নাকি বানানো হয়েছে, যা একদম মানুষের মত কথা বলতে, থুড়ি লিখতে পারে। যেকোন নতুন জিনিস তাকে দিয়ে লিখিয়ে নেওয়া যায়, যেমন একটা গান, কিংবা একটা গল্প, কিংবা একটা কবিতা। ব্যাপারটা এমন নয় যে, সে মাল ইন্টারনেট বা অন্য কোন ডিজিটাল সোর্স থেকে ঝেঁপে গানটা কিংবা গল্পটা লিখে দেয়। সে যেটা লেখে, সেটা হয় একদম ব্র্যান্ড নিউ, এমন নতুন কিছু যার কোন অস্তিত্ব আগে ছিল না।
চ্যাটজিপিটি যেমন লিখতে পারে, তেমনি আরও কিছু এআই আছে, যারা ছবি আঁকতে পারে, ভিডিও বানাতে পারে, কিংবা মিউজিক কম্পোজ করতে পারে। আপনাকে শুধু ইংরাজিতে লিখে দিতে হবে যে আপনি কী চান। ধরুন, আপনি লিখলেন- আমাকে একটা নদীর ছবি এঁকে দাও। সময়টা সূর্যাস্ত। নদীর পাড়ে এক যুবতী দাঁড়িয়ে কারও জন্য অপেক্ষা করছে। ব্যস, এইটুকু লিখে দিলেই হল। বাকি কাজটা কৃত্রিম বুদ্ধি নিজেই করে নেবে। লেখাটা অনুধাবণ করে বেশ সুন্দর একটা ছবি সে এঁকে দেবে স্ক্রিনে। একদম নতুন একটা ছবি। কোন শিল্পীর পুরোন আঁকা কিংবা তোলা ছবি থেকে কপি করা নয়, একদম এআই-এর নিজ হস্তে আঁকা।
এটা তাই মানতেই হবে যে, ব্যাপারটা বেশ ইন্টারেস্টিং। কিন্তু কথা হল, আমাদের প্রাত্যাহিক জীবনে এর গুরুত্ব কী? এআই দিয়ে কি মানুষের দৈনিন্দন জীবনকে আরও সুবিধাজনক বা উন্নত করা যেতে পারে? মদ খেতে খেতে সেটা নিয়েই আলোচনা হচ্ছিল।
“লেখার জন্য চ্যাটজিপিটি কিংবা আঁকার জন্য মিড-জার্নি, যেটাই বলিস না কেন, এদের সাথে আগেকার এআই-এর কিছু পার্থক্য আছে।” নান্টুদা বলল, “এতদিন পর্যন্ত যেসব এআই আমরা পেয়েছি, তাদের কাজ ছিল মূলত প্রেডিক্ট করা। যেমন ধর, ইমেজ রেকগনিশন। একটা বিড়ালের ছবি এআইকে দেখিয়ে সেটা কোন পশু, তা আইডেন্টিফাই করতে বলা হল। সে তখন ইনপুট ইমেজটাকে প্রসেস করে মেশিন লার্নিং-এর এলগোরিদম লাগিয়ে একটা আউটপুট জেনারেট করবে। সেই আউটপুট হবে এরকম- বিড়ালঃ ৯৮%, কুকুরঃ ৬০%, শিয়ালঃ ১০%। এই পার্সেন্টটেজগুলো হল কনফিডেন্স লেভেল। মানে এআই ৯৮% সিওর যে ছবিটা বিড়ালের, ৬০% সিওর যে ছবিটা কুকুরের, আর ১০% সিওর যে পশুটা শিয়ালও হতে পারে। এবার যেটার কনফিডেন্স লেভেল সবচেয়ে বেশি, ফাইনাল আউটপুটে সেটা আসবে। যেমন এক্ষেত্রে এআই বলবে, পশুটা হল বিড়াল।”
“হ্যাঁ হ্যাঁ। এসব আমরা জানি। তুমি আগে বলেছিলে এগুলো। এটার উপরে আমার একটা লেখাও আছে ফেসবুকে। কিন্তু চ্যাটজিপিটি এদের থেকে কোথায় আলাদা, সেটা তো বলো।” আমি বললাম।
“চ্যাটজিপিটি, মিড-জার্নি, ডালি বা এই ধরনের যেসব এআই আছে, তাদের বলা হয় জেনারেটিভ এআই বা জেন এআই। মানে এরা নতুন কিছু জিনিস জেনারেট করতে পারে। এদের প্রিডেসিসর এআইরা ইনপুট ডেটা অ্যানালিসিস করে কিছু প্রেডিকশন বা ক্লাসিফিকেশন করতে পারত, কিন্তু নতুন কোন এনটিটি তৈরি করতে পারত না। ওপেনএআই এসে পুরো কনসেপ্টটাই পালটে দিল।”
“দাঁড়াও দাঁড়াও নান্টুদা।” স্যান্ডি কথার মাঝে বলে উঠল, “ওপেনএআই কী? এটা আবার কোথা থেকে এল?”
“আরে গান্ডু, ওপেনএআই হল কোম্পানিটার নাম, যারা চ্যাটজিপিটি বানিয়েছে। এলন মাস্কের নাম শুনেছিস তো? তারই কোম্পানি এটা।”
“ওও। মাস্ককাকুর কোম্পানি? তাই বলো।”
“এলন মাস্ক আর স্যাম অল্টম্যান হল ফাউন্ডার। শুনেছি পরে নাকি এলন মাস্ক বেরিয়ে এসেছিল। সে যাগগে, আসল কথায় আসি। এই ওপেনএআই কোম্পানির লক্ষ্য ছিল লার্জ ল্যাঙ্গুয়েজ মডেল তৈরি করা। লার্জ ল্যাঙ্গুয়েজ মডেলকে সংক্ষেপে বলে এলএলএম। এবার সিওর জিজ্ঞাসা করবি, এলএলএম কী? এলএলএম হল একধরণের ডিপ-লার্নিং মডেল, যা কিনা প্রচুর টেক্সট দিয়ে ট্রেইন করা হয়। প্রচুর টেক্সট মানে প্রচুর টেক্সট- পুরো ইন্টারনেটে যত টেক্সট আছে- সে উইকিপেজ হোক কিংবা খবরের পোর্টাল হোক, কিংবা ব্লগ কিংবা ইংরাজী ভাষার সমস্ত ই-বুক- সব মিলিয়ে যত বিলিয়ন ট্রিলিয়ন জিবি টেক্সট আছে, সেই সমস্ত টেক্সট দিয়ে ট্রেইন করানো হয়। এর কাজ হল একটা শব্দ বা একটা বাক্যাংশের পরে কোন শব্দ হতে পারে, সেটাকে প্রেডিক্ট করে লিখে দেওয়া। ধর, কেউ লিখল- Sherlock Holmes is a…। এবার এলএলএম এই ইনপুট টেক্সটটা নিয়ে ভাবনাচিন্তা করবে। প্রথমেই যেটা করবে, সেটা হল লেখাটা থেকে কিছু কীওয়ার্ড বের করে আনার চেষ্টা। এই পুকাই, বলত এই লেখাটার মধ্যে কী কী কীওয়ার্ড আছে?”
“লেখাটা কী ছিল জানি, ভুলে গেলাম। আর একবার বলো সেনটেন্সটা।” পুকাই বলল।
“Sherlock Holmes is a…”
পুকাই ক্ষাণিকক্ষণ চিন্তা করল। তারপর বলল, “আমি তো একটাই কীওয়ার্ড পাচ্ছি- শার্লক হোমস।”
“গুড। হ্যাঁ, এই টেক্সটে একটাই কীওয়ার্ড আছে। কিন্তু বড় টেক্সট হলে সেখানে মাল্টিপল কীওয়ার্ড থাকতে পারে। এই কীওয়ার্ড বের করার জন্য আবার আলাদা লজিক আছে। যাই হোক, এবার এলএলএম কীওয়ার্ডটাকে তার ট্রেইনিং ডেটাসেটের মধ্যে সার্চ করবে আর কিছু রেলিভ্যান্ট ডেটা বের করে আনবে। তারপর এনএলপি আর ডিপ-লার্নিং এলগো এপ্লাই করে ওই ইনকমপ্লিট সেনটেন্সকে পূর্ণ করার জন্য কী কী শব্দ হতে পারে সেটা প্রেডিক্ট করবে, তারপর সেটাকে হিউম্যান ল্যাঙ্গুয়েজের মত সাজিয়ে ইউজারকে প্রেজেন্ট করবে। এক্ষেত্রে ইউজার হয়ত এরকম একটা আউটপুট দেখতে পাবে- Sherlock Holmes is a famous functional detective character created by Arthur Conan Doyle; কিন্তু আউটপুট যে সবসময় একই হবে এমন নয়, তবে কনটেক্সট মোটামুটি একই থাকবে।”
“আচ্ছা। এবার বুঝলাম আমরা চ্যাটজিপিটিকে কিছু একটা কনটেক্সট দিয়ে দিলে, বাকি গল্পটা সে কীভাবে নিজে থেকেই লিখে দেয়।” স্যান্ডি মাথা নাড়িয়ে বলল।
“হ্যাঁ। মূল কনসেপ্ট এটাই। তবে আসল কাজটা এত সহজ নয়, যতটা সহজ করে আমি বললাম। এর মধ্যে মাল্টিপল লেয়ারস অফ ডেটা সায়েন্স আর কম্পিউটেশনাল ইঞ্জিনিয়ারিং আছে। যেমন- ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং, মেশিং-লার্নিং, নিউরাল নেটওয়ার্কিং, ফাইন টিউনিং, পারফরমেন্স টিউনিং- এরকম অনেক কিছু। কিন্তু অত কিছু তোদের জেনে লাভ নেই। কারণ, এসব বলতে গিয়ে আমি চমচমের প্রশ্ন থেকে দূরে সরে যাচ্ছি।”
সবার গ্লাস খালি হয়ে গেছিল। স্যান্ডি বারটেন্ডারের কাজ করছে। ও চারটে গ্লাসে সিক্সটি এমএল করে মাল ভরে পরিমান মত সোডা মিশিয়ে দিল।
নান্টুদা নিজের গ্লাসটা টেনে নিয়ে একটা সিগারেট ধরিয়ে বলল, “চমচমের প্রশ্ন ছিল- চ্যাটজিপিটি আমাদের ডেইলি লাইফে কোন কাজে লাগে।” এই বলে নান্টুদা কী যেন ভাবল। তারপর বলল, “দেখ, ডেইলি লাইফে এই চ্যাটবটের হ্যাভক কোন ব্যবহার নেই, সেটা আমি মানি। এই একটু ইমেইল বা সিভি লিখে দেওয়া, কিংবা একটা কোড লিখে দেওয়া- এর বাইরে মানুষ পার্সোনাল কাজে কীভাবে চ্যাটপজিপিটি ইউজ করে আমার জানা নেই। তবে, বিজনেস, বুঝলি, বিজনেসের কাজে কিন্তু এর হেভি দাম আছে।”
“বিজনেস বলতে কীরকম বিজনেসের কথা বলছ?” আমি জিজ্ঞাসা করলাম।
নান্টুদা সুরুৎ করে একটা সিপ মেরে বলল, “উইকেন্ডে যে প্রোজেক্টটার ডেলিভারি দিলাম, সেটা তো এই জেনারেটিভ এআই-এর উপরেই। আমাদের ক্লায়েন্টের দু-তিনটে এমন রিকোয়ারমেন্ট ছিল, যেগুলো জেনএআই ছাড়া বানানো সম্ভব ছিল না। আমরা ওপেনএআই ইউজ করে সেগুলো বানিয়ে দিলাম। ক্লায়েন্ট এখন হেব্বি খুশি। ওদেরও কাজ কমে গেল, এদিকে আমাদের কোম্পানিও দু’পয়সা কামিয়ে নিল।”
“তোমাদের ক্লায়েন্টের রিকোয়ারমেন্টগুলো কী ছিল?” প্রশ্ন এল স্যান্ডির থেকে।
“রিকোয়ারমেন্ট ছিল সব মিলিয়ে তিনটে। এক, সিন্থেসাইজিং অর্গানাইজেশনাল কমিউনকেশন। দুই, রেগুলেটরি ডকুমেন্ট অ্যানালিসিস। তিন, কাস্টমার ফিডব্যাক অ্যানালিসিস।” নান্টুদা বলল।
“বাপরে বাপ! কী সব স্যাটাভাঙা ইংলিশ! পাতি বাংলায় বলো তো বস।” পুকাই বলল।
“আরে ব্রো, নামগুলো ওরকম। ব্যাপার এমন কিছু চাপের না। দাঁড়া বুঝিয়ে বলি।” এই বলে সিগারেটে লম্বা টান দিয়ে নান্টুদা শুরু করল, “প্রথমটা হল এরকম- দেখ, একটা বড় কোম্পানিতে অনেক ডিপার্টমেন্ট থাকে। সেই সব ডিপার্টমেন্টে সারাদিন বিভিন্ন বিষয় নিয়ে আলোচনা হয়, মিটিং হয়। আর আজকের দিনে দাঁড়িয়ে বেশিরভাগ মিটিংই হয় অনলাইনে। জুম, কিংবা গুগুল মিট কিংবা মাইক্রোসফট টীমসে। এবার একটা মিটিং চলাকালীন সেখানে একজন থাকে, যার কাজ হল কোন কোন পয়েন্ট নিয়ে ডিসকাশন হচ্ছে, কার ঘাড়ে কোন কাজটা যাচ্ছে, কে কোন কাজ কতটা কমপ্লিট করেছে, কার কোন কাজ কতটা বাকি রয়েছে, কিংবা নেক্সট মিটিং-এ কী নিয়ে আলোচনা হবে, সেগুলো সব নোট করে রাখা, যাতে মিটিং শেষ হওয়ার পর সেগুলো মম হিসাবে সবাইকে পাঠানো যায়।”
“মম হিসাবে মানে? মম, ড্যাড আবার এর মধ্যে কীভাবে এল?” আমি অবাক হলাম।
“আরে বাল, মম মানে মা না। মম হল এখানে এম-ও-এম, মানে মিনিটস অফ মিটিং। মিটিং- এ যেসব মেইন্ট পয়েন্ট নিয়ে আলোচনা হয়, সেগুলোকে বলে মম। মিটিং শেষ হলে একটা ফর্মাল মম পাঠাতে হয় সব পার্টিসিপেন্টকে। সেখানে লেখা থাকে মিটিং-এ কী নিয়ে আলোচনা হল, কী সিদ্ধান্ত নেওয়া হল, কার ঘাড়ে কী অ্যাকশন আইটেম গেল, এইসব। এবার ভাব, আমাদের ক্লায়েন্টের মত একটা বড় অর্গানাইজেশনে সারাদিন কত-না-কত মিটিং হচ্ছে। সেই সব মিটিং-এর মম বানানো বিশাল চাপের ব্যাপার। প্রথম কথা, সব মিটিং-এ একজন করে ডেডিকেটেড লোক লাগবে, যে সবার কথা শুনে শুনে নোট করবে। আর সেই লোক যদি আলোচ্য বিষয় সম্বন্ধে ঠিকঠাকভাবে না জানে, তাহলে তার নোট নিতেও অসুবিধা হবে, এমন কী নোট ভুলভালও হয়ে যেতে পারে। তাছাড়া, এই মমগুলো সাধারণত মেইল করে পাঠানো হয়। কেউ যদি দু’সপ্তাহ বা দু’মাস আগের অ্যাকশন আইটেম খুঁজতে যায়, তাহলে তাকে গুচ্ছের পুরোন মেইল ঘাঁটাঘাঁটি করতে হবে। এমন কী, নিজের একটা ছোট্ট অ্যাকশন আইটেম জানার জন্য তাকে পুরো মেইলটা বসে বসে পড়তে হবে। সব মিলিয়ে সারাদিনের মধ্যে একটা বড় অংশ চলে যায় এই মম বানাতে, আর সেটাকে পড়ে কাজে লাগাতে। এর জন্য যতটা সময় আর এফোর্ট লাগে, ক্লায়েন্টের কাছে তা হল আনপ্রোডাক্টিভ, মানে ফালতু সময় নষ্ট যাকে বলে। ক্লায়েন্ট চেয়েছিল এই পুরো প্রসেসটাকে ইন্টেলিজেন্টলি হ্যান্ডেল করতে। তখন তারা কনসাল্টেন্সির জন্য আমাদের কোম্পানিকে এপ্রোচ করল।”
একটানা এতটা বলে নান্টুদার গলা মনে হয় শুকিয়ে গেছিল। তাই একটু গলা ভিজিয়ে আবার শুরু করল, “আমরা তখন ক্লায়েন্টে সামনে নিয়ে এলাম জেনএআই সলিউশন। দেখ, এই অনলাইন মিটিংগুলো যে প্ল্যাটফর্মে হয়, যেমন জুম কিংবা টিমস, সেগুলোর একটা ফিচার আছে। মিটিং শেষ হয়ে যাওয়ার পর এরা ট্রান্সক্রিপ্ট তৈরি করতে পারে। মিটিং-এ সবাই কথা বলার ফলে যে অডিও জেনারেট হয়, এই টুলগুলো সেই অডিওটাকে টেক্সটে কনভার্ট করে দিতে পারে। এটা কিন্তু এআই দিয়েই করা হয়। সেই টেক্সট ফাইলে লেখা থাকে কোন লোক কোন সময়ে কী কথা বলল।
তো, এবার আমরা করলাম কী, ওই টেক্সট ফাইলের কনটেন্টটা ওপেনআইকে দিয়ে বললাম- এটা একটা অর্গানাইজেশনাল মিটিং-এর ট্রান্সক্রিপ্ট। তুমি এই লেখাটা পড়ে আমাকে একটা সামারি করে দাও। এই যে ওপেনএআইকে কী করতে হবে তার ইন্ট্রাকশন দিলাম, একে বলে প্রম্পটিং। প্রম্পট যত ভালো হবে, ওপেনএআই তত ভালো কাজ করবে। কোন কাজের জন্য কীরকম প্রম্পট হবে, সেটা নিয়ে আবার আলাদা কোর্স আছে। একে বলে প্রম্পট ইঞ্জিনিয়ারিং। যাই হোক, এইভাবে পারফেক্ট প্রম্পটিং করে ওই ট্রান্সক্রিপ্ট থেকে মিটিং নোটস, অ্যাকশন আইটেম, মোস্ট ডিসকাসড টপিকস, এইসব বের করে নিয়ে আসা হল। এমন কী আমরা একটা অ্যাপ বানিয়ে দিলাম যেখানে, কেউ চাইলে পুরোনো মিটিং-এর ট্রান্সক্রিপ্ট থেকে যে কোনও বিষয় জেনে নিতে পারবে কোয়েশ্চেন-অ্যানসার ফরম্যাটে। অর্গানাইজেশনে আগে যে কাজে দিনে ১৫-১৬ ঘন্টা সময় নষ্ট হত, সেই কাজ এখন হয়ে যাবে ৫-১০ মিনিটে। কতটা ইম্প্রুভমেন্ট ভাবতে পারছিস!”
“ওয়াও! আইডিয়াটা কিন্তু ব্যাপক গুরু। এবার নাম্বার টু’টা বলো।” পুকাই বেশ ইন্টারেস্ট পেয়ে গেছে মনে হল।
“নাম্বার টু হল পাতি ডকুমেন্ট সার্চ। বিষয়টা হল- একটা অর্গানাইজশনে প্রচুর ডিজিটাল ডকুমেন্ট থাকে, আর তাদের ভ্যারাইটিও প্রচুর। এই ধর, এইচআর ডিপার্টমেন্টে থাকে কোম্পানির পলিসি, মেডিক্যাল ইন্সুরেন্স পলিসি ইত্যাদি রিলেটেড ডকুমেন্ট। লিগ্যাল ডিপার্টমেন্টে থাকে বিভিন্ন রেগুলেটরি ডকুমেন্ট। এছাড়াও ফিনান্সিয়াল থেকে শুরু করে কাস্টমার সার্ভিস- সব ডিপার্টমেন্টের রয়েছে অসংখ্য ডকুমেন্ট। আবার এমনও হতে পারে যে, একটা টপিকের উপরেই হয়ত মাল্টিপল ডকুমেন্টস আছে। কখনও-সখনও ডকুমেন্ট চেঞ্জও হয়ে যায়। এবার ধর, আমি একজন এমপ্লয়ি যার কোম্পানির মেডিক্যাল পলিসি সম্বন্ধে কয়েকটা প্রশ্ন আছে। এখন দেখা গেল, মেডিক্যাল পলিসির উপর কম করে পাঁচ ছ’টা ডকুমেন্ট আছে। আমাকে তাহলে একটা একটা করে ডকুমেন্ট খুলে কীওয়ার্ড সার্চ করে প্যারাগ্রাফ পড়ে বিষয়টা বুঝতে হবে। একটা ডকুমেন্ট থেকেই যে আমার প্রশ্নের পুরো উত্তর পেয়ে যাব, এমন নাও হতে পারে। হয়ত একটা ডকুমেন্টে কিছুটা পেলাম, বাকিটা অন্য ডকুমেন্টে। এইভাবে খুঁজে পাওয়া অংশগুলোকে মাথার মধ্যে জড়ো করে ভেবে আমাকে সঠিক উত্তরটা বের করে আনতে হবে। এবার দেখ, এই পুরো কাজটাই আমরা কীভাবে ওপেনএআই দিয়ে করিয়ে নেব। প্রথমে আমরা ডকুমেন্টগুলোর কন্টেন্টকে ভেক্টর এমবেডিং করে একটা ডেটাবেসে স্টোর করে রাখব। তারপর…”
এখানে নান্টুয়ার কথা থামিয়ে দিয়ে আমি জিজ্ঞাসা করলাম, “ভেক্টর না কী একটা বললে? সেটা কী?”
“ভেক্টর এমবেডিং। মানে আর কিছুই না, একটা টেক্সটের মধ্যে যে ইংরাজি শব্দগুলো আছে, তাদের একটা এন-ডায়মেনশনাল স্পেসে সংখ্যা দিয়ে রিপ্রেজেন্ট করা। ধর, “Old monk is the best rum in the world”- এই বাক্যটার এমবেডিং ভেক্টর হবে [০.২৬৫, ০.৩৪৬, ০.৮২১…]। তারপর ধর, “Chomochom loves old monk”- এর এমবেডিং হবে [০.১২৩, ০.৭৮৬, ০.৩৩২…]। আর ধর, “Today is very hot”- এর এমবেডিং হবে [০.৪৩২, ০.৭৬৫, ০.৯৯৯…]। এই রকম আর কী। এবার দেখা যাবে, ভেক্টর স্পেসে প্রথম দুটো ভেক্টর রয়েছে কাছাকাছি, কারণ এদের মধ্যে একটা মিল আছে। আর তিন নম্বরটা থাকবে এদের থেকে অনেক দূরে। এইভাবে সব ডকুমেন্টগুলোকে সংখ্যায় কনভার্ট করে ডেটাবেসে সেভ করে রাখা হবে। এবার কেউ যখন একটা প্রশ্ন করবে, সেই প্রশ্নটাকেও একইভাবে এমবেডিং করে নিতে হবে প্রথমে। তারপর ডেটাবেসে খুঁজে দেখতে হবে ওই প্রশ্ন-ভেক্টরের সিমিলার কী কী ভেক্টর রয়েছে। এই সিমিলারিটি বের করার জন্য বিভিন্ন মেথড আছে। আমরা কোসাইন সিমিলারিটি ইউজ করেছিলাম। এই মেথডে দুটো ভেক্টরের অন্তর্বতী কোণের কোসাইনের ভ্যালু বের করা হয়। এই ভ্যালু ১-এর যত কাছাকাছি হবে, ভেক্টর দুটো তত বেশি সিমিলার হবে। কোসাইন সিমিলারিটি এপ্লাই করে আমরা প্রশ্ন-ভেক্টরের সবচেয়ে কাছাকাছি প্রথম ৫টা ভেক্টর বের করে আনি। এরপর এই ৫টা এমবেডিং-কে ডিকোড করে অরিজিনাল টেক্সটে কনভার্ট করে নেওয়া হয়। এইভাবে, যে প্রশ্নটা করা হয়েছিল, তার সবচেয়ে কাছাকাছি ৫টা উত্তর আমরা সার্চ রেজাল্টে নিয়ে আসি। এবার পুরো সার্চ রেজাল্টটা ওপেনএআইকে দিয়ে বলে দেওয়া হয় যে, এটা হল কন্টেক্সট। এর সাথে অবশ্য প্রশ্নটাও ওপেনএআইকে পাস করতে হয়, আর ইন্ট্রাক্টশন দেওয়া হয় ইনপুট কন্টেক্সট থেকে প্রশ্নটার উত্তর জেনারেট করতে। ওপেনএআই সুন্দর করে সেই সার্চ রেজাল্ট সামারাইজ করে অ্যানসার জেনারেট করে ইজারকে দেখিয়ে দেয়।”
“একটা জিনিস ঠিক পরিষ্কার হল না।” আমি বললাম, “ডকুমেন্টগুলোকে সরাসরি ওপেনএআইকে না দিয়ে প্রথমে ভেক্টর-ফেক্টর করার কী দরকার? একসাথে পুরো কন্টেন্ট আর কোয়েশ্চেন ওপেনএআইকে দিয়ে দিলে সেখান থেকে সে অ্যানসার জেনারেট করতে পারত না?”
“গুড কোয়েশ্চেন চমচম। আসলে ওপেনএআই-এর ইনপুট টেক্সটের একটা লিমিট আছে। তাছাড়া ইনপুটে যত বেশি শব্দ থাকে, ওপেনএআই তত বেশি পয়সা চার্জ করে। তাই পুরো ডকুমেন্ট ওপেনএআইকে দেওয়া যায় না। ইউজার যে প্রশ্নটা করে, তার রেলিভ্যান্ট অংশটুকুই শুধু ওপেনএআইকে পাঠানো হয়। এতে পয়সাও বাঁচে, আর প্রসেসিং টাইমও কম লাগে।”
রাত হয়ে আসছে। এবার আসর গোটাতে হবে। বোতল প্রায় খালি। আমাদের শেষ রাউন্ড চলছে। নান্টুদার পেগ শেষ হওয়ার আগেই ওর থেকে তিন নম্বর রিকোয়ারমেন্টটা জেনে নিতে হবে। কারণ, মাল শেষ হয়ে গেলেই ও সোজা কেটে পড়বে।
আমি তাই ঝটপট জিজ্ঞাসা করলাম, “আর তিন নম্বরটা?”
“তিন নম্বরটা হল- কাস্টমার ফিডব্যাক অ্যানালিসিস করে কোম্পানির কোন কোন এরিয়াতে ইম্প্রুভ করা উচিৎ, সেগুলো খুঁজে বের করা। যে কোনও ভালো কোম্পানিই কাস্টমার সার্ভিসের উপর খুব জোর দেয়। কাস্টমারের রিভিউ থেকে তারা বোঝার চেষ্টা করে কোম্পানির কোন জিনিসগুলো কাস্টমারের ভালো লাগছে, আর কোনগুলো খারাপ। সুনাম আর প্রফিট বাড়ানোর করার জন্য কোম্পানিকে কোথায় বেশি ফোকাস করতে হবে। এখন কথা হল, বছরের ৩৬৫ দিনের মধ্যে প্রত্যেকদিন এরকম শ’য়ে শ’য়ে ফিডব্যাক জমা পড়ছে। আর সেগুলো আসছে আনস্ট্রাক্টচার্ড ফরম্যাটে, মানে পাতি ইংরাজি প্যারাগ্রাফে, ঠিক যেমন ই-কমার্স সাইটে প্রোডাক্ট রিভিউ কিংবা মুভি রিভিউ লেখা থাকে। এবার তুই বল, কোনও লোকের পক্ষে রোজ রোজ সেই গুচ্ছের লেখা পড়ে স্কোপ অফ ইম্প্রুভমেন্ট খুঁজে বের করা সম্ভব? এইখানেই আসে ওপেনএআই-এর খেল। এক একটা কাস্টমার ফিডব্যাক ধরে ধরে ওপেনএআইকে দিয়ে দাও, আর সে ওই ফিডব্যাক থেকে কাস্টমারের স্যাটিসফেকশন আর ডিসস্যাটিসফেকশন বের করে ইউজারকে দিয়ে দেবে এক নিমিষে। আবার একসাথে এক’শ বা দু’শো ফিডব্যাক ইনপুট দিয়ে সেখান থেকে টপ ফাইভ পজেটিভ এবং নেগেটিভ অ্যাসপেক্ট বের করা যেতে পারে। এবার সেই অ্যাসপেক্ট অ্যানালিসিস করে কোম্পানি যা পদক্ষেপ নেওয়ার, সেটা নেবে।”
“সত্যি নান্টুদা।” পুকাই বলল, “আমরা, সাধারণ মানুষরা ভাবছি, এসব আলবাল এআই দিয়ে কী কাজের কাজ হবে। কিন্তু তুমি এতক্ষণ যা বললে, তাতে দেখা যাচ্ছে, মানুষের কাজকে সহজ করতে বা কোম্পানির খরচ বাঁচাতে এআই-এর ধারেকাছে কিছু নেই। বাইরে থেকে আমরা হয়ত বুঝতে পারিনা, কিন্তু যারা এই ডোমেইনে কাজ করে, তারা জানে এআই কীভাবে প্রতি মূহুর্তে মানুষের জীবনকে সহজ করে তুলছে।”
“তা তো বটেই। তবে এআই যেমন মানুষের কাজ কমিয়ে দিচ্ছে, তেমনি বিভিন্ন কাজে মানুষের প্রয়োজনীয়তাও কমিয়ে দিচ্ছে। সেটা একটু হলেও ভয়ের। আগামী প্রজন্মের জন্য এআই কতটা উপকারী হবে আর কতটা মারাত্মক হবে, তা ভবিষ্যতই বলবে। তবে এগুলো হবেই। টেকনোলজিক্যাল গ্রোথ আটকানো যায় না। শুধু আমরা যেটা করতে পারি, সেটা হল নিজেকে টেকনিক্যালি আরও বেশি স্মার্ট করে তোলা যাতে এআই আমাদের মালিক নয়, বরং সহকারী হয়ে ওঠে।”
রাত প্রায় দ’শটা। আসর শেষ হয়ে এল। নেশাটা বেশ ভালোই ধরেছে। এবার টাল খেতে খেতে বাড়ি যেতে হবে। আর মাথার ভিতরে টাল খাবে এআই আর এআই…