বাংলাদেশের ৪ জেলার ট্রাভেলার ডাটাসেটের গল্প : পর্ব ৩ (শেষ পর্ব )

এনালিটিক্স বের করার পরে কিছুক্ষন গ্রাফ এবং চার্টগুলো দেখছি। দারুন দারুন সব আউটপুট এবং ভিজুয়াল। কিন্তু মনের মাঝে একটা অস্বস্তি। কিন্তু একটা গরমিল আছে। জুলিয়াস এর সাথে কথা শুরু করলাম।

"এনালিটিক্স শেষ জুলিয়াস, তুমি কি কোনো concluding remarks দিতে চাও"?

"নাহ"

" সব কিছু ঠিক আছে কিন্তু কেন জানি মনে হচ্ছে কোথাও একটা গন্ডগোল"

"তুমি চাইলে- আমি আবার শুরু থেকে তোমাকে এনালিটিক্স বের করতে সাহায্য করতে পারি, কিভাবে আগাতে চাও বল?"

মনে মনে ভাবছি - এমনিতেই ৭ দিন টানা পরিশ্রম করে ক্যাগল নোটবুক তৈরী করলাম, এখন আবার ৭ দিন টানা কাজ করতে হবে ? যন্ত্রের ক্লান্তি না থাকতে পারে, আমি তো মানুষ।

বন্ধ করে দিলাম ল্যাপটপ। ডেস্ক এর উপরে রাখা নোটবুকের কাটাকাটি করা অনেকগুলো পেজ ছিল। সেগুলো দেখা শুরু করলাম। AI মডেলগুলো কোডিং এসিস্টেন্স হিসেবে আউটস্ট্যান্ডিং। বেশ কতগুলো ক্যাগল নোটবুক তৈরির পরে, এবং এক-ই সাথে ১০-১৫টি AI মডেলগুলোর কোডিং আউটপুট দেখে এই কথা বললাম। ভুল হয়,কিন্তু সেই ভুলকে সহজেই আইডেন্টিফাই করা যায়। পাশাপাশি আমার মতো কেউ যদি বকলম হয়েও শুরু করে- দিন শেষ কিছু না কিছু AI মডেলগুলো শিখিয়েই ছাড়বে।

কি নিয়ে অস্বস্তি সেই - কারণটা বলি। আজকে ট্রাভেলার ডাটাসেটের পর্ব ৩ এবং এক-ই সাথে সবশেষ পর্ব। এই পর্বে এনালিটিক্স এর একটা পর্যায়ে দেখতে চাইলাম- খাগড়াছড়ি অঞ্চলের টপ ৫ টি হোটেল/রিসোর্ট এর লিস্ট ভাড়ার এমাউন্ট অনুযায়ী। পাশাপাশি সবচেয়ে কম ভাড়া কোনগুলোর সেটিও দেখতে চাইলাম। চোখ কপালে উঠলো।

যেই হোটেল/রিসোর্ট গুলো "ভাড়া বেশি"র লিস্টে প্রথম ৫টির ভিতরে ছিল, এখন দেখি তার অনেকগুলোই সবচেয়ে "কম ভাড়া" - লিস্টেও চলে আসছে। কেন এরকম হলো ? তাহলে কি এনালিটিক্স ভুল হচ্ছে ?

এর উত্তর দিবো তার আগে চলুন দেখে নেই আগের দুই পর্ব এবং এই তৃতীয় পর্বে কোন কোন প্রশ্নের উত্তর আমি বের করেছি এবং এই পর্বে কোন কোন প্রশ্নের উত্তর ডাটাসেটের কাছে জানতে চেয়েছি।

যেই প্রশ্নগুলোর উত্তর প্রথম দুই পর্বে দিয়েছি দিয়েছি সেগুলো হচ্ছে (খাগড়াছড়ি, রাঙামাটি, বান্দরবান এবং সিলেট এই ৪ জেলার মধ্যে ডাটাসেট অনুযায়ী )

প্রথম পর্বে যেই প্রশ্নের উত্তরগুলো নিয়ে কাজ করেছি :

বেশি ঘুরতে যাওয়া জেলাগুলোর একটি তুলনা

এই চার জেলায় ঘুরতে যাওয়ার জন্য জনপ্রিয় ট্রান্সপোর্ট

গড় ট্রাভেলিং এর সময় (বাস, ট্রেন, এয়ার, একাধিক মাদ্ধমে)

ট্রাভেলিং এর সময় এবং ট্রান্সপোর্টের সম্পর্ক (বর্ষার সময় আপনি কি ট্রেন দিয়ে বেশি যান নাকি বাসে যান )

সিজন ও ট্রান্সপোর্ট ব্যবহারের ধরন

জনপ্রিয় ট্রাভেলিং স্পট

ট্রাভেলারদের পছন্দের খাবার

দ্বিতীয় পর্বে যেই প্রশ্নের উত্তরগুলো নিয়ে কাজ করেছি :

ট্রাভেলিং সময় এবং খরচের প্রভাব

জেলাভিত্তিক গড় ট্রাভেল সময়

জেলাগুলোর ভিতরে , মূল পর্যটন স্থানগুলোর ছাড়াও ট্রাভেলার/টুরিস্ট রা আরো কোন স্থানগুলোতে বেশি ঘুরতে যায় ?

জনপ্রিয় রিসোর্ট, হোটেল এবং রেস্টুরেন্টের তালিকা

তৃতীয় এবং শেষ পর্বে যেই প্রশ্নের উত্তরগুলো নিয়ে কাজ করেছি :

❓ কোন জেলা সবচেয়ে কম খরচে ভ্রমণের অভিজ্ঞতা দেয় প্রতিদিনের ন্যূনতম খরচের ভিত্তিতে?

❓ কোন ঋতুতে প্রতিদিনের ন্যূনতম খরচ সবচেয়ে বেশি বা সবচেয়ে কম?

❓ টপ ১০টি টুরিস্ট স্পট যা ঘুরতে মিনিমাম খরচ সবচেয়ে বেশি হতে পারে (বেশি থেকে কম )

❓ টপ ১০টি টুরিস্ট স্পট যা ঘুরতে মিনিমাম খরচ কম হতে পারে(কম থেকে বেশি)

❓ সিলেট, বান্দরবান ,খাগড়াছড়ি, বান্দরবান এই অঞ্চলগুলোতে ডাটাসেট অনুযায়ী - যেই হোটেল/ রিসোর্টগুলোর নাম বেশি বার ডাটাসেট এসেছে এবং তাদের প্রতিদিনের সবচেয়ে বেশি এবং সবচেয়ে কম ভাড়ার তুলনা

❓ সিলেট, বান্দরবান ,খাগড়াছড়ি, বান্দরবান এই অঞ্চলগুলোর মাঝে কোন ধরণের আদিবাসী লোকদের মূলত দেখা মেলে ?

❓ সিলেট, বান্দরবান ,খাগড়াছড়ি, বান্দরবান এই অঞ্চলগুলোর মাঝে কোন ধরণের ট্রেডিশনাল খাবার এবং আদিবাসীদের পোশাকের চল রয়েছে যা কিনা তাদের কালচারাল হেরিটেজের অংশ

ছবি তে এবারের এনালিটিক্স এর বিস্তারিত দেওয়া আছে। এবার আসি লেখা যেটা নিয়ে শুরু করেছিলাম সেই প্রসঙ্গ।

অস্বস্তি দূর করতে ফোন দিলাম সেই হোটেলে যার নাম দুই জায়গাতেই চলে এসেছে।

"অক্টোবর মাসের প্রথম দিকে - ৩ দিনের জন্য একটা ফ্যামিলি ট্যুর এর জন্য আপনাদের এখানে আসবো, রুমের ভাড়া কিরকম পড়বে"?

" প্রতিদিন ৫০০০"

"সিজন তো নভেম্বর থেকে ,এতো ভাড়া চাচ্ছেন কেন ?"

"স্যার প্রথমত উইকেন্ড। অক্টবোরে শেষের দিকে ওয়ার্কিং ডে তে রুম দেওয়া যাবে, এর আগে সব বুকড। সেম রুম জুলাই অগাস্টে আসলে ২০০০ টাকা রাখতে পারতাম"

বুঝলাম এনালিটিক্স এ কেন - সেম হোটেলের ভাড়া, যা কিনা সবচেয়ে লোয়েস্ট রেন্ট দেখাচ্ছিল, আবার ওই একই হোটেল সবচেয়ে হায়েস্ট রেন্ট হয়ে গেলো। অন্য সব প্রোডাক্ট এর মতোই ডিমান্ড বাড়লে দাম বাড়বে - এই সাধারণ সূত্রই এনালিটিক্স এর এই আউটপুটের জন্য দায়ী। সুতরাং এখানে সবচেয়ে বেশিবার যেই হোটেল/রিসোর্টের নাম এসেছে সেই তথ্য এবং হোটেলের হায়েস্ট এবং লোয়েস্ট রুম রেন্ট দেখাতে পারলে - একজন ট্রাভেলার জন্য কাজটি সহজ হয়ে যায়

( সে চাইলে তখন রুম রেন্ট নিয়ে দামাদামীও করতে পারে , হিহি 😏😏 )

ডাটা নিয়ে কাজ করার ক্ষেত্রে শুধু মাত্র আউটপুট, গ্রাফ চার্ট দেখেই সিদ্ধান্ত নিয়ে বসবেন না। ব্যাকগ্রাউন্ড বা কনটেক্সট টা জানা অনেক বেশি গুরুত্বপূর্ণ। কোডিং ঠিক আছে , কোডিং এর জন্য মোটামুটি এডভান্স মডেলের LLM- সেটিও ঠিক বলছে, কনটেক্সট এ ভুল থাকার কারণে, এনালিটিক্স এর ইন্টারপ্রিটেশন বা ব্যাখ্যা চেঞ্জ হয়ে যেতে পারে। সুতরাং আমরা যারা ডাটা নিয়ে কাজ করি, তাদের জন্য কনটেক্সট বা ব্যাকগ্রাউন্ড জানাটা অনেক বেশি প্রয়োজন।

হা, এখানেই মানুষের জাজমেন্ট কাজে লাগে - যা যন্ত্রের নেই। AI মডেলগুলোর এডভান্সমেন্ট- ই বলে দিবে - সামনে মানুষের জন্য কি অপেক্ষা করছে।

কোনো ভুল হলে ধরিয়ে দেবেন , লেখা ভালো লাগলে জানাবেন।

প্রথম পর্ব

দ্বিতীয় পর্ব :

তৃতীয় এবং শেষ পর্ব

Last updated