বাংলাদেশের ৪ জেলার ট্রাভেলার ডাটাসেটের গল্প : পর্ব ৩ (শেষ পর্ব )
Last updated
Last updated
এনালিটিক্স বের করার পরে কিছুক্ষন গ্রাফ এবং চার্টগুলো দেখছি। দারুন দারুন সব আউটপুট এবং ভিজুয়াল। কিন্তু মনের মাঝে একটা অস্বস্তি। কিন্তু একটা গরমিল আছে। জুলিয়াস এর সাথে কথা শুরু করলাম।
"এনালিটিক্স শেষ জুলিয়াস, তুমি কি কোনো concluding remarks দিতে চাও"?
"নাহ"
" সব কিছু ঠিক আছে কিন্তু কেন জানি মনে হচ্ছে কোথাও একটা গন্ডগোল"
"তুমি চাইলে- আমি আবার শুরু থেকে তোমাকে এনালিটিক্স বের করতে সাহায্য করতে পারি, কিভাবে আগাতে চাও বল?"
মনে মনে ভাবছি - এমনিতেই ৭ দিন টানা পরিশ্রম করে ক্যাগল নোটবুক তৈরী করলাম, এখন আবার ৭ দিন টানা কাজ করতে হবে ? যন্ত্রের ক্লান্তি না থাকতে পারে, আমি তো মানুষ।
বন্ধ করে দিলাম ল্যাপটপ। ডেস্ক এর উপরে রাখা নোটবুকের কাটাকাটি করা অনেকগুলো পেজ ছিল। সেগুলো দেখা শুরু করলাম। AI মডেলগুলো কোডিং এসিস্টেন্স হিসেবে আউটস্ট্যান্ডিং। বেশ কতগুলো ক্যাগল নোটবুক তৈরির পরে, এবং এক-ই সাথে ১০-১৫টি AI মডেলগুলোর কোডিং আউটপুট দেখে এই কথা বললাম। ভুল হয়,কিন্তু সেই ভুলকে সহজেই আইডেন্টিফাই করা যায়। পাশাপাশি আমার মতো কেউ যদি বকলম হয়েও শুরু করে- দিন শেষ কিছু না কিছু AI মডেলগুলো শিখিয়েই ছাড়বে।
কি নিয়ে অস্বস্তি সেই - কারণটা বলি। আজকে ট্রাভেলার ডাটাসেটের পর্ব ৩ এবং এক-ই সাথে সবশেষ পর্ব। এই পর্বে এনালিটিক্স এর একটা পর্যায়ে দেখতে চাইলাম- খাগড়াছড়ি অঞ্চলের টপ ৫ টি হোটেল/রিসোর্ট এর লিস্ট ভাড়ার এমাউন্ট অনুযায়ী। পাশাপাশি সবচেয়ে কম ভাড়া কোনগুলোর সেটিও দেখতে চাইলাম। চোখ কপালে উঠলো।
যেই হোটেল/রিসোর্ট গুলো "ভাড়া বেশি"র লিস্টে প্রথম ৫টির ভিতরে ছিল, এখন দেখি তার অনেকগুলোই সবচেয়ে "কম ভাড়া" - লিস্টেও চলে আসছে। কেন এরকম হলো ? তাহলে কি এনালিটিক্স ভুল হচ্ছে ?
এর উত্তর দিবো তার আগে চলুন দেখে নেই আগের দুই পর্ব এবং এই তৃতীয় পর্বে কোন কোন প্রশ্নের উত্তর আমি বের করেছি এবং এই পর্বে কোন কোন প্রশ্নের উত্তর ডাটাসেটের কাছে জানতে চেয়েছি।
যেই প্রশ্নগুলোর উত্তর প্রথম দুই পর্বে দিয়েছি দিয়েছি সেগুলো হচ্ছে (খাগড়াছড়ি, রাঙামাটি, বান্দরবান এবং সিলেট এই ৪ জেলার মধ্যে ডাটাসেট অনুযায়ী )
প্রথম পর্বে যেই প্রশ্নের উত্তরগুলো নিয়ে কাজ করেছি :
বেশি ঘুরতে যাওয়া জেলাগুলোর একটি তুলনা
এই চার জেলায় ঘুরতে যাওয়ার জন্য জনপ্রিয় ট্রান্সপোর্ট
গড় ট্রাভেলিং এর সময় (বাস, ট্রেন, এয়ার, একাধিক মাদ্ধমে)
ট্রাভেলিং এর সময় এবং ট্রান্সপোর্টের সম্পর্ক (বর্ষার সময় আপনি কি ট্রেন দিয়ে বেশি যান নাকি বাসে যান )
সিজন ও ট্রান্সপোর্ট ব্যবহারের ধরন
দ্বিতীয় পর্বে যেই প্রশ্নের উত্তরগুলো নিয়ে কাজ করেছি :
তৃতীয় এবং শেষ পর্বে যেই প্রশ্নের উত্তরগুলো নিয়ে কাজ করেছি :
❓ কোন জেলা সবচেয়ে কম খরচে ভ্রমণের অভিজ্ঞতা দেয় প্রতিদিনের ন্যূনতম খরচের ভিত্তিতে?
❓ কোন ঋতুতে প্রতিদিনের ন্যূনতম খরচ সবচেয়ে বেশি বা সবচেয়ে কম?
❓ টপ ১০টি টুরিস্ট স্পট যা ঘুরতে মিনিমাম খরচ সবচেয়ে বেশি হতে পারে (বেশি থেকে কম )
❓ টপ ১০টি টুরিস্ট স্পট যা ঘুরতে মিনিমাম খরচ কম হতে পারে(কম থেকে বেশি)
❓ সিলেট, বান্দরবান ,খাগড়াছড়ি, বান্দরবান এই অঞ্চলগুলোতে ডাটাসেট অনুযায়ী - যেই হোটেল/ রিসোর্টগুলোর নাম বেশি বার ডাটাসেট এসেছে এবং তাদের প্রতিদিনের সবচেয়ে বেশি এবং সবচেয়ে কম ভাড়ার তুলনা
❓ সিলেট, বান্দরবান ,খাগড়াছড়ি, বান্দরবান এই অঞ্চলগুলোর মাঝে কোন ধরণের আদিবাসী লোকদের মূলত দেখা মেলে ?
❓ সিলেট, বান্দরবান ,খাগড়াছড়ি, বান্দরবান এই অঞ্চলগুলোর মাঝে কোন ধরণের ট্রেডিশনাল খাবার এবং আদিবাসীদের পোশাকের চল রয়েছে যা কিনা তাদের কালচারাল হেরিটেজের অংশ
ছবি তে এবারের এনালিটিক্স এর বিস্তারিত দেওয়া আছে। এবার আসি লেখা যেটা নিয়ে শুরু করেছিলাম সেই প্রসঙ্গ।
অস্বস্তি দূর করতে ফোন দিলাম সেই হোটেলে যার নাম দুই জায়গাতেই চলে এসেছে।
"অক্টোবর মাসের প্রথম দিকে - ৩ দিনের জন্য একটা ফ্যামিলি ট্যুর এর জন্য আপনাদের এখানে আসবো, রুমের ভাড়া কিরকম পড়বে"?
" প্রতিদিন ৫০০০"
"সিজন তো নভেম্বর থেকে ,এতো ভাড়া চাচ্ছেন কেন ?"
"স্যার প্রথমত উইকেন্ড। অক্টবোরে শেষের দিকে ওয়ার্কিং ডে তে রুম দেওয়া যাবে, এর আগে সব বুকড। সেম রুম জুলাই অগাস্টে আসলে ২০০০ টাকা রাখতে পারতাম"
বুঝলাম এনালিটিক্স এ কেন - সেম হোটেলের ভাড়া, যা কিনা সবচেয়ে লোয়েস্ট রেন্ট দেখাচ্ছিল, আবার ওই একই হোটেল সবচেয়ে হায়েস্ট রেন্ট হয়ে গেলো। অন্য সব প্রোডাক্ট এর মতোই ডিমান্ড বাড়লে দাম বাড়বে - এই সাধারণ সূত্রই এনালিটিক্স এর এই আউটপুটের জন্য দায়ী। সুতরাং এখানে সবচেয়ে বেশিবার যেই হোটেল/রিসোর্টের নাম এসেছে সেই তথ্য এবং হোটেলের হায়েস্ট এবং লোয়েস্ট রুম রেন্ট দেখাতে পারলে - একজন ট্রাভেলার জন্য কাজটি সহজ হয়ে যায়
( সে চাইলে তখন রুম রেন্ট নিয়ে দামাদামীও করতে পারে , হিহি 😏😏 )
ডাটা নিয়ে কাজ করার ক্ষেত্রে শুধু মাত্র আউটপুট, গ্রাফ চার্ট দেখেই সিদ্ধান্ত নিয়ে বসবেন না। ব্যাকগ্রাউন্ড বা কনটেক্সট টা জানা অনেক বেশি গুরুত্বপূর্ণ। কোডিং ঠিক আছে , কোডিং এর জন্য মোটামুটি এডভান্স মডেলের LLM- সেটিও ঠিক বলছে, কনটেক্সট এ ভুল থাকার কারণে, এনালিটিক্স এর ইন্টারপ্রিটেশন বা ব্যাখ্যা চেঞ্জ হয়ে যেতে পারে। সুতরাং আমরা যারা ডাটা নিয়ে কাজ করি, তাদের জন্য কনটেক্সট বা ব্যাকগ্রাউন্ড জানাটা অনেক বেশি প্রয়োজন।
হা, এখানেই মানুষের জাজমেন্ট কাজে লাগে - যা যন্ত্রের নেই। AI মডেলগুলোর এডভান্সমেন্ট- ই বলে দিবে - সামনে মানুষের জন্য কি অপেক্ষা করছে।
কোনো ভুল হলে ধরিয়ে দেবেন , লেখা ভালো লাগলে জানাবেন।
প্রথম পর্ব
দ্বিতীয় পর্ব :
তৃতীয় এবং শেষ পর্ব
জনপ্রিয় ট্রাভেলিং স্পট
ট্রাভেলারদের পছন্দের খাবার
ট্রাভেলিং সময় এবং খরচের প্রভাব
জেলাভিত্তিক গড় ট্রাভেল সময়
জেলাগুলোর ভিতরে , মূল পর্যটন স্থানগুলোর ছাড়াও ট্রাভেলার/টুরিস্ট রা আরো কোন স্থানগুলোতে বেশি ঘুরতে যায় ?
জনপ্রিয় রিসোর্ট, হোটেল এবং রেস্টুরেন্টের তালিকা