বাংলাদেশের ৪ জেলার ট্রাভেলার ডাটাসেট এনালাইসিস : পর্ব ১

রাস্তা দিয়ে যখন একটি লেটেস্ট মডেলের গাড়িকে আমরা চলে যেতে দেখি মনের অজান্তেই আমরা বলে উঠি - ঝাক্কাস ! একটু ভাবনা চিন্তা করে বলুন তো - এই প্রশংসা কি গাড়িটির একার প্রাপ্য , নাকি যিনি গাড়িটি এতো কষ্ট করে নিজের তিল তিল করানো জমানো টাকা দিয়ে কিনেছেন তারও কিছুটা প্রাপ্য ? কেন বললাম ? বলবো।

ডাটা নিয়ে কাজের ক্ষেত্রটা বিশাল। এই বিশাল জায়গায় আপনার দক্ষতা অনুযায়ী হয়ে উঠতে পারেন - একজন দক্ষ এনালিটিক্স এক্সপার্ট । কিন্তু সবাই কি এনালিটিক্স এর কাজ করবে ? নাহ।

ডাটা কে সাইজ (সাইজ মানে ইনসাইট বের করা, অন্যকিছু ভাইবেন না ) দিবেন কিভাবে যদি একটি ভালো ডাটাসেট -ই না থাকে ? তাহলে যিনি খাটাখাটনি করে একদম স্ক্র্যাচ থেকে ডাটা তৈরী করে আপনাকে দিলো - তিনি একজন ডাটাসেট এক্সপার্ট। ডাটা এনালিটিক্স এর হাজার হাজার লাইনের প্রোগ্রামিং ভালো লাগছে না - হয়ে যান ডাটা এক্সপার্ট। এরকম আরো অনেক দিক আছে ডাটা নিয়ে কাজ করার। সবাই এক কাজ করবে না , করতে পারবেও না - ভাবনা চিন্তা করে দেখুন আপনার ইন্টারেস্ট কোথায়, সেই অনুযায়ী সামনে আগান।

আমার প্রতিদিনের কাজের একটা বড় সময় কাটে ক্যাগল সহ আরো অন্নান্য প্লাটফর্ম এর ডাটাসেট দেখতে। আমি ডাটা নিয়ে কাজের থেকে সেই ডাটা আমার প্রশ্নের উত্তর দিতে পারছে কিনা - সেটাতেই বেশি ফোকাসড থাকি। ডাটাসেটের পার্সপেক্টিভ বুঝার চেষ্টা করি। এটি সবথেকে এবং সবসময়ের জন্য গুরুত্বপূর্ণ।

চলে আসি আজকের ডাটাসেট নিয়ে। সামনে ঘোরাঘুরির সিজন আসছে। ভাবলাম ট্রাভেল রিলাটেড একটি ডাটাসেট নিয়ে কাজ করি। ক্যাগলে খুঁজেও পেলাম। বাংলাদেশের উপরে ডাটাসেট। এই ডেটাসেটে বাংলাদেশের চারটি পার্বত্য অঞ্চল—খাগড়াছড়ি, রাঙামাটি, বান্দরবান এবং সিলেট—অন্তর্ভুক্ত করা হয়েছে। ক্যাগলে তো হাজার হাজার ডাটাসেট আছে। এই ডাটাসেটের ভিন্নতা কি জানেন ? ডাটাসেটের সাথে কোন প্রশ্নের উপর ভিত্তি করে ডাটা কালেক্ট করা হয়েছে - সেই প্রশ্ন ও দেওয়া আছে। দেখে ইন্টারেস্ট জাগলো। চিন্তা কিলবিল করে উঠলো। বুঝতে পারলাম এনালিটিক্স বের করার জন্য মন আনচান করে উঠছে।

আজকে তাহলে হাতে কলমে দেখাবো কিভাবে আমি ডাটা নিয়ে কাজ করি, এবং সবার বুঝার জন্য চেষ্টা করেছি ইনসাইট গুলো যেন বাংলায় হয়। চার্ট ইংলিশ এ হলেও ইনসাইট গুলো বাংলায় দেওয়া চেষ্টা করেছি।

ডাটা নিয়ে কাজ করার ক্ষেত্রে এখনো আমি বকলম, তাই ভুল হলে শুধরিয়ে দিবেন।

ডাটাসেটের একটি ছোট সামারি : ডেটা সংগ্রহ করা হয়েছে কমিউনিটি-ভিত্তিক ভ্রমণ ওয়েবসাইট, বিভিন্ন মানুষের সাথে অনলাইন এবং অফলাইন জরিপ, গুগল ম্যাপস এবং আরও অন্যান্য উৎস থেকে। এই ডেটাসেটে ৫০২ জন ব্যবহারকারীর কাছ থেকে পার্বত্য অঞ্চল সম্পর্কিত ৫০২টি রেকর্ড অন্তর্ভুক্ত করা হয়েছে, যার মধ্যে খাগড়াছড়ির জন্য ১৩০টি রেকর্ড, রাঙামাটির জন্য ১৪১টি রেকর্ড, বান্দরবানের জন্য ১০৩টি রেকর্ড এবং সিলেটের জন্য ১২৮টি রেকর্ড রয়েছে। ৫০২টি ডেটার জন্য মোট ১৫টি ভ্যারিয়েবল (ফিচার) বিবেচনা করা হয়েছে।¶ এই ফিচারগুলির মধ্যে রয়েছে ব্যবহারকারী আইডি, জেলা, যানবাহন, ভ্রমণের সময়কাল, গন্তব্যে পৌঁছানোর সময়, মৌসুম, পর্যটন স্থান, একই ধরনের স্থান, রিসোর্ট/হোটেল, রেস্টুরেন্ট, ঐতিহ্যবাহী খাবার, আদিবাসী গোষ্ঠী, ঐতিহ্যবাহী পোশাক, ঐতিহ্যবাহী পোশাকের দোকান এবং ন্যূনতম খরচ (প্রতি দিন)।

আজকের এনালিটিক্স পর্ব ১, এই পর্বে আমি উত্তর খুঁজেছি নিচের প্রশ্নগুলোর

১. ভ্রমণকারীরা কোন কোন জেলায় -খাগড়াছড়ি, রাঙামাটি, বান্দরবান এবং সিলেট এর মাঝে সবচেয়ে বেশি কোন জেলায় যেতে পছন্দ করেন ?

২. খাগড়াছড়ি, রাঙামাটি, বান্দরবান এবং সিলেট জেলায় ভ্রমণকারীদের মধ্যে সবচেয়ে বেশি মানুষ কোন ট্রান্সপোর্ট ইউজ করেন?

৩. যানবাহনের পছন্দ, গন্তব্যস্থলে পৌঁছানোর সময়কে কীভাবে প্রভাবিত করে? (কোন ট্রান্সপোর্ট ইউজের এভারেজ সময় কত )

৪. ভ্রমণের মৌসুম (শীতকাল, গরমকাল, বর্ষাকাল) এবং আপনার সিলেক্টেড ট্রান্সপোর্ট -মাধ্যমের মধ্যে কি কোনো সম্পর্ক রয়েছে? (বর্ষার সময় আপনি কি ট্রেন দিয়ে বেশি যান নাকি বাসে যান )

৫. কোন সিজনে কোন ধরণের ট্রান্সপোর্টের (বাস,ট্রেন, গাড়ি নাকি প্লেন ) ইউজ বেশি হয় ?

৬. কোন জেলায় (খাগড়াছড়ি, রাঙামাটি, বান্দরবান এবং সিলেট ) , কোন জায়গা গুলো টুরিস্ট বেশি ঘুরতে যান ?

৭. তাদের পছন্দের তালিকায় কোন খাবারটি বেশি থাকে ?

আমার প্রশ্নের উত্তরগুলো ছবিতে দেওয়া আছে।

লেখা শুরু করেছিলাম গাড়ির একটি প্রসঙ্গ দিয়ে। ভাবছেন এই ডাটাসেট আমাদের বাংলাদেশী কারো করা - ভুল। এই ডাটাসেটটি তৈরী করেছেন জোসেলিন ড্যামলও নামের একজন ক্যাগল কমুনিটির একজন । তিনি একই সাথে একজন : ডাটাসেট এবং নোটবুক মাস্টার । সুতরাং বুঝতেই পারছেন আপনার ইন্টারেস্ট আপনাকে বলে দিবে আপনি সামনে কি নিয়ে আগাবেন।

গতবারের লেখাটা ৩৫০ বারের মতো শেয়ারের পরে একটি কমন প্রশ্ন আমাকে শুনতে হয়েছে - ডাটা নিয়ে কাজের ক্ষেত্রে মোটা বেতনের চাকরি পাবার সম্ভাবনা কতটুকু। এর উত্তর - আমরা যেহেতু এখন aI এর যুগে চলে এসেছি তাই সামনের দিনগুলোতে কি হবে সেটি বলাটা টাফ। প্রতিনিয়ত এই ফিল্ড ট্রান্সফর্মড হচ্ছে। তাই আপনার শিখার সাথে AI এর application যেন থাকে সেটি দেখতে হবে। যদি একজনের Critical thinking and problem-solving, Domain expertise and context, Communication and storytelling, Creative skills- এই স্কিলগুলো খুব জরুরি। প্রকৃত ঝুঁকি হল সেই এক্সপার্টদের মাদ্ধমে যে কারো জব রিপ্লেস হওয়া , যারা তাদের বর্তমান নলেজ এবং এফিসিয়েন্সি বাড়ানোর জন্য দক্ষতার সাথে AI Tool কে কাজে লাগিয়ে সুপার স্কিল্ড হয়ে উঠছে। যে কোনো ফিল্ডে সুপার স্কিল্ড যে কারো চাকরি বা তার ব্যাবসা কে ডিফিট দেওয়া কঠিন কাজ। উদাহরণস্বরূপ বলা যায় আপনার যদি সুপার সেলস স্কিল থাকে, আপনি আপনার চাকরি বা ব্যাবসা কন্টিনিউ করেও যে কোনো কোম্পানির সেলস কনসালট্যান্ট হিসেবে কাজ করতে পারেন।

সুতরাং এখানে স্কিলটা জরুরি।

পুরোনো চারটি উপদেশ :

১. ডাটাসেট নিয়ে কাজ করতে হবে - সম্ভব হলে প্রতিদিন, আপনার ডাটা নিয়ে কাজের ৩০% থিওরি এবং ৭০% হাতে কলমে। (আমার ক্ষেত্রে ৯৯ ভাগই হাতে কলমে,বাকিটা থিওরি, সবার আমার মতো হবার দরকার নাই)

২. প্রব্লেম বা আপনি কি প্রশ্নের উত্তর খুঁজছেন সেটি - প্রথমে ঠিক ঠাক ভাবে আইডেন্টিফাই করতে হবে, আমার ডাটা নিয়ে কাজের অভিজ্ঞতা থেকে বলছি - প্রব্লেম বা প্রশ্ন খুঁজে বের করা, এনালাইসিস এর থেকেও শতগুন বেশি গুরুত্বপূর্ণ

৩. আপনার সাথে একজন বন্ধু লাগবে যে কিনা পাইথন বা আপনি যেই মাদ্ধমে শিখতে চান সেটার বস। বন্ধুর সাথে কথা বলতে আপনার জানতে হবে। আমার ক্ষেত্রে এই বন্ধুটি হচ্ছে যে কোনো শক্তিশালী ai মডেল , যাকে আপনি ভোর ৪টার সময় ডাক দিয়েও বলতে পারবেন - চল একটা গরমাগরম analysis করে ফেলি!

৪. আপনি যখন ক্লাস টেনে পড়তেন, কখনো কি নিজেকে নিজে প্রশ্ন করেছেন, এই স্কুল পার করে আপনার চাকরি হবে কি না ? করেন নাই। অন্ধভাবে পড়াশোনা করেছেন। ডাটা নিয়ে অন্ধভাবে শিখতে বলছি না। চোখ কান খোলা রেখেই শিখবেন, কিন্তু যা শিখবেন সেটি যেন সলিড হয়। মোটা বেতনের চাকরির নিশ্চয়তা এই শিখাটা হয়তো আপনাকে দিবে বা দিবে না, কিন্তু আপনার শিখা এবং চর্চা যেন বন্ধ না হয়। সেটি আপনি চাকরি অথবা ব্যাবসা যেই পেশায়-ই থাকুন না কেন।

লেটেস্ট মডেলের গাড়ি রাস্তায় দেখে তার প্রশংসা তো করবেন ই পাশাপাশি যিনি গাড়িটা এতো কষ্ট করে কিনেছেন

I mean- আমার করা ডাটার এনালিটিক্স দেখে পড়ে চলে যাবেন না, লেখা ভালো লাগলে জানাবেন, হিহি !

ক্যগলের নোটবুকের লিংক

Last updated