বাংলাদেশের ৪ জেলার ট্রাভেলার ডাটাসেটের গল্প : পর্ব ২
আগের বারের পর্বে যেই প্রশ্নগুলোর উত্তর দিয়েছি সেগুলো হচ্ছে (খাগড়াছড়ি, রাঙামাটি, বান্দরবান এবং সিলেট এই ৪ জেলার মধ্যে ডাটাসেট অনুযায়ী )
বেশি ঘুরতে যাওয়া জেলাগুলোর একটি তুলনা
.এই চার জেলায় ঘুরতে যাওয়ার জন্য জনপ্রিয় ট্রান্সপোর্ট
গড় ট্রাভেলিং এর সময় (বাস, ট্রেন, এয়ার, একাধিক মাদ্ধমে)
ট্রাভেলিং এর সময় এবং ট্রান্সপোর্টের সম্পর্ক (বর্ষার সময় আপনি কি ট্রেন দিয়ে বেশি যান নাকি বাসে যান ) সিজন ও ট্রান্সপোর্ট ব্যবহারের ধরনজনপ্রিয় ট্রাভেলিং স্পট ট্রাভেলারদের পছন্দের খাবার
এবারের এনালিটিক্স ডাটাসেট থেকে যেই প্রশ্নগুলোর উত্তর দিতে চেষ্টা করবো সেগুলো হচ্ছে : (খাগড়াছড়ি, রাঙামাটি, বান্দরবান এবং সিলেট এই ৪ জেলার মধ্যে ডাটাসেট অনুযায়ী )
১. ট্রাভেলিং টাইম, কি একজন ট্রাভেলারের দৈনিক যে মিনিমাম খরচ হয় তাতে কোনো প্রভাব ফেলে? (ট্রাভেলিং সময় এবং খরচের প্রভাব)
২.ট্রাভেলিং এর সময়, গড়ে বেশি/কম সময় নেয় কোন জেলাগুলো ? (জেলাভিত্তিক গড় ট্রাভেল সময়)
৩. জেলাগুলোর ভিতরে , মূল পর্যটন স্থানগুলোর ছাড়াও ট্রাভেলার/টুরিস্ট রা আরো কোন স্থানগুলোতে বেশি ঘুরতে যায় ?
৪. প্রতি জেলায় টপ ৫টি রিসোর্ট/হোটেল এবং রেস্টুরেন্ট গুলো কী কী যা এই ডাটাসেট উল্লেখ করা হয়েছে? (জনপ্রিয় রিসোর্ট, হোটেল এবং রেস্টুরেন্টের তালিকা)
আচ্ছা এবার মিতু নামের একটা মেয়ের গল্প করি ।
মিতু ভালবাসত তার দাদুর বাগানে ফুল গাছ লাগাতে। একদিন দাদু তাকে একটি নতুন চ্যালেঞ্জ দিলেন - তাকে এমন একটি গাছ লাগাতে হবে যা সবসময় খুব সুন্দর এবং সতেজ ফুল দেবে। কিন্তু মিতু কিভাবে জানবে কোন গাছ, কিভাবে লাগালে এবং যত্ন করলে সেই গাছ থেকে ফুল ভালো আসবে?
স্টেপ ১ : মিতু একটা সিদ্ধান্ত নিলো। তার দাদুর বাগানের সব গাছ সম্পর্কে তথ্য লিখে রাখল - কোন গাছে কিরকম পানি দেওয়া হয়, কোনটি কতক্ষন রোদ পায়, কোন মাটিতে কোন গাছ ভাল বাড়ে, কি সার দিলে গাছে ভালো ফুল হয় ইত্যাদি। এরপর মিতু সব তথ্য একসাথে করলো । সে লক্ষ্য করল যে যে গাছগুলো বেশি রোদ পায় এবং নিয়মিত পানি দেওয়া হয়, সেগুলোতে সবসময় সুন্দর এবং সতেজ ফুল হয়।
স্টেপ ২: এবার মিতু একটি ছোট কম্পিউটার প্রোগ্রাম বানাল । এই প্রোগ্রামটি তার সংগৃহীত তথ্য ব্যবহার করে মিতু কে বলে দিতে লাগলো - কীভাবে কোন পরিস্থিতিতে কোন গাছে সবচেয়ে ভালো, সুন্দর এবং সতেজ ফুল হবে।মিতু এখন এই প্রোগ্রাম ব্যবহার করে নতুন গাছ লাগানোর সিদ্ধান্ত নিল। প্রোগ্রামটি তাকে বলল কোথায় গাছ লাগাতে হবে, কতটা পানি দিতে হবে, ইত্যাদি।
লেখালিখির সুবাদে অনেকেই জানতে চান ডাটা এনালিটিক্স এর সাথে মেশিন লার্নিং এর কি যোগসূত্র। দুটো স্টেপ দেখুন তাহলেই ব্যাপারটি পরিষ্কার হয়ে যাবে
স্টেপ ১ : ডাটা এনালিটিক্স হল মিতুর তথ্য সংগ্রহ ও বিশ্লেষণ করা।
স্টেপ ২ : মিতুর বানানো সেই কম্পিউটার প্রোগ্রাম হলো মেশিন লার্নিং এর একটি মডেল - যা মিতুর সংগৃহীত তথ্য থেকে শিখে নতুন পরিস্থিতিতে মিতুকে সিদ্ধান্ত নিতে I mean কীভাবে কোন পরিস্থিতিতে কোন গাছে সবচেয়ে ভালো, সুন্দর এবং সতেজ ফুল হবে সাহায্য করে
সুতরাং বুঝতেই পারছেন মেশিন লার্নিং মডেল তৈরিতে সঠিক ডাটার ভিত্তিতে প্রশ্ন খুঁজে বের করে সঠিক -ডাটার এনালিটিক্স জরুরি।
অনেকেই আমার কাছে রোডম্যাপ চান কিভাবে ডাটা নিয়ে কাজ করবেন।
আমি রোডম্যাপ দিতে চাই না , যেভাবে আমি কাজ করি সেই সিক্রেট বলে দেই :
১. যে কোনো ডাটাসেট (ছোট হোক অথবা বড় ) নামিয়ে ফেলুন ক্যাগল থেকে।
২. একটি নোটবুক এবং পেন্সিল নিয়ে বসে যান। ডাটাসেট সামনে নিয়ে ধমাধম একটার পর একটা প্রশ্ন ছুড়তে থাকুন ডাটাসেটকে
৩. মোটামুটি ১০ টা প্রশ্ন হয়ে গেলে, সেখান থেকে বেছে নিন সবচেয়ে রিলেভেন্ট প্রশ্নগুলো
৪. দেখুন আপনার ডাটাসেট সেই প্রশ্নের উত্তর দেওয়ার জন্য স্মার্ট এনাফ কিনা
৫. চলে যান এনালাইসিস এ, আপনার প্রশ্ন আপনাকে ডিক্টেট করবে কি ধরণের এনালাইসিস আপনি করবেন
কোডিং আমার কখনোই ভালো লাগতো না (এখনো লাগে না ) কিন্তু মজার ব্যাপার হচ্ছে আমি AI মডেল দিয়ে ডাটা কে এনালাইসিস করতে গিয়ে ক্যাগল এর নোটবুকে কাজ করা শুরু করি। বিস্তারিত আমার গিটবুকে আছে। আগ্রহ থাকলে পড়ে আসতে পারেন।
যারা ট্রাডিশনাল ওয়ে তে ডাটা নিয়ে কাজ শিখছেন তাদের জ্ঞানের প্রতি পূর্ণ শ্রদ্ধা রেখে বলছি - এখন ডাটা এনালিটিক্স এর জন্য প্রচুর AI মডেল আছে, যে কোনো একটিকে বেছে নিয়ে কাজ শুরু করতে পারেন। এই মডেলগুলো এক একটি বিশেষ বিশেষ কাজের জন্য specialized, বেছে নিন এমন একটি মডেল যার computational accuracy বেঞ্চমার্কে সব থেকে উপরে।
এখানকার জামানায় ফেসবুক, ইন্সটা থেকে ক্যাগল এর প্রোফাইল অনেক বেশি দরকার। আজকের পর্যন্ত যদি একটাও ডাটাসেট নিয়ে কাজ শুরু না করে থাকেন, সময় এখনই ক্যাগলে প্রোফাইল খুলুন এবং ক্র্যাক করে ফেলুন একটি ডাটাসেট।
নিচের ক্যাগল নোটবুকে দেওয়া আছে বিস্তারিত
Last updated