Binary Prediction of Poisonous Mushrooms ডাটাসেট-১১
Last updated
Last updated
শুরুতেই অনেক বড়ো একটা গ্যাপ এর জন্য দেশের পরিবর্তিত পরিস্থিতি, নেট না থাকার প্যারা, নিজের পেশাগত জীবন এবং সবচেয়ে গুরুত্বপূর্ণ যেটা সেটা হচ্ছে মনোযোগ না দিতে পারার কারণগুলো দায়ী। যারা আমার ডাটা নিয়ে কাজের লেখা গুলো পড়তেন তাদের প্রায় সবাই বিভিন্ন ইউনিভার্সিটির ছাত্র। তাই লেখার প্রথমেই যেই ভাইয়েরা আজকে আমাদের মাঝে আর নেই - তাদের রুহের মাগফিরাত কামনা করে ডাটা নিয়ে টুকটাক লেখা আবার শুরু করছি।যেহেতু অনেক দিন কাজের গ্যাপ তাই - একদম শুন্য থেকে মডেলকে ৯৭% একুরেসি করে তৈরী করা কিছুটা কঠিন ছিল। কিন্তু পেরেছি।
যদিও ক্যাগলে হাইয়েস্ট স্কোর ৯৮,তার পরেও ১ এর ব্যাবধানে আমার অবস্থান ১২৭৮ - ১৭৮৩ এর জনের ভিতরে। ভুল না, ঠিক পড়েছেন ব্যাবধান টা ১ নম্বর এর।প্রথমদিন মডেল ডেভেলপ করে সাবমিট করলাম - রেজাল্ট শূন্য। মাথায় হাত। ২ মাসের ব্যাবধানে এরকম ফেল্টুস মারবো ভাবি নাই। কারণ খুব সাধারণ - প্রাকটিস না থাকা। আপনি AI দিয়ে মডেল ডেভেলপ করেন কিংবা পাইথন এ কোডিং করে করেন - প্রাকটিস যদি আপনার না থাকে হোঁচট খাবেন ই। কিন্তু ধৈর্য হারালে চলবে না।মন খারাপ হলেও চেষ্টা করে গেলাম।
এবারের ডাটাসেটটি নিয়ে কাজ করতে গিয়ে যেই ব্যাপারগুলো শিখলাম সেটি হচ্ছে১. ডাটা ক্লিনিং খুব গুরুত্বপূর্ণ একটি ধাপ, কারণ ঠিক মতন ডাটা ক্লিনিং না করা গেলে যত ভালো কোড ই লেখেন না কেন ফলাফল শূন্য, তাই আমার এই মডেলের ৯৭% এ আসতে ডাটা ক্লিনিং এরপিছনে আমার টানা ৮ দিন সময় চলে গেছে২. ডাটাসেটের ওভারভিউ : কি নিয়ে এই ডাটাসেট ? মাশরুম কোনটা poisonous এবং কোনটা non poisonous- সেটি বের করে এই মেশিন লার্নিং মডেলের উদ্দেশ্য। ডাটার বিস্তারিত দেওয়া আছে এখানে : https://www.kaggle.com/compet.../playground-series-s4e8/data
মাসনুন আহমেদ