মোটু কাহিনী : মাল্টিক্লাস প্রেডিক্টর কম্পিটিশন - ৮
Last updated
Last updated
ধরুন আপনার কাছে এক বোল ভর্তি ফল আছে। আমি যদি আপনাকে বলি বোল থেকে আপেল আলাদা করে রাখতে, আপনি আপেল আরেকটি প্লেটে রাখবেন ।
এবার চিন্তা করুন একটি বোলে তিন রকমের ফল আছে -, আপেল, কলা,কমলা। আপনাকে যদি বলি ফলগুলো আলাদা করতে আপনি প্রতিটি ফলের কালার, সাইজ এবং অন্নান্য ফিচার্স গুলো দেখে, বোল থেকে কলার প্লেটে কলা, কমলার প্লেটে কমলা এবং আপেলের প্লেটে আপেলকে আলাদা করে রাখবেন।
সুতরাং আগের উদাহরণে আপনার কাছে দুটো অপশন ছিল, পরের উদাহরণে আপনার কাছে ২,৩ বা এর থেকেও বেশি অপশন থাকতে পারে। আপনাকে সঠিক ভাবে চিনে সেগুলোকে আলাদা করতে পারতে হবে।
দ্বিতীয় উদাহরণটি একটি মাল্টিক্লাস প্রেডিকশনের
আমাদের এই মাল্টিক্লাস মডেলে প্রেডিকশনে- ওবেসিটি এর ডাটার উপর ভিত্তি করে আমরা সেটি কোন ধরণের ওবেসিটি সেটিকে বার করবো এবং ঠিক ঠাক ভাবে প্রেডিক্ট করার চেষ্টা করবো।এটি আমার প্রথম মাল্টিক্লাস প্রেডিকশন এর মডেল বিল্ডিং এবং কম্পিটিশনে অংশগ্রহণ করা।।
ক্যাগল লিংক :
ডাটা হেডগুলো একটু দেখে পরিচিত হয়ে নেই , সাথে সাথে আমরা এটাও দেখব কিভাবে ডাটা হেলথকেয়ার এর ক্ষেত্রে কাজ করে
Frequent consumption of high caloric food (FAVC) = উচ্চ ক্যালোরি সম্পন্ন খাবার রেগুলার খাওয়া হয় কি না - যদি খেয়ে থাকেন হ্যা বলুন না খেয়ে থাকলে না বলুন
Frequency of consumption of vegetables (FCVC) = রেগুলার শাকসবজি খাওয়া হয় কি না - যদি খেয়ে থাকেন হ্যা বলুন না খেয়ে থাকলে না বলুন
Number of main meals (NCP ) = আপনার main meal এর সংখ্যা একদিনে কত বার - (সোজা কোথায় আপনি রাক্ষস পর্যায়ের কেউ নাকি বলেন, যদি একবার হয় তাহলে এক বলেন, দুইবার হইলে ২ বলেন, তিনবার হইলে ৩ বলেন )
Consumption of food between meals (CAEC) = main মিলের মাঝে কি টুকটাক খাওয়া দাওয়া হয় ? অপশন ৪ টা - always, frequently, no এবং sometimes
Consumption of water daily (CH20) = প্রতিদিন কত লিটার পানি খান অপশন ১ লিটার থেকে ৩ লিটার এর মাঝে
Consumption of alcohol (CALC) = প্রতিদিন কত লিটার এলকোহল খান, অপশন sometimes এবং No
Calories consumption monitoring (SCC) = ব্যাখ্যার দরকার নাই, পড়লেই বুঝতে পারবেন এর অর্থ যেই ক্যালোরি খান সেগুলো মনিটর করেন কি না , অপশন করি এবং করি না (Yes or No)
Physical activity frequency (FAF) = কত ঘন্টার ফিজিক্যাল একটিভিটি হয়, অপশন ১ থেকে ৪ এর মাঝে
Time using technology devices (TUE) = সোজা কোথায় দিনে কত ঘন্টা টিভি, মোবাইল, ল্যাপটপ, বা অন্নান্য ইলেক্ট্রনিক ডিভাইস চালান, অপশন ১ থেকে ৪ এর মাঝে
Transportation used (MTRANS) = কি ধরনের ট্রান্সপোর্ট ইউজ করেন , অপশন পাবলিক, অটোমোবাইল, Bike, walking বা হাঁটাহাঁটি
Smoke = ধূমপান করেন কি না (অপশন হা অথবা না )
ফ্যামিলিতে overweight এর হিস্ট্রি আছে কি না = অপশন yes অথবা না
সাথে এই ডাটাসেটে আছে আপনার জেন্ডার, বয়স, হাইট এবং ওয়েট
প্রায় ২০ হাজার মানুষের তথ্যের উপর এই ডাটাসেটটি তৈরী। আমাদের মডেল আমাদের বলবে এই মানুষটি মোটা হওয়ার ঝুঁকির মধ্যে আছে কি না , এবং থাকলেও কোন ধরণের মোটা হওয়ার ঝুঁকির মাঝে আছে ।
ক্যাগলের এবারের কম্পিটিশন এ আমার মডেলের accuracy স্কোর 89% -তার মানে ১০০ জনের মাঝে ৮৯ জনের ক্ষেত্রে এই মডেল বলতে পারে তার মোটা হওয়ার ঝুঁকি আছে কি না, এবং থাকলেও সে কোন ধরণের ঝুঁকির মধ্যে আছে (টাইপ ১, টাইপ ২, টাইপ ৩ ইত্যাদি )
জুলিয়াসের সাহায্যে মডেলিং করেছি যার বিস্তারিত এখানে আছে : https://docs.google.com/spreadsheets/d/1FwngwX_pC8X5fcmmK7w9ThHQPwxizOb2bNx_Ss6gcLk/edit?usp=sharing