বন্যার পূর্বাভাস সংক্রান্ত কম্পিটিশন : ফ্লাড প্রেডিকশন ডাটাসেট - ৯

গত এক সপ্তাহ থেকেই মনের মধ্যে একটা অস্বস্তি। কারণ আর কিছুই না - ক্যাগলের একটি ডাটাসেটের কম্পিটিশন এর রেজাল্ট। মডেলিং এর জন্য আমি সবসময়েই জুলিয়াস ইউজ করি। কিন্তু সেটি ইউজ করার পরেও মডেলের accuracy মাইনাস ফিগারে চলে গেছে। এদিকে ১ জুন ২০২৪ কম্পিটিশন এ ফাইল সাবমিট এর লাস্ট ডেট। তাই ছুটির দিনে সিদ্ধান্ত নিয়ে ফেললাম সব কাজ ফেলে আজকে মডেলের accuracy যেভাবেই হোক ঠিক করবো, এটলিস্ট ৮ টি কম্পিটিশন এ অংশগ্রহণ এর পরে এটুকু দক্ষতা তো হয়েছেই।

চলে আসি এবার আজকের কম্পিটিশন এর ডাটাসেট নিয়ে। বাংলাদেশ একটি কৃষি-নির্ভর দেশ যা প্রায়ই বন্যার সম্মুখীন হয়। বন্যা পূর্বাভাস এবং এর প্রতিরোধে কিছু নির্দিষ্ট বিষয় বিশেষভাবে গুরুত্বপূর্ণ। এই কম্পিটিশনে সেরকম একটি ডাটাসেট আছে যা কিনা বন্যা পূর্বাভাসে হেল্পফুল।

চলুন প্রথমেই দেখে নেই ডাটাসেটের হেড গুলো :

Monsoon Intensity - বর্ষা তীব্রতা

Topography - ভূপ্রকৃতি

River Management - নদী ব্যবস্থাপনা

Deforestation - বন নিধন

Urbanization - নগরায়ন

Climate Change - জলবায়ু পরিবর্তন

Dams Quality - বাঁধের গুণমান

Siltation - পলি জমা

Agricultural Practices - কৃষি অনুশীলন

Encroachments - দখলদারিত্ব

Ineffective Disaster Preparedness - অকার্যকর দুর্যোগ প্রস্তুতি

Drainage Systems - নিষ্কাশন ব্যবস্থা

Coastal Vulnerability - উপকূলীয় ঝুঁকি

Landslides - ভূমিধস

Watersheds - জলাশয়

Deteriorating Infrastructure - অবনতিশীল অবকাঠামো

Population Score - জনসংখ্যা স্কোর

Wetland Loss - জলাভূমির ক্ষতি

Inadequate Planning - অপর্যাপ্ত পরিকল্পনা

Political Factors - রাজনৈতিক কারণ

ডাটাসেটের এই হেডগুলোকে ১-১৮ এর একটি স্কেলে নেওয়া হয়েছে। ধরা যাক আপনি হবিগঞ্জ এ থাকেন। আপনার এরিয়া কোড 160005। আপনার এই এরিয়া কোডের ভিত্তিতে ডাটাসেটের যেই হেডগুলো বললাম সেগুলোকে মার্কিং করা হলো। যেমন ধরুন ডিফরেস্টেশন, যদি আপনি এই ডাটহেডে ১২ নম্বর পান বুঝে নিতে হবে আপনার এলাকায় গাছ কাটা এবং বননিধন বেশি হচ্ছে।

আশা করি ডাটার ওভারভিউ বুঝে ফেলেছেন।

এইবারের কম্পিটিশন এ আমার মডেল এর একুরেসি লেভেল 65% (এখানে একটা মন খারাপের ইমোজি হবে ), স্কোরিং ভালো না জানি কিন্তু আমার আগের স্কোর ছিল -87%, সেখান থেকে মডেলকে ডেভেলপ করে 65% এ নিয়ে এসেছি। মডেলের accuracy level ভালো না হলেও, ভুল কারেকশন করতে গিয়ে যেটা শিখেছি সেটি অনেককিছু।

১ জুন ২০২৪ এ কম্পিটিশন টির ফাইল সাবমিশন এর ডেডলাইন। আর এর মাঝে দিয়ে শেষ হলো আমার ক্যাগলের ৯টি কম্পিটিশন এ অংশগ্রহণ।

৯টি কম্পিটিশন এর বিস্তারিত : https://docs.google.com/spreadsheets/d/1FwngwX_pC8X5fcmmK7w9ThHQPwxizOb2bNx_Ss6gcLk/edit?usp=sharing

ক্যাগলের কম্পিটিশন লিংক : https://www.kaggle.com/competitions/playground-series-s4e5/data

আমার স্কোরিং ডিটেল :

Last updated