আজকের মেশিন লার্নিং মডেলটি , মেশিনকে সোশ্যাল মিডিয়া ইনফ্লুয়েন্সার চেনানোর একটি ডাটাসেট যেটি তৈরী করা হয়েছে টুইটার (বর্তমান যা এক্স নাম পরিচিত ) এর উপর ভিত্তি করে।
যেই ডাটা দিয়ে ট্রেন করা হয়েছে সেটি খুব সহজ একটি ডাটাসেট। এক নজরে চলুন পরে নেই এই ডাটাসেটের একটি সামারি :
লন্ডনের ডেটা সায়েন্স এবং যুক্তরাজ্যের উইন্ডোজ এজুর ইউজার্স গ্রুপ, মাইক্রোসফট ও পেয়ারইন্ডেক্সের সহযোগিতায়, দ্য বিগ ডাটা হ্যাকাথনের অংশ হিসেবে ইনফ্লুয়েন্সার্স ইন সোশ্যাল নেটওয়ার্কস এর এই ডাটাসেট যা ক্যাগলের অনেক আগের একটি কম্পিটিশন ।
এই প্রতিযোগিতায় আপনাকে সোশ্যাল মিডিয়ায় কে বেশি প্রভাবশালী, তার জন্য মেশিন লার্নিং মডেল তৈরি করতে হবে। অর্থাৎ কিছু ইন্ডিকেটর (সহজ উদাহরণ হিসেবে ফেসবুকের লাইক,কমেন্ট, মেনশন, শেয়ার এবং ফলোয়ার )এর উপর ভিত্তি করে আপনাকে একটি মডেল তৈরী করতে হবে যেই মডেল বলে দিবে XYZ ব্যাক্তি থেকে PQR ব্যাক্তি সোশ্যাল মিডিয়াতে অনেক বেশি ইনফ্লুয়েন্সাল।
আমার মডেলের একুরেসি এখানে 86% এবং এটি আমার ১০ নম্বর ক্যাগল কম্পিটিশন এর মডেলিং।
আমার করা আগের কম্পিটিশন মডেলিংগুলো : https://docs.google.com/spreadsheets/d/1FwngwX_pC8X5fcmmK7w9ThHQPwxizOb2bNx_Ss6gcLk/edit?usp=sharing