সোশ্যাল মিডিয়া ইনফ্লুয়েন্সার ডাটাসেট -১০

আজকের মেশিন লার্নিং মডেলটি , মেশিনকে সোশ্যাল মিডিয়া ইনফ্লুয়েন্সার চেনানোর একটি ডাটাসেট যেটি তৈরী করা হয়েছে টুইটার (বর্তমান যা এক্স নাম পরিচিত ) এর উপর ভিত্তি করে।

যেই ডাটা দিয়ে ট্রেন করা হয়েছে সেটি খুব সহজ একটি ডাটাসেট। এক নজরে চলুন পরে নেই এই ডাটাসেটের একটি সামারি :

লন্ডনের ডেটা সায়েন্স এবং যুক্তরাজ্যের উইন্ডোজ এজুর ইউজার্স গ্রুপ, মাইক্রোসফট ও পেয়ারইন্ডেক্সের সহযোগিতায়, দ্য বিগ ডাটা হ্যাকাথনের অংশ হিসেবে ‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌ইনফ্লুয়েন্সার্স ইন সোশ্যাল নেটওয়ার্কস এর এই ডাটাসেট যা ক্যাগলের অনেক আগের একটি কম্পিটিশন ।

এই প্রতিযোগিতায় আপনাকে সোশ্যাল মিডিয়ায় কে বেশি প্রভাবশালী, তার জন্য মেশিন লার্নিং মডেল তৈরি করতে হবে। অর্থাৎ কিছু ইন্ডিকেটর (সহজ উদাহরণ হিসেবে ফেসবুকের লাইক,কমেন্ট, মেনশন, শেয়ার এবং ফলোয়ার )এর উপর ভিত্তি করে আপনাকে একটি মডেল তৈরী করতে হবে যেই মডেল বলে দিবে XYZ ব্যাক্তি থেকে PQR ব্যাক্তি সোশ্যাল মিডিয়াতে অনেক বেশি ইনফ্লুয়েন্সাল।

আমার মডেলের একুরেসি এখানে 86% এবং এটি আমার ১০ নম্বর ক্যাগল কম্পিটিশন এর মডেলিং।

আমার করা আগের কম্পিটিশন মডেলিংগুলো : https://docs.google.com/spreadsheets/d/1FwngwX_pC8X5fcmmK7w9ThHQPwxizOb2bNx_Ss6gcLk/edit?usp=sharing

Last updated