সোশ্যাল মিডিয়া ইনফ্লুয়েন্সার ডাটাসেট -১০
Last updated
Last updated
আজকের মেশিন লার্নিং মডেলটি , মেশিনকে সোশ্যাল মিডিয়া ইনফ্লুয়েন্সার চেনানোর একটি ডাটাসেট যেটি তৈরী করা হয়েছে টুইটার (বর্তমান যা এক্স নাম পরিচিত ) এর উপর ভিত্তি করে।
যেই ডাটা দিয়ে ট্রেন করা হয়েছে সেটি খুব সহজ একটি ডাটাসেট। এক নজরে চলুন পরে নেই এই ডাটাসেটের একটি সামারি :
লন্ডনের ডেটা সায়েন্স এবং যুক্তরাজ্যের উইন্ডোজ এজুর ইউজার্স গ্রুপ, মাইক্রোসফট ও পেয়ারইন্ডেক্সের সহযোগিতায়, দ্য বিগ ডাটা হ্যাকাথনের অংশ হিসেবে ইনফ্লুয়েন্সার্স ইন সোশ্যাল নেটওয়ার্কস এর এই ডাটাসেট যা ক্যাগলের অনেক আগের একটি কম্পিটিশন ।
এই প্রতিযোগিতায় আপনাকে সোশ্যাল মিডিয়ায় কে বেশি প্রভাবশালী, তার জন্য মেশিন লার্নিং মডেল তৈরি করতে হবে। অর্থাৎ কিছু ইন্ডিকেটর (সহজ উদাহরণ হিসেবে ফেসবুকের লাইক,কমেন্ট, মেনশন, শেয়ার এবং ফলোয়ার )এর উপর ভিত্তি করে আপনাকে একটি মডেল তৈরী করতে হবে যেই মডেল বলে দিবে XYZ ব্যাক্তি থেকে PQR ব্যাক্তি সোশ্যাল মিডিয়াতে অনেক বেশি ইনফ্লুয়েন্সাল।
আমার মডেলের একুরেসি এখানে 86% এবং এটি আমার ১০ নম্বর ক্যাগল কম্পিটিশন এর মডেলিং।
আমার করা আগের কম্পিটিশন মডেলিংগুলো : https://docs.google.com/spreadsheets/d/1FwngwX_pC8X5fcmmK7w9ThHQPwxizOb2bNx_Ss6gcLk/edit?usp=sharing