রিলেশনশিপ স্ট্যাটাস
Last updated
Last updated
কোরিলেশন দুটি ভেরিয়েবলের ভিতর পসিটিভ বা নেগেটিভ সম্পর্ক নির্ধারণে ব্যাবহৃত হয়। নিচের ঘটনাগুলো লক্ষ্য করুন :
পজিটিভ কোররিলেশন :
১. গরম বেশি (গরম ভ্যারিয়েবল বাড়ছে ) পড়লে আইসক্রিমের (আইসক্রিম এর বিক্রি -ভ্যারিয়েবলও বাড়ছে ) সেল বাড়ে
২. পড়াশোনা (একটি ভ্যারিয়েবল বাড়ছে ) যত বেশি , পরীক্ষায় ভালো ফলাফল (সাথে এই ভ্যারিয়েবলটিও বাড়ছে ) করার সম্ভাবনা ততো বেশি
৩. সূর্যের আলো (একটি ভ্যারিয়েবল বাড়ছে ) যত বেশি পাবে, একটি গাছ ততো দ্রুত (সাথে এই ভ্যারিয়েবলটিও বাড়ছে ) বেড়ে উঠবে
নেগেটিভ কোররিলেশন :
১. মানুষের বয়স বাড়ার (একটি ভেরিয়েবল বাড়ছে ) এর সাথে চোখের দৃষ্টি শক্তি (আরেকটি ভেরিয়েবল কমছে ) কমে আসে
২. যত বেশি সময় টিভি দেখা হবে ( একটি ভেরিয়েবল বাড়ছে ) পরীক্ষার রেজাল্ট ( আরেকটি ভেরিয়েবল কমছে )ততটাই খারাপ হবে
কোররিলেশন মানে এটার কারণে ঐটা ঘরে - ব্যাপারটা একদম ই তাই না । সহজ ভাবে বলতে গেলে -দুটো ঘটনা একসাথে ঘটে বলেই একটা জিনিস আরেকটার কারণ, এমনটা নয়। যেমন ধরুন গরম বেশি পড়লে আইসক্রিম এর বিক্রি বাড়ার পিছনে হয়তো আইসক্রিম কোম্পানির কোনো ডিসকাউন্ট অফার থাকতে পারে। কোররিলেশন দুটো জিনিসের সরল সম্পর্ক খুঁজে বের করে। একটি সোজা রেখার কথা কল্পনা করুন যদি দুটি জিনিস একসাথে ওই রেখা বরাবর উপরে বা নিচে যায়, তাহলে সেগুলোর মধ্যে কোরেলেশন আছে বলা যায়।
এখন আমরা জুলিয়াসের মাদ্ধমে দেখবো, আমাদের এই ডাটাসেটের ভিতরে একটি ভ্যারিয়েবলের সাথে আরেকটি ভ্যারিয়েবলের কোন সম্পর্ক আছে কি না।
চাইলে ডাটাসেটটি নামিয়ে নিতে পারেন এখান থেকে : https://www.kaggle.com/msahmed/datasets
প্রথমেই ডাটাসেটটি আপলোড করে নেই
কোররিলেশন দেখানোর জন্য সবচেয়ে উপযুক্ত হচ্ছে Correlation Matrix Heatmap কোররিলেশন দেখানোর জন্য সবচেয়ে উপযুক্ত হচ্ছে Correlation Matrix Heatmap . জুলিয়াস কে সবগুলো ভ্যারিয়েবল (জেন্ডার, হাইট এবং ওয়েট ) এর কোররিলেশন হিটম্যাপ করতে বলার পরে নিচের ছবিটি জুলিয়াস তৈরী করলো
Here's the heatmap of the correlation matrix for the dataset, including the variables Height (in inches), Weight (in pounds), and Gender (encoded). The heatmap visually represents the correlation coefficients between these variables, with the color intensity and the value indicating the strength and direction of the relationship:
A correlation coefficient close to 1 indicates a strong positive relationship.
A correlation coefficient close to -1 indicates a strong negative relationship.
A correlation coefficient around 0 indicates no linear relationship.
The heatmap provides a quick and intuitive way to understand the relationships between multiple variables at once.
এবার একটু বুঝে নেই এই কোরিলেশন হিটম্যাপ টি আমাদের কে কি ডাটা ইনসাইট দিলো ।
খুব সহজ ভাবে হাইট ওয়েট এবং জেন্ডার - এই তিনটির একটার সাথে আরেকজনের তুলনা এখানে করা হয়েছে। রিলেশনশিপ স্ট্যাটাস ১ এর যত কাছাকাছি থাকবে, সম্পর্ক ততই শক্তিশালী হবে। দেখা যাচ্ছে এখানে হাইটের সাথে ওয়েট এর একটা পজিটিভ সম্পর্ক আছে। যেই কারণে হাইট রেড কালার এর শেড দেওয়া এবং ওয়েট রেডের কাছাকাছি আরেকটি শেড দিয়ে বুঝানো হয়েছে। অন্যভাবে ১ এর কাছাকাছি দশমিক ৬৪ সবচেয়ে কাছাকাছি মান। দেখা যাচ্ছে ছবিতে দুইবার সেই মানটি আছে। সুতরাং হাইটের সাথে ওয়েটের অথবা ওয়েটের সাথে হাইটের একটি কোররিলেশন আছে বলাই যায়।
দেখি জুলিয়াস কি বলে :
হাইট এবং ওয়েট এদের মধ্যে একটি মাঝারি ধরণের ইতিবাচক সম্পর্ক আছে (কমলা রঙের ঘরটি)। এর মানে হলো, লম্বা মানুষের ওজন সাধারণত বেশি হয়, কিন্তু এটা সব সময় ঠিক নাও হতে পারে। কিছু খাটো মানুষের ওজন অনেক বেশি হতে পারে, আবার কিছু লম্বা মানুষ খুব রোগাও হতে পারে।
হাইট এবং জেন্ডার : এদের মধ্যে একটি দুর্বল ঋণাত্মক সম্পর্ক আছে (হালকা নীল রঙের ঘরটি)। এর মানে হলো, ছেলেরা মেয়েদের চেয়ে একটু লম্বা হওয়ার সম্ভাবনা বেশি, কিন্তু এই সম্পর্কটা খুব জোড়ালো না। অনেক মেয়ে আছে যারা ছেলেদের চেয়ে লম্বা, আবার ছেলেদের ক্ষেত্রেও একই কথা।
আচ্ছা আপনার জুতার সাইজের সাথে আপনি কি গাড়ি নাকি CNG নাকি রিক্সা ইউজ করবেন, তার কি কোনো সম্পর্ক আছে ? এরকম মজার কিছু কোররিলেশন এর কিছু উদাহরণ দেখতে ভিজিট করতে পারেন : https://www.statology.org/correlation-examples-in-real-life/
এই সেকশনটি পড়ার পরে আপনার হোমওয়ার্ক :
১. আপনার চারপাশে কোরিলেশন আছে এরকম ১০টি ঘটনা (পজিটিভ অথবা নেগেটিভ) খুঁজে নোট ডাউন করুন
২. ডাটাসেট kaggle থেকে নামিয়ে প্রাকটিস শুরু করুন