কাস্টমারদের ডাটাসেট
Last updated
Last updated
ছোট একটি Real Life Dataset লোড করে নিতে পারেন এখান থেকে : https://www.kaggle.com/datasets/msahmed/customer-buying-dataset/data
আগে ডাটাসেটটির ডাটা হেড গুলো দেখে নেই :
প্রায় ৫১১ জব কাস্টমার এর ডাটাসেট হাতের কাছে চলে এসেছে।জুলিয়াস থাকতে লোভ সামলাতে পারলাম না এনালাইসিস এর। এটি একটি কোম্পানির ডাটাসেটটি কাস্টমারদের ট্রান্সাকশন এর ডাটাসেট।
তার মানে হচ্ছে এই ডাটাসেট থেকে ঠিকঠাক করে বের করে ফেলা যাবে নিচের প্রশ্নগুলোর উত্তর
মোটামুটি এই প্রশ্নগুলোর উত্তর জানলেই একটি কোম্পানির (ধরুন কোম্পানির নাম ভড়ং ) customer base and sales performance সেকশনে উন্নতি করা সম্ভব। পাশাপাশি ভড়ং এর marketing campaigns, product development, and customer service এগুলোও উন্নত করতে পারবে। আসুন আস্তে আস্তে তাহলে থলের বিড়াল বের করি।
প্রথমেই বের করবো কাস্টমারদেড় সাথে সংস্লিষ্ট প্রশ্নের উত্তর, প্রথমেই ডাটাসেটটি এটাচ করে লোড করে নিতে হবে জুলিয়াস এর ইন্টারফেসে।
প্রথমেই ধাক্কা খেলাম। কারণ কাস্টমার কতজন তাদের নাম দেওয়া নেই। কিন্তু যেটি আছে সেটি হচ্ছে কাস্টমার ID, যেহেতু প্রতিটি Id একটি একজন ইউনিক কাস্টমার কে রিপ্রেসেন্ট করে এবং প্রতিটি ID জেনারেট হয়েছে এক এক টি ইউনিক লেনদেনের কারণে তাই লজিক বলছে, কাস্টমার আইডির মধ্যেই লুকিয়ে আছে কতজন টোটাল কাস্টমার আছে তার উত্তর। জুলিয়াস ও ভুল করলো না। বের করে ফেললো কাস্টমারের সংখ্যা যা কিনা : ৫১০
এর পরে বের করে ফেলবো, কোন জায়গা থেকে থেকে বেশির ভাগ কাস্টমার কেনাকাটা করেছেন। এই প্রশ্নের উত্তর জানলে মার্কেটিং অফারগুলো ওই এলাকার মানুষদের কে আরো বেশি জানালে সেলস বাড়বে। বুঝাই যাচ্ছে ওয়েস্ট এবং সাউথ রিজিওন থেকে সবচেয়ে বেশি কাস্টমার কেনাকাটা করেছে।
এর পরে জন্য কাস্টমাররা সবচেয়ে বেশি কোন মাদ্ধমে প্রোডাক্টটি কিনেছে ? যদি ওয়েব অর্ডার দিয়ে কিনে থাকে তাহলে বুঝতে হবে ইমেল থেকে ওয়েবে সে বেশি কম্ফোর্টেবল, সুতরাং সেখানে আরো বেশি কিছু ফিচার যুক্ত করা যায় কি না। হয়তো একটি app ডেভেলপ করা যেতে পারে।
বুঝাই যাচ্ছে কাস্টমাররা ওয়েব থেকে বেশি অর্ডার করেছে। হয়তো ট্রেকিং সিস্টেম এর বাড়তি ফিচার এর কারণে ওয়েব থেকে অর্ডার ভালো হয়েছে।
এর পরে বের করবো কোন পেমেন্ট মোড বেশি ইউজ করে লেনদেন হয়েছে।
বোঝা যাচ্ছে ক্রেডিট কার্ডের উপরে ভরসা পেপাল থেকে বেশি। যদি আরো বের করা যেত কোন ব্যাঙ্ক এর ক্রেডিট কার্ড তারা বেশি ইউজ করেছেন, তাহলে বলা যেত হয়তো সেই ব্যাঙ্ক এর ক্রেডিট কার্ড এর সুযোগ সুবিধা অন্য ব্যাঙ্কদের থেকে বেশি।
কাস্টমারদের বায়িং বেহেভিয়ার রিজিওন wise কিরকম ? চলুন দারুন একটা ম্যাপিং আপনাদেরকে করে দেখাই
ওয়েবের মাদ্ধমে ওয়েস্ট এলাকার মানুষরা সবচেয়ে বেশি (১৫৪ জন) লেনদেন করেছেন আবার অন্যদিকে ইস্টের মানুষরা ইমেলের মাদ্ধমে সবচেয়ে কম (২৪ জন) কেনাকাটা করেছেন। এখানে কালার এর ইনটেনসিটি দিয়ে বুঝানো হয়েছে সবচেয়ে বেশি এবং কম। দারুন না ?
এবার সম্পর্ক খুঁজে বের করবো কাস্টমার যেভাবে কিনছেন তার সাথে যেই প্রোডাক্ট কিনছেন তার কোনো সম্পর্ক আছে কি না ? এখানে প্রোডাক্ট বলতে বই এবং অনলাইন প্রোডাক্ট এবং যেভাবে কিনছেন বলতে ইমেল এবং ওয়েব কে মাদ্ধমে হিসেবে দেখানো হয়েছে ডাটাসেট অনুযায়ী
ওয়েবের মাদ্ধমে সবচেয়ে বেশি কাস্টমার কিনেছেন বই যা কিনা ১৯৬ জন আবার সেই বই -ই ইমেলের মাদ্ধমে কিনেছেন ৮৭ কিনেছেন জন । আবার অনলাইন প্রোডাক্ট এর ক্ষেত্রে ওয়েবের মাদ্ধমেই কিনেছেন ১৭২ জন আবার অনলাইন প্রোডাক্ট ইমেলের মাদ্ধমেই কিনেছেন ৫৫ জন । কি দুই ক্ষেত্রেই কি বুঝা যাচ্ছে ? কাস্টমাররা দুই ক্ষেত্রেই ওয়েব কে অনেক বেশি প্রাধান্য দিয়েছেন, ইমেল থেকে।
যেই প্রশ্ন গুলোর উত্তর আমরা কাস্টমার এবং কাস্টমার এর বায়িং বিহেভিয়ার এর সম্পর্কে পেলাম তা হলো
১. টোটাল কাস্টমার ৫১০ জন
২. সবচেয়ে বেশি কাস্টমার কেনাকাটা করেছে সাউথ এবং ওয়েস্ট রিজিওন থেকে
৩. ইমেল থেকে ওয়েব মাদ্ধমে লেনদেন হয়েছে বেশি
৪. ক্রেডিট কার্ড দিয়ে লেনদেন হয়েছে সবচেয়ে বেশি
৫. ওয়েস্ট রিজিওন থেকে ইমেলে ৫৭ জন এবং ওয়েবের মাদ্ধমে ১৫৪ জন কিনেছেন। ইন্টারেস্টিংলি সবচেয়ে কম ইমেলের মাদ্ধমে ইস্ট রিজিওন থেকে ২৪ জন কিনলেও ওয়েবের দিক থেকে ইস্ট রিজিওন ওয়েস্টের পরেই (৭৭ জন)
৬. কাস্টমাররা দুই ক্ষেত্রেই ওয়েব কে অনেক বেশি প্রাধান্য দিয়েছেন, ইমেল থেকে।
এবার আসি বিক্রির সাথে রিলেটেড প্রশ্নগুলো উত্তর নিয়ে।
প্রথমেই আসি টোটাল কত রেভেনিউ জেনারেট হলো এবং সবচেয়ে বেশি কোন প্রডাক্টটি সেল হয়েছে ,জুলিয়াস বলছে :
The total revenue generated is $19,801.61.
The most popular products based on the number of purchases are:
Books, with 283 purchases. Online products, with 227 purchases.
এর পর দেখবো বই কিনার জন্য অ্যাভারেজ কিরকম খরচ হয়েছে এবং খরচের ডিস্ট্রিবিউশন কার্ভ কিরকম :
যেহেতু বিভিন্ন রিজিওনের লোকদের বইয়ের পছন্দ বিভিন্ন রকম তাই খরচের মাত্রাও সেরকম হবে। হিস্টোগ্রাম সেটি দেখাচ্ছে এবং আমরা দেখতে পাচ্ছি কার্ভটি মোটেও নরমাল ডিস্ট্রিবিউশন ফলো করেনি। ডাটা চারিদিকে ছড়ানো ছিটানো এবং এভারেজ স্পেন্ডিং মানে মিন থেকে ডিভিশন অনেক বেশি। ১০-৫০ ডলারের মধ্যে যেই বইগুলো আছে সেগুলো বিক্রির পরিমান সবচেয়ে বেশি মূল্যের বইয়ের বিক্রি কম।
দিন এবং রাতের মাঝে কোন সময়ে বিক্রি বেশি হয় বা বিক্রির কি কোনো ট্রেন্ড আছে ?
নিচের চার্টটি সেই উত্তর আমাদের দিয়ে দিবে। দেখা যাচ্ছে বিকাল চারটায় এবং আটটায় দুটি সময়ে সেলস পিকে ছিল। ধারণা করছি যেহেতু ওয়েব অর্ডার বেশি তাই মানুষ সন্ধ্যায় অর্ডার দিয়ে কালকে সকালে হয়তো অর্ডারটি পেতে চাচ্ছে। বা এরকম ও হতে পারে দুপুরে অফিসের লাঞ্চের ব্রেকে অনলাইন ব্রাউজ করতে গিয়ে অর্ডার প্লেস করছে।
একটি কোম্পানির Real life dataset নিয়ে জুলিয়াসে কাজ করে দেখলাম। কিছু কি শিখতে পেরেছি আমরা ?