ডাটা নিয়ে কথা -মাসনুন আহমেদ
  • শূন্য থেকে শুরু
    • কেন লিখছি, কাদের জন্য লিখছি, কিভাবে শিখতে হয়
    • গিটবুকটি কিভাবে পড়বেন ?
  • julius.ai কি ?
    • julius.ai ফিচারগুলো
      • প্রম্প্ট বেসড ডাটা এনালাইসিস
      • প্রোগ্রামিং খটমট নেই
      • গ্রাফ এবং ডাটা ভিজুয়ালাইজেশন
      • ডাটার মিনিংফুল ইনসাইট
      • ডাটা স্ট্রাকচারিং এবং হেভিওয়েট ডাটা
  • হাতেকলমে জুলিয়াসের প্রয়োগ
    • ডাটা এনালিটিক্স এর ৭টি স্টেপ : যেভাবে Ai এর সাহেয্যে আমি ডাটা এনালাইসিস করি
    • একটি অফিসের গল্প
    • রিলেশনশিপ স্ট্যাটাস
    • কাস্টমারদের ডাটাসেট
    • User Engagement এবং Churn Prediction
  • জুলিয়াস দিয়ে স্ট্যাস্টিকাল টেস্ট
    • ANOVA Test
    • Chi Square Test
  • AI এর উপরে কিছু গবেষণা
    • Biased Vs Unbias AI
    • AI এর উপর স্ট্যানফোর্ডের গবেষণা
    • আর্টিফিসিয়াল জেনারেল ইন্টেল পর্ব ১ [লেখা চলমান থাকবে]
    • দা ইমিটিশন গেম
    • বায়োইনফরমেটিক্স এ AI এর ব্যাবহার
  • ক্যাগলের নোটবুক
    • ক্যাগলের নোটবুক এবং আমার পাইথনে ডাটা ভিজুয়াল
    • Exploring Top US Data Science and Analytics Master's Program - 01
    • শার্ক ট্যাঙ্ক বাংলাদেশ ২০২৪
    • লিংকডইনের USA এর AI /ML জব এর ডাটাসেট :: ক্যাগলে আমার তৃতীয় নোটবুক
    • ১৫০ থেকে ১৭০০ :: ডেঙ্গুর ডাটাসেট
    • ক্যাগলের এপার্টমেন্টের ডাটাসেট
    • বাংলাদেশের ৪ জেলার ট্রাভেলার ডাটাসেট এনালাইসিস : পর্ব ১
    • বাংলাদেশের ৪ জেলার ট্রাভেলার ডাটাসেটের গল্প : পর্ব ২
    • বাংলাদেশের ৪ জেলার ট্রাভেলার ডাটাসেটের গল্প : পর্ব ৩ (শেষ পর্ব )
    • NLP ক্লাসিফিকেশন ডাটাসেট :মেশিন মেশিন কি পারবে রোগ অনুযায়ী ডক্টর সাজেস্ট করতে ?
    • সোশ্যাল মিডিয়ায় কেনাকাটার উপর ডাটা এনালিটিক্স (পর্ব ১ )
    • সোশ্যাল মিডিয়ায় কেনাকাটার উপর ডাটা এনালিটিক্স (পর্ব ২ )
    • সোশ্যাল মিডিয়ায় কেনাকাটার উপর ডাটা এনালিটিক্স (পর্ব ৩ )
    • সোশ্যাল মিডিয়ায় কেনাকাটার উপর ডাটা এনালিটিক্স ( শেষ পর্ব )
    • সোশ্যাল মিডিয়ায় কেনাকাটার উপর ডাটা এনালিটিক্স (পর্ব ৪ )
    • হিট ভালনারবিলিটি ইনডেক্স এর একটি ডাটাসেট : শহর চট্টগ্রাম
  • ক্যাগলের কম্পিটিশনে আমার অংশগ্রহণ
    • আবাহাওয়ার ডাটাসেট নিয়ে প্রেডিকশন -১
    • স্পেসশিপ টাইটানিক ডাটাসেট-২
    • সেন্টিমেন্ট এনালাইসিস ডাটাসেট -৩
    • প্রজেক্ট টাইটানিক - ৪
    • টুইটারের টুইট দিয়ে প্রাকৃতিক দুর্যোগের মেশিন লার্নিং মডেল-৫
    • মেশিন কে হাতেরলেখা চিনানো বিশ্ববিখ্যাত MNIST ডাটাসেটের গল্প - ৬
    • ব্যাঙ্ক এর কাস্টমার ব্যাঙ্ক ছেড়ে যাবে কি না - ৭
    • মোটু কাহিনী : মাল্টিক্লাস প্রেডিক্টর কম্পিটিশন - ৮
    • বন্যার পূর্বাভাস সংক্রান্ত কম্পিটিশন : ফ্লাড প্রেডিকশন ডাটাসেট - ৯
    • সোশ্যাল মিডিয়া ইনফ্লুয়েন্সার ডাটাসেট -১০
    • Binary Prediction of Poisonous Mushrooms ডাটাসেট-১১
    • ক্যাগলের কম্পিটিশন : মেশিন কি পারবে আপনি বিষন্ন কিনা সেটি বলতে ?
    • Gliese 12 b
    • যারা গিটবুকটি সাইটেশন করতে চান
  • AI এর যুগে আমরা : কি শিখবো, কিভাবে শিখবো
  • Data Democratization : একজন নন টেক হয়েও আমার প্রতিষ্ঠান TradePoint কে যেভাবে Data Driven বিজনেস kore
  • মৃত্যুকূপ : Geospatial ডাটাসেটে আমার প্রথম Ai দিয়ে কাজ
  • AI, ক্লাউড আর ডাটা সায়েন্স: ২০২৫ সালের ৭টি ট্রেন্ড যা অনেক কিছুই বদলে দিবে
  • জুলিয়াস থেকে পাওয়া উপহার
  • কিছু রিডিং ম্যাটেরিয়াল
  • ভবিষৎতের পৃথিবী :: কোডিং নিয়ে কিছু কথা (পর্ব ১)
  • ভবিষৎতের পৃথিবী : শ্রমিক,ব্যাঙ্কার অথবা একজন ডাটা এনালিস্ট :: কে Ai এর প্রভাবমুক্ত?: (পর্ব ২)
  • প্রশ্নোত্তরে ডাটা নিয়ে কথা
  • 💡টেক ডায়েরি 💡
    • বুক রিভিউ ১ :: প্রোগ্রামিং ফর বিগিনার
    • app রিভিউ পর্ব ১
    • Open AI এবং Iliya
    • ভবিষ্যতের কম্পিউটিং কেমন হবে ?
    • কৃত্রিম বুদ্ধিমত্তার শাসন কি সমাগত?
    • ডাটা এনালিটিক্স এর ভবিষ্যৎ
    • চায়না জেনেরেটিভ AI এর পেটেন্টে এগিয়ে
    • OpenAI o1 সম্পর্কে
    • Pixtral 12B মডেল
Powered by GitBook
On this page
  1. হাতেকলমে জুলিয়াসের প্রয়োগ

কাস্টমারদের ডাটাসেট

Previousরিলেশনশিপ স্ট্যাটাসNextUser Engagement এবং Churn Prediction

Last updated 2 months ago

ছোট একটি Real Life Dataset লোড করে নিতে পারেন এখান থেকে :

আগে ডাটাসেটটির ডাটা হেড গুলো দেখে নেই :

প্রায় ৫১১ জব কাস্টমার এর ডাটাসেট হাতের কাছে চলে এসেছে।জুলিয়াস থাকতে লোভ সামলাতে পারলাম না এনালাইসিস এর। এটি একটি কোম্পানির ডাটাসেটটি কাস্টমারদের ট্রান্সাকশন এর ডাটাসেট।

তার মানে হচ্ছে এই ডাটাসেট থেকে ঠিকঠাক করে বের করে ফেলা যাবে নিচের প্রশ্নগুলোর উত্তর

মোটামুটি এই প্রশ্নগুলোর উত্তর জানলেই একটি কোম্পানির (ধরুন কোম্পানির নাম ভড়ং ) customer base and sales performance সেকশনে উন্নতি করা সম্ভব। পাশাপাশি ভড়ং এর marketing campaigns, product development, and customer service এগুলোও উন্নত করতে পারবে। আসুন আস্তে আস্তে তাহলে থলের বিড়াল বের করি।

প্রথমেই ধাক্কা খেলাম। কারণ কাস্টমার কতজন তাদের নাম দেওয়া নেই। কিন্তু যেটি আছে সেটি হচ্ছে কাস্টমার ID, যেহেতু প্রতিটি Id একটি একজন ইউনিক কাস্টমার কে রিপ্রেসেন্ট করে এবং প্রতিটি ID জেনারেট হয়েছে এক এক টি ইউনিক লেনদেনের কারণে তাই লজিক বলছে, কাস্টমার আইডির মধ্যেই লুকিয়ে আছে কতজন টোটাল কাস্টমার আছে তার উত্তর। জুলিয়াস ও ভুল করলো না। বের করে ফেললো কাস্টমারের সংখ্যা যা কিনা : ৫১০

এর পরে বের করে ফেলবো, কোন জায়গা থেকে থেকে বেশির ভাগ কাস্টমার কেনাকাটা করেছেন। এই প্রশ্নের উত্তর জানলে মার্কেটিং অফারগুলো ওই এলাকার মানুষদের কে আরো বেশি জানালে সেলস বাড়বে। বুঝাই যাচ্ছে ওয়েস্ট এবং সাউথ রিজিওন থেকে সবচেয়ে বেশি কাস্টমার কেনাকাটা করেছে।

এর পরে জন্য কাস্টমাররা সবচেয়ে বেশি কোন মাদ্ধমে প্রোডাক্টটি কিনেছে ? যদি ওয়েব অর্ডার দিয়ে কিনে থাকে তাহলে বুঝতে হবে ইমেল থেকে ওয়েবে সে বেশি কম্ফোর্টেবল, সুতরাং সেখানে আরো বেশি কিছু ফিচার যুক্ত করা যায় কি না। হয়তো একটি app ডেভেলপ করা যেতে পারে।

বুঝাই যাচ্ছে কাস্টমাররা ওয়েব থেকে বেশি অর্ডার করেছে। হয়তো ট্রেকিং সিস্টেম এর বাড়তি ফিচার এর কারণে ওয়েব থেকে অর্ডার ভালো হয়েছে।

এর পরে বের করবো কোন পেমেন্ট মোড বেশি ইউজ করে লেনদেন হয়েছে।

বোঝা যাচ্ছে ক্রেডিট কার্ডের উপরে ভরসা পেপাল থেকে বেশি। যদি আরো বের করা যেত কোন ব্যাঙ্ক এর ক্রেডিট কার্ড তারা বেশি ইউজ করেছেন, তাহলে বলা যেত হয়তো সেই ব্যাঙ্ক এর ক্রেডিট কার্ড এর সুযোগ সুবিধা অন্য ব্যাঙ্কদের থেকে বেশি।

কাস্টমারদের বায়িং বেহেভিয়ার রিজিওন wise কিরকম ? চলুন দারুন একটা ম্যাপিং আপনাদেরকে করে দেখাই

ওয়েবের মাদ্ধমে ওয়েস্ট এলাকার মানুষরা সবচেয়ে বেশি (১৫৪ জন) লেনদেন করেছেন আবার অন্যদিকে ইস্টের মানুষরা ইমেলের মাদ্ধমে সবচেয়ে কম (২৪ জন) কেনাকাটা করেছেন। এখানে কালার এর ইনটেনসিটি দিয়ে বুঝানো হয়েছে সবচেয়ে বেশি এবং কম। দারুন না ?

এবার সম্পর্ক খুঁজে বের করবো কাস্টমার যেভাবে কিনছেন তার সাথে যেই প্রোডাক্ট কিনছেন তার কোনো সম্পর্ক আছে কি না ? এখানে প্রোডাক্ট বলতে বই এবং অনলাইন প্রোডাক্ট এবং যেভাবে কিনছেন বলতে ইমেল এবং ওয়েব কে মাদ্ধমে হিসেবে দেখানো হয়েছে ডাটাসেট অনুযায়ী

ওয়েবের মাদ্ধমে সবচেয়ে বেশি কাস্টমার কিনেছেন বই যা কিনা ১৯৬ জন আবার সেই বই -ই ইমেলের মাদ্ধমে কিনেছেন ৮৭ কিনেছেন জন । আবার অনলাইন প্রোডাক্ট এর ক্ষেত্রে ওয়েবের মাদ্ধমেই কিনেছেন ১৭২ জন আবার অনলাইন প্রোডাক্ট ইমেলের মাদ্ধমেই কিনেছেন ৫৫ জন । কি দুই ক্ষেত্রেই কি বুঝা যাচ্ছে ? কাস্টমাররা দুই ক্ষেত্রেই ওয়েব কে অনেক বেশি প্রাধান্য দিয়েছেন, ইমেল থেকে।

যেই প্রশ্ন গুলোর উত্তর আমরা কাস্টমার এবং কাস্টমার এর বায়িং বিহেভিয়ার এর সম্পর্কে পেলাম তা হলো

১. টোটাল কাস্টমার ৫১০ জন

২. সবচেয়ে বেশি কাস্টমার কেনাকাটা করেছে সাউথ এবং ওয়েস্ট রিজিওন থেকে

৩. ইমেল থেকে ওয়েব মাদ্ধমে লেনদেন হয়েছে বেশি

৪. ক্রেডিট কার্ড দিয়ে লেনদেন হয়েছে সবচেয়ে বেশি

৫. ওয়েস্ট রিজিওন থেকে ইমেলে ৫৭ জন এবং ওয়েবের মাদ্ধমে ১৫৪ জন কিনেছেন। ইন্টারেস্টিংলি সবচেয়ে কম ইমেলের মাদ্ধমে ইস্ট রিজিওন থেকে ২৪ জন কিনলেও ওয়েবের দিক থেকে ইস্ট রিজিওন ওয়েস্টের পরেই (৭৭ জন)

৬. কাস্টমাররা দুই ক্ষেত্রেই ওয়েব কে অনেক বেশি প্রাধান্য দিয়েছেন, ইমেল থেকে।

এবার আসি বিক্রির সাথে রিলেটেড প্রশ্নগুলো উত্তর নিয়ে।

প্রথমেই আসি টোটাল কত রেভেনিউ জেনারেট হলো এবং সবচেয়ে বেশি কোন প্রডাক্টটি সেল হয়েছে ,জুলিয়াস বলছে :

The total revenue generated is $19,801.61.

The most popular products based on the number of purchases are:

Books, with 283 purchases. Online products, with 227 purchases.

এর পর দেখবো বই কিনার জন্য অ্যাভারেজ কিরকম খরচ হয়েছে এবং খরচের ডিস্ট্রিবিউশন কার্ভ কিরকম :

যেহেতু বিভিন্ন রিজিওনের লোকদের বইয়ের পছন্দ বিভিন্ন রকম তাই খরচের মাত্রাও সেরকম হবে। হিস্টোগ্রাম সেটি দেখাচ্ছে এবং আমরা দেখতে পাচ্ছি কার্ভটি মোটেও নরমাল ডিস্ট্রিবিউশন ফলো করেনি। ডাটা চারিদিকে ছড়ানো ছিটানো এবং এভারেজ স্পেন্ডিং মানে মিন থেকে ডিভিশন অনেক বেশি। ১০-৫০ ডলারের মধ্যে যেই বইগুলো আছে সেগুলো বিক্রির পরিমান সবচেয়ে বেশি মূল্যের বইয়ের বিক্রি কম।

দিন এবং রাতের মাঝে কোন সময়ে বিক্রি বেশি হয় বা বিক্রির কি কোনো ট্রেন্ড আছে ?

নিচের চার্টটি সেই উত্তর আমাদের দিয়ে দিবে। দেখা যাচ্ছে বিকাল চারটায় এবং আটটায় দুটি সময়ে সেলস পিকে ছিল। ধারণা করছি যেহেতু ওয়েব অর্ডার বেশি তাই মানুষ সন্ধ্যায় অর্ডার দিয়ে কালকে সকালে হয়তো অর্ডারটি পেতে চাচ্ছে। বা এরকম ও হতে পারে দুপুরে অফিসের লাঞ্চের ব্রেকে অনলাইন ব্রাউজ করতে গিয়ে অর্ডার প্লেস করছে।

প্রথমেই বের করবো কাস্টমারদেড় সাথে সংস্লিষ্ট প্রশ্নের উত্তর, প্রথমেই ডাটাসেটটি এটাচ করে লোড করে নিতে হবে এর ইন্টারফেসে।

একটি কোম্পানির Real life dataset নিয়ে কাজ করে দেখলাম। কিছু কি শিখতে পেরেছি আমরা ?

জুলিয়াস
জুলিয়াসে
https://www.kaggle.com/datasets/msahmed/customer-buying-dataset/data