আন্তর্জাতিক বাজারের জিএমভি গণনা করার সময় আমি কীভাবে ভুলগুলি এড়াতে পারি?

আপনি যদি কোনও মার্কেটপ্লেসের সাথে কাজ করছেন তবে আপনাকে গ্রস ভলিউম অফ গুডস (GMV) গণনা করতে হবে। প্রথমে এটি সহজ বলে মনে হচ্ছে: আপনাকে যা করতে হবে তা হ'ল একটি কলামে সমস্ত সক্রিয় বিজ্ঞাপনের দাম সংগ্রহ করে SUMM টিপুন। তবে, যদি আপনার বাজারটি বিভিন্ন দেশে কাজ করে তবে এটি এত সহজ নাও হতে পারে।

কেন GMV গণনা করা কঠিন?

আমি লালাফোতে কাজ করি - এআই সহ পিয়ার-টু-পিয়ার মার্কেটপ্লেস। প্ল্যাটফর্মটিতে প্রতি মাসে 4 টি দেশ থেকে 3 মিলিয়ন সক্রিয় ব্যবহারকারী রয়েছে। ২০১ 2016 সালের শেষে, আমাদের সেই বছরের জন্য লালাফোতে রাখা সমস্ত বিজ্ঞাপনের মোট আর্থিক মান গণনা করতে হয়েছিল।

প্রথমত, আমরা কোনও স্থানবিহীন এবং অবরুদ্ধ বিজ্ঞাপনগুলি বাদ দিয়ে, ব্যবহারকারীদের দ্বারা প্রস্তাবিত সমস্ত মূল্যের সংক্ষিপ্তসার করেছি। এর ফলে একটি জিএমভি মান হয়েছে যা আমরা মূল্যায়নের জন্য ব্যবহার করি এমন কোনও দেশের জিডিপির উপরে!

আমরা ডেটা পরিষ্কার করেছি এবং মুদ্রাকে রিয়েল টাইমে রূপান্তর করেছি। এটি মোট ছোট করে তোলে তবে এটি অনুপযুক্তভাবে বড় ছিল।

বিশৃঙ্খল ডেটা সেটে অনিয়মকে ক্লিপ করার সর্বাধিক জনপ্রিয় উপায় হ'ল আন্তঃদেশীয় পরিসীমা (25 থেকে 75 তম পার্সেন্টাইলের মধ্যে ডেটা রেঞ্জ) ব্যবহার করা। আন্তঃরৈখিক পরিসীমা বাস্তবায়নের পরে ব্যবহারকারীর দামের পরিমাণ খুব কম হওয়ায় এই পদ্ধতির ফলে সমস্যার কোনও সমাধান হয়নি।

শতকরা দিকে মনোযোগ দিন

একটি দ্রুত বুদ্ধিদীপ্ত অধিবেশন আমাদের ধারণা দিয়েছে যে সমস্যাটি শতাংশে রয়েছে: শূন্য এবং প্রথমটির মধ্যে পার্থক্যটি খুব নাটকীয় ছিল।

পারসেন্টাইল (বা সেন্টেন্টিল) হ'ল পরিসংখ্যানগুলিতে ব্যবহৃত একটি পরিমাপ যা নীচের মানকে নির্দেশ করে যা নিরীক্ষণের একটি গ্রুপে নির্দিষ্ট শতাংশ পর্যবেক্ষণ পড়ে। উদাহরণস্বরূপ, 20 তম শতাংশটি হ'ল মান (বা স্কোর) যার নীচে 20% পর্যবেক্ষণ পাওয়া যায়। শতাংশ সেটটি লিনিয়ার বা ননলাইনার হতে পারে, নির্ভর করে ডেটা সেটটি ত্রুটিযুক্ত কিনা। (উইকিপিডিয়া)

আমরা 1 এবং 100 এর মধ্যে সমস্ত শতাংশের আচরণ পরীক্ষা করার সিদ্ধান্ত নিয়েছি। আমরা দেখতে পেয়েছি যে সমস্ত ডেটা পারসেন্টাইল 1 এবং 99 এর মধ্যে লিনিয়ার ছিল, যখন আমরা 99 এবং 100 এর মধ্যে একটি বৃহত বৃদ্ধি পেয়েছি যা ইঙ্গিত করে যে এই বিভাগে ত্রুটি ঘটছে। আমরা সমস্যাটি সমাধানের জন্য ব্যবহৃত 99 তম এবং 100 ম পারসেন্টাইলের মধ্যে সমস্ত ডেটা সরিয়ে ফেলেছি।

পণ্য বিভাগের গুরুত্ব

লালাফো মার্কেটপ্লেসে বিভিন্ন পণ্য বিভাগ রয়েছে। সবচেয়ে ব্যয়বহুল বিভাগগুলি হল রিয়েল এস্টেট এবং যানবাহন। আরও সঠিক GMV পাওয়ার জন্য, শতকরা হিসাব করার সময় আমরা পণ্য বিভাগগুলি বিবেচনায় নেওয়ার সিদ্ধান্ত নিয়েছিলাম। উদাহরণস্বরূপ, যানবাহন এবং রিয়েল এস্টেট পারসেন্টাইল পোশাকের চেয়ে কয়েকগুণ বেশি।

ফলস্বরূপ আমাদের রয়েছে:
- প্রতিটি বিভাগের জন্য পারসেন্টাইল মান নির্ধারণ করে।
- পার্সেন্টাইলগুলি কেবল অ-রৈখিক GMV এর জন্য ব্যবহৃত হয়।
এটি আমাদের একটি সঠিক GMV দিয়েছে।

আর একটি গুরুত্বপূর্ণ বিষয় - মুদ্রা

লোকেরা প্রায়শই তাদের বিজ্ঞাপনগুলি রাখার সময় মুদ্রা সেট করতে ভুলে যায়। আইফোন 7 এস এর ফলস্বরূপ মাত্র 20 ডলারে বিক্রি হচ্ছে, বা কলম্বিয়ার মোট মোট গৃহস্থালীর চেয়ে বেশি দামের স্টোভ!

99 তম শতাংশের জন্য মুদ্রাটি সামঞ্জস্য করতে এবং ডেটা সেট করার ফলাফলগুলি বজায় রাখতে আমরা সিদ্ধান্ত নিয়েছি:

- প্রতিটি বিভাগের জন্য একটি সাধারণ মূল্য নির্ধারণ করুন যা বিভাগের মিডিয়ান (50 শতাংশ) এর সাথে মিলে যায়।
- রেকর্ডটি অনুসন্ধান করুন এবং মান খুব কম বা খুব বেশি হলে মুদ্রা সামঞ্জস্য করুন।

জিএমভি গণনা করুন। সাধারণ জ্ঞাতব্য:

- সাধারণ পদ্ধতিগুলি (মিডিয়ান, ইন্টারকোটারিল রেঞ্জ) কেবলমাত্র লিনিয়ার জিএমভির অধীনে কাজ করে। যদি তারা কাজ না করে তবে সমস্ত শতাংশের মানগুলি পরীক্ষা করে দেখুন।

- প্রতিটি বিভাগের জন্য আলাদাভাবে পারসেন্টাইল গণনা করুন।

- গণনার আগে আপনার ডেটা ফিল্টার করুন।

- মুদ্রার মানগুলি পরীক্ষা করুন।