Maths Box And Whisker Plot

बॉक्स और व्हिस्कर प्लॉट

बॉक्स और व्हिस्कर प्लॉट, जिसे बॉक्स प्लॉट भी कहा जाता है, डेटा के वितरण का ग्राफिकल प्रतिनिधित्व है। यह एक डेटासेट के पाँच-संख्या सारांश को प्रदर्शित करने का मानकृत तरीका है: न्यूनतम, प्रथम चतुर्थांश (Q1), माध्यमांश, तृतीय चतुर्थांश (Q3), और अधिकतम।

बॉक्स और व्हिस्कर प्लॉट के घटक

बॉक्स और व्हिस्कर प्लॉट निम्नलिखित घटकों से मिलकर बना होता है:

  • माध्यांक: माध्यांक संख्यात्मक क्रम में व्यवस्थित किए गए डेटासेट का मध्यमांक होता है। इसे एक बॉक्स के बीच की रेखा द्वारा प्रतिष्ठित किया जाता है।
  • बॉक्स: बॉक्स इंटरक्वार्टाइल रेंज (IQR) को प्रतिष्ठान करता है, जो तृतीय चतुर्थांश (Q3) और प्रथम चतुर्थांश (Q1) के बीच का अंतर होता है। IQR डेटा के फैलाव का माप है।
  • व्हिस्कर्स: व्हिस्कर्स बॉक्स से डेटासेट के न्यूनतम और अधिकतम मानों तक फैलाते हैं। व्हिस्कर्स डेटा की सीमा दिखाते हैं।
  • बहिष्कृतगण: बहिष्कृतगण डेटा बाकी डेटा से बहुत भिन्न होते हैं। वे व्हिस्कर्स के बाहर एकल बिंदुओं द्वारा प्रतिष्ठित किए जाते हैं।
बॉक्स और व्हिस्कर प्लॉट का व्याख्यान

बॉक्स और व्हिस्कर प्लॉट का उपयोग विभिन्न डेटासेट के वितरणों की तुलना करने के लिए किया जा सकता है। इसका उपयोग बहिष्कृतगणों की पहचान करने के लिए भी किया जा सकता है।

यहां कुछ बातें हैं, जिन्हें देखते समय बॉक्स और व्हिस्कर प्लॉट का व्याख्यान करते समय ध्यान देना चाहिए:

  • माध्यांक: माध्यांक डेटा के केंद्र का माप है। एक उच्च माध्यांक इसका सूचना देता है कि डेटा अधिकतर मानों की ओर झुका हुआ है, जबकि एक निम्न माध्यांक इसका सूचना देता है कि डेटा कम मानों की ओर झुका हुआ है।
  • इंटरक्वार्टाइल रेंज: IQR डेटा के फैलाव का माप है। एक बड़ी IQR इसका सूचना देती है कि डेटा ज्यादा फैला हुआ है, जबकि एक छोटी IQR इसका सूचना देती है कि डेटा ज्यादा एकत्रित हुआ है।
  • व्हिस्कर्स: व्हिस्कर्स डेटा की सीमा दिखाते हैं। लंबे व्हिस्कर्स इसका सूचना देते हैं कि डेटा अधिक चर्चित है, जबकि छोटे व्हिस्कर्स इसका सूचना देते हैं कि डेटा कम चर्चित है।
  • बहिष्कृतगण: बहिष्कृतगण डेटा बाकी डेटा से बहुत भिन्न होते हैं। यह डेटा संग्रह करने में त्रुटियों या अनूठे अवलोकनों की उपस्थिति के कारण हो सकते हैं।
एक बॉक्स और व्हिस्कर प्लॉट का उदाहरण

माध्यम ऊंचाई 175 सेमी है। IQR 20 सेमी है। व्हिस्कर्स 150 सेमी से 200 सेमी तक फैले हुए हैं। कोई बहिष्कृतगण नहीं हैं।

यह बॉक्स और व्हिस्कर प्लॉट दिखाता है कि इस समूह में लोगों की ऊँचाई साधारित रूप से वितरित होती है। माध्यांक ऊँचाई और औसत ऊँचाई के करीब है, और IQR निश्चित है। कोई बहिष्कृतगण नहीं हैं, जो इसका सूचना देता है कि कोई विचित्र अवलोकन नहीं हैं।

निष्कर्ष

बॉक्स और व्हिस्कर प्लॉट डेटा के वितरण को विज़ुअलाइज़ करने के लिए एक उपयोगी उपकरण हैं। इसका उपयोग विभिन्न डेटासेटों की तुलना करने और बहिष्कृतगणों की पहचान करने के लिए किया जा सकता है।

बॉक्स और व्हिस्कर प्लॉट घटक

बॉक्स और व्हिस्कर प्लॉट, जिसे बॉक्स प्लॉट भी कहा जाता है, डेटा के वितरण का ग्राफिकल प्रतिनिधित्व है। यह एक डेटासेट के पाँच-संख्या सारांश को प्रदर्शित करने का मानकृत तरीका है: न्यूनतम, प्रथम चतुर्थांश (Q1), माध्यमांश, तृतीय चतुर्थांश (Q3), और अधिकतम।

एक बॉक्स और व्हिस्कर प्लॉट के तत्व

एक बॉक्स और व्हिस्कर प्लॉट निम्नलिखित तत्वों से मिलकर बनता है:

  • मध्यांक: मध्यांक एक डेटासेट में मध्यम मान है जब क्रमबद्ध किया जाता है। यह बॉक्स के बीच में एक रेखा द्वारा प्रतिष्ठित है।
  • बॉक्स: बॉक्स इंटरक्वार्टाइल रेंज (IQR) को प्रतिष्ठित करता है, जो तीसरे क्वार्टाइल (Q3) और पहले क्वार्टाइल (Q1) के बीच का अंतर होता है। IQR डेटा की विविधता का एक माप है।
  • व्हिस्कर्स: व्हिस्कर्स बॉक्स से डेटासेट में न्यूनतम और अधिकतम मानों तक फैलते हैं। व्हिस्कर्स डेटा की सीमा दिखाते हैं।
  • आउटलायर्स: आउटलायर्स वे डेटा बिंदु हैं जो बाकी डेटा से बहुत अलग होते हैं। वे व्हिस्कर्स के बाहर के बिंदुओं द्वारा प्रतिष्ठित होते हैं।
एक बॉक्स और व्हिस्कर प्लॉट का व्याख्यान करना

एक बॉक्स और व्हिस्कर प्लॉट का उपयोग अलग-अलग डेटासेट के वितरणों की तुलना करने के लिए किया जा सकता है। मध्यांक, IQR और डेटासेट के दायरे की तुलना करके, आप डेटा की केंद्रीय प्रवृत्ति, विविधता और फैलाव में अंतरों की पहचान सकते हैं।

बॉक्स और व्हिस्कर प्लॉट आउटलायर्स की पहचान करने के लिए भी उपयोगी होते हैं। आउटलायर्स डेटा में त्रुटियों की प्रतीक हो सकते हैं या वे असामान्य अवलोकनों को प्रतिष्ठित कर सकते हैं जिनका जांच करना महत्वपूर्ण होता है।

डेटासेट में दो आउटलायर्स हैं, जिनका प्रतिनिधित्व परिधियों में 110 सेमी और 240 सेमी पर बिंदुओं द्वारा किया जाता है। इन आउटलायर्स कार. में डेटा की त्रुटियों का संकेत हो सकता है या वे असामान्य अवलोकनों को प्रतिष्ठित कर सकते हैं जिनका जांच करना महत्वपूर्ण होता है।

बॉक्स और व्हिस्कर प्लॉट बनाने के चरण

एक बॉक्स और व्हिस्कर प्लॉट, जिसे बॉक्स प्लॉट भी कहा जाता है, डेटा के वितरण का ग्राफिकल प्रतिष्ठान है। यह एक डेटासेट के पांच-संख्या सारांश: न्यूनतम, पहले क्वार्टाइल (Q1), मध्यांक, तीसरे क्वार्टाइल (Q3) और अधिकतम को प्रदर्शित करने का एक मानकीकृत तरीका है।

बॉक्स और व्हिस्कर प्लॉट बनाने के चरण
  1. अपना डेटा इकट्ठा करें। आपके पास कम से कम पांच डेटा बिंदुओं का एक डेटासेट होना चाहिए।
  2. पांच संख्या सारांश की गणना करें। पांच संख्या सारांश में न्यूनतम, पहले क्वार्टाइल (Q1), मध्यांक, तीसरे क्वार्टाइल (Q3) और अधिकतम होते हैं।
    • न्यूनतम डेटासेट में सबसे छोटा मान है।
    • पहले क्वार्टाइल (Q1) डेटा के निचले आध के मध्यांक होता है।
    • मध्यांक डेटासेट में मध्यम मान है।
    • तीसरे क्वार्टाइल (Q3) डेटा के ऊपरी आध का मध्यांक होता है।
    • अधिकतम डेटासेट में सबसे बड़ा मान है।
  3. एक बॉक्स बनाएं। बॉक्स Q1 से Q3 तक आधारित है। मध्यांक बॉक्स के भीतर की ओर एक रेखा द्वारा चिह्नित होता है।
  4. व्हिस्कर्स बनाएं। व्हिस्कर्स बॉक्स से न्यूनतम और अधिकतम मानों तक फैलते हैं।
  5. लेबल जोड़ें। प्लॉट के अक्षों को उचित इकाइयों के साथ लेबल करें। आप मध्यांक, Q1 और Q3 को भी लेबल करना चाह सकते हैं।
उदाहरण

निम्नलिखित एक बॉक्स और व्हिस्कर प्लॉट का एक उदाहरण है:

इस प्लॉट को बनाने के लिए उपयोग किया गया डेटा है:

10, 15, 20, 25, 30, 35, 40, 45, 50

इस डेटा के लिए पांच संख्या सारांश है:

  • न्यूनतम: 10
  • Q1: 17.5
  • मध्यांक: 30
  • Q3: 42.5
  • अधिकतम: 50

बॉक्स 17.5 से 42.5 तक बनाया गया है। माध्यिका 30 पर बॉक्स के अंदर एक रेखा से चिह्नित की गई है। व्हिस्कर बॉक्स से 10 और 50 तक फैले हैं।

बॉक्स और व्हिस्कर चित्र डेटा के वितरण को दृश्यीकरण करने का एक उपयोगी तरीका है। इसका उपयोग विभिन्न डेटासेट की तुलना करने, बाहरी मानों की पहचान करने और डेटा के स्रोत पर आधारित निष्कर्ष निकालने के लिए किया जा सकता है।

बॉक्स और व्हिस्कर चित्र का महत्व

एक बॉक्स और व्हिस्कर चित्र, जिसे बॉक्स प्लॉट भी कहा जाता है, डेटा के वितरण का एक ग्राफिकल प्रतिनिधित्व है। यह एक डेटासेट के माध्यिका, क्वार्टाइल और अतियोग्य मानों का एक दृश्य सारांश प्रदान करता है। बॉक्स और व्हिस्कर चित्र बहुत सारे डेटासेट की तुलना करने और बाहरी मानों की पहचान करने के लिए उपयोगी होते हैं।

एक बॉक्स और व्हिस्कर चित्र के तत्व

एक बॉक्स और व्हिस्कर चित्र निम्नलिखित तत्वों से मिलकर बना होता है:

  • माध्यिका: माध्यिका एक डेटासेट का मध्यवर्ती मान होती है जबकि उन्हें संख्यात्मक क्रम में व्यवस्थित किया जाता है। यह बॉक्स के बीच में एक रेखा द्वारा प्रतिष्ठित होती है।
  • क्वार्टाइल्स: क्वार्टाइल्स एक डेटासेट को चार बराबर भागों में बाँट देते हैं। पहला क्वार्टाइल (Q1) उस मान से नीचे होता है जिसके 25% डेटा पड़ते हैं। दूसरा क्वार्टाइल (Q2) माध्यिका होता है। तीसरा क्वार्टाइल (Q3) उस मान से नीचे होता है जिसके 75% डेटा पड़ते हैं।
  • इंटरक्वार्टाइल रेंज (IQR): IQR Q3 और Q1 के बीच का अंतर है। यह डेटा के मध्य 50% के छलनी को दर्शाता है।
  • व्हिस्कर्स: व्हिस्कर्स क्वार्टाइल्स से डेटासेट में सबसे अतियोग्य मानों तक फैलते हैं। वे डेटा की रेंज दिखाते हैं।
  • बहिरी मान (आउटलायर्स): अतियोग्य मान वे मान हैं जो अन्य डेटा से विशेष रूप से अलग होते हैं। वे व्हिस्कर्स के बाहरी बाइंडर्स द्वारा प्रतिष्ठित होते हैं।
बॉक्स और व्हिस्कर चित्र का महत्व

बॉक्स और व्हिस्कर चित्र निम्नलिखित कारणों से महत्वपूर्ण हैं:

  • वे डेटा के वितरण का एक दृश्य सारांश प्रदान करते हैं। बॉक्स और व्हिस्कर चित्र आपको त्वरितता से माध्यिका, क्वार्टाइल्स और अतियोग्य मानों को देखने की अनुमति देते हैं। यह जानकारी डेटा के सम्पूर्ण आकार को समझने और किसी अनोखे पैटर्न की पहचान करने के लिए मददगार हो सकती है।
  • वे अतियोग्य मानों की पहचान करने में मदद करते हैं। अतियोग्य मानों की पहचान करना महत्वपूर्ण हो सकता है क्योंकि यह डेटा में त्रुटियों या असामान्य अवलोकनों की सूचना दे सकते हैं।
  • वे एकाधिक डेटासेट की आसान तुलना करने की सुविधा प्रदान करते हैं। बॉक्स और व्हिस्कर चित्र एकाधिक डेटासेट की वितरण की तुलना करने के लिए उपयोगी हो सकते हैं। यह समूहों या उपचारों के बीच अंतरों की पहचान करने के लिए मददगार हो सकती है।

बॉक्स और व्हिस्कर चित्र डेटा के वितरण को दृश्यीकरण करने के लिए एक शक्तिशाली उपकरण हैं। उन्हें बनाना और समझना आसान होता है, और वहां से मूल्यवान जानकारी प्रदान कर सकते हैं।

बॉक्स और व्हिस्कर चित्र हल किए गए उदाहरण

एक बॉक्स और व्हिस्कर चित्र, जिसे बॉक्स प्लॉट भी कहा जाता है, डेटा के वितरण का एक ग्राफिकल प्रतिनिधित्व है। यह माध्यिका, क्वार्टाइल्स और अतियोग्य मानों को दिखाता है।

उदाहरण 1: माध्यिका, क्वार्टाइल्स और अतियोग्य मानों की पहचान

निम्नलिखित डेटासेट को विचार करें:

10, 15, 20, 25, 30, 35, 40, 45, 50

औसत, चौथाई, और अत्यंत मान ढूंढ़ने के लिए, हम पहले डेटा को आरोही क्रम में व्यवस्थित करते हैं:

10, 15, 20, 25, 30, 35, 40, 45, 50

माध्यिका, सामग्री की व्यवस्थितता का मध्य मान है। इस मामले में, माध्यिका 30 है।

चौथाई सामग्री को व्यवस्थित करने के लिए, हम पहले आधी डेटा की माध्यिका लेते हैं:

10, 15, 20, 25

इस आंकड़े की माध्यिका 17.5 है।

तीसरी चौथाई का पता लगाने के लिए, हम दूसरी आधी डेटा की माध्यिका लेते हैं:

35, 40, 45, 50

इस आंकड़े की माध्यिका 42.5 है।

अत्यंत मान डेटा में सबसे छोटे और सबसे बड़े मान हैं। इस मामले में, अत्यंत मान 10 और 50 हैं।

उदाहरण 2: एक बॉक्स और व्हिस्कर प्लॉट का अनुपात समझना

उदाहरण 2 में दिए गए बॉक्स और व्हिस्कर प्लॉट से पता चलता है कि सामग्री की माध्यिका 30 है। चौथाई 17.5 और 42.5 हैं। अत्यंत मान 10 और 50 हैं।

बॉक्स और व्हिस्कर प्लॉट भी दिखाता है कि डेटा दाहिने की ओर झुका हुआ है। इसका मतलब है कि माध्यिका से ऊपर अधिक मान हैं।

निष्कर्ष

बॉक्स और व्हिस्कर प्लॉट डेटा के वितरण को दृश्यीय बनाने के लिए एक उपयोगी उपकरण हैं। इसका उपयोग एक सामग्री की माध्यिका, चौथैयों और अत्यंत मानों का पता लगाने के लिए किया जा सकता है। इसे विभिन्न डेटासेट की तुलना करने के लिए भी इस्तेमाल किया जा सकता है।

बॉक्स और व्हिस्कर प्लॉट पूछे जाने वाले प्रश्न

बॉक्स और व्हिस्कर प्लॉट क्या है?

बॉक्स और व्हिस्कर प्लॉट डेटा के वितरण का ग्राफिकल प्रतिनिधित्व है। इसमें सामग्री की माध्यिका, चौथैयों, और विचलित मानों को दिखाया जाता है।

बॉक्स और व्हिस्कर प्लॉट के विभिन्न हिस्से क्या हैं?

बॉक्स और व्हिस्कर प्लॉट के विभिन्न हिस्से हैं:

  • बॉक्स: बॉक्स सामग्री के मध्य 50% को प्रतिनिधित्व करता है। बॉक्स की निचली सीमा पहली चौथाई (Q1) होती है, और ऊपरी सीमा तीसरी चौथाई (Q3) होती है।
  • माध्यिका: माध्यिका डेटासेट का मध्य आंकड़ा है। इसे एक रेखा द्वारा बॉक्स के बीच में प्रतिष्ठित किया जाता है।
  • व्हिस्कर्स: व्हिस्कर्स बॉक्स से डेटा के न्यूनतम और अधिकतम मानों तक फैलते हैं।
  • विचलित मान: विचलित मान वे डेटा बिंदु होते हैं जो समग्र डेटा से बहुत अलग होते हैं। वे व्हिस्कर के बाहरी बिंदुओं द्वारा प्रतिष्ठित किये जाते हैं।

बॉक्स और व्हिस्कर प्लॉट को कैसे समझें?

एक बॉक्स और व्हिस्कर प्लॉट को समझने के लिए, आप निम्नलिखित को देख सकते हैं:

  • माध्यिका: माध्यिका डेटा के केंद्र का माप है। यह विचलनकारी मानों से प्रभावित नहीं होती है।

  • चौथैयां: चौथैयां डेटा को चार बराबर भागों में विभाजित करती हैं। पहली चौथाई (Q1) डेटा के निचले आधे की माध्यिका होती है, और तीसरी चौथाई (Q3) ऊपरी आधे की माध्यिका होती है।

  • व्हिस्कर्स: व्हिस्कर्स सामग्री की दायरा दिखाते हैं। वे बॉक्स से डेटा के न्यूनतम और अधिकतम मानों तक फैलते हैं।

  • द्विगुली: द्विगुली डेटा बिंदु हैं जो बाकी डेटा से सार्थक रूप से भिन्न होते हैं। इन्हें व्हिस्कर्स के बाहरी बिंदुओं द्वारा प्रतिष्ठित किया जाता है।

बॉक्स और व्हिस्कर प्लॉट का कुछ उपयोग क्या हैं?

बॉक्स और व्हिस्कर प्लॉट का उपयोग करके निम्न कार्य संपादित कर सकते हैं:

  • दो या अधिक डेटासेट की वितरण की तुलना करें।
  • एक डेटासेट में द्विगुली बिंदुओं की पहचान करें।
  • एक डेटासेट की सीमा देखें।
  • एक डेटासेट की केंद्र की भावना प्राप्त करें।

निष्कर्ष

बॉक्स और व्हिस्कर प्लॉट डेटा की वितरण को दर्शाने के लिए एक शक्तिशाली उपकरण हैं। इन्हें डेटासेटों की तुलना करने, द्विगुली बिंदुओं की पहचान करने, सीमा और केंद्र को देखने के लिए उपयोग किया जा सकता है।