Maths Box And Whisker Plot
बॉक्स और व्हिस्कर प्लॉट
बॉक्स और व्हिस्कर प्लॉट, जिसे बॉक्स प्लॉट भी कहा जाता है, डेटा के वितरण का ग्राफिकल प्रतिनिधित्व है। यह एक डेटासेट के पाँच-संख्या सारांश को प्रदर्शित करने का मानकृत तरीका है: न्यूनतम, प्रथम चतुर्थांश (Q1), माध्यमांश, तृतीय चतुर्थांश (Q3), और अधिकतम।
बॉक्स और व्हिस्कर प्लॉट के घटक
बॉक्स और व्हिस्कर प्लॉट निम्नलिखित घटकों से मिलकर बना होता है:
- माध्यांक: माध्यांक संख्यात्मक क्रम में व्यवस्थित किए गए डेटासेट का मध्यमांक होता है। इसे एक बॉक्स के बीच की रेखा द्वारा प्रतिष्ठित किया जाता है।
- बॉक्स: बॉक्स इंटरक्वार्टाइल रेंज (IQR) को प्रतिष्ठान करता है, जो तृतीय चतुर्थांश (Q3) और प्रथम चतुर्थांश (Q1) के बीच का अंतर होता है। IQR डेटा के फैलाव का माप है।
- व्हिस्कर्स: व्हिस्कर्स बॉक्स से डेटासेट के न्यूनतम और अधिकतम मानों तक फैलाते हैं। व्हिस्कर्स डेटा की सीमा दिखाते हैं।
- बहिष्कृतगण: बहिष्कृतगण डेटा बाकी डेटा से बहुत भिन्न होते हैं। वे व्हिस्कर्स के बाहर एकल बिंदुओं द्वारा प्रतिष्ठित किए जाते हैं।
बॉक्स और व्हिस्कर प्लॉट का व्याख्यान
बॉक्स और व्हिस्कर प्लॉट का उपयोग विभिन्न डेटासेट के वितरणों की तुलना करने के लिए किया जा सकता है। इसका उपयोग बहिष्कृतगणों की पहचान करने के लिए भी किया जा सकता है।
यहां कुछ बातें हैं, जिन्हें देखते समय बॉक्स और व्हिस्कर प्लॉट का व्याख्यान करते समय ध्यान देना चाहिए:
- माध्यांक: माध्यांक डेटा के केंद्र का माप है। एक उच्च माध्यांक इसका सूचना देता है कि डेटा अधिकतर मानों की ओर झुका हुआ है, जबकि एक निम्न माध्यांक इसका सूचना देता है कि डेटा कम मानों की ओर झुका हुआ है।
- इंटरक्वार्टाइल रेंज: IQR डेटा के फैलाव का माप है। एक बड़ी IQR इसका सूचना देती है कि डेटा ज्यादा फैला हुआ है, जबकि एक छोटी IQR इसका सूचना देती है कि डेटा ज्यादा एकत्रित हुआ है।
- व्हिस्कर्स: व्हिस्कर्स डेटा की सीमा दिखाते हैं। लंबे व्हिस्कर्स इसका सूचना देते हैं कि डेटा अधिक चर्चित है, जबकि छोटे व्हिस्कर्स इसका सूचना देते हैं कि डेटा कम चर्चित है।
- बहिष्कृतगण: बहिष्कृतगण डेटा बाकी डेटा से बहुत भिन्न होते हैं। यह डेटा संग्रह करने में त्रुटियों या अनूठे अवलोकनों की उपस्थिति के कारण हो सकते हैं।
एक बॉक्स और व्हिस्कर प्लॉट का उदाहरण
माध्यम ऊंचाई 175 सेमी है। IQR 20 सेमी है। व्हिस्कर्स 150 सेमी से 200 सेमी तक फैले हुए हैं। कोई बहिष्कृतगण नहीं हैं।
यह बॉक्स और व्हिस्कर प्लॉट दिखाता है कि इस समूह में लोगों की ऊँचाई साधारित रूप से वितरित होती है। माध्यांक ऊँचाई और औसत ऊँचाई के करीब है, और IQR निश्चित है। कोई बहिष्कृतगण नहीं हैं, जो इसका सूचना देता है कि कोई विचित्र अवलोकन नहीं हैं।
निष्कर्ष
बॉक्स और व्हिस्कर प्लॉट डेटा के वितरण को विज़ुअलाइज़ करने के लिए एक उपयोगी उपकरण हैं। इसका उपयोग विभिन्न डेटासेटों की तुलना करने और बहिष्कृतगणों की पहचान करने के लिए किया जा सकता है।
बॉक्स और व्हिस्कर प्लॉट घटक
बॉक्स और व्हिस्कर प्लॉट, जिसे बॉक्स प्लॉट भी कहा जाता है, डेटा के वितरण का ग्राफिकल प्रतिनिधित्व है। यह एक डेटासेट के पाँच-संख्या सारांश को प्रदर्शित करने का मानकृत तरीका है: न्यूनतम, प्रथम चतुर्थांश (Q1), माध्यमांश, तृतीय चतुर्थांश (Q3), और अधिकतम।
एक बॉक्स और व्हिस्कर प्लॉट के तत्व
एक बॉक्स और व्हिस्कर प्लॉट निम्नलिखित तत्वों से मिलकर बनता है:
- मध्यांक: मध्यांक एक डेटासेट में मध्यम मान है जब क्रमबद्ध किया जाता है। यह बॉक्स के बीच में एक रेखा द्वारा प्रतिष्ठित है।
- बॉक्स: बॉक्स इंटरक्वार्टाइल रेंज (IQR) को प्रतिष्ठित करता है, जो तीसरे क्वार्टाइल (Q3) और पहले क्वार्टाइल (Q1) के बीच का अंतर होता है। IQR डेटा की विविधता का एक माप है।
- व्हिस्कर्स: व्हिस्कर्स बॉक्स से डेटासेट में न्यूनतम और अधिकतम मानों तक फैलते हैं। व्हिस्कर्स डेटा की सीमा दिखाते हैं।
- आउटलायर्स: आउटलायर्स वे डेटा बिंदु हैं जो बाकी डेटा से बहुत अलग होते हैं। वे व्हिस्कर्स के बाहर के बिंदुओं द्वारा प्रतिष्ठित होते हैं।
एक बॉक्स और व्हिस्कर प्लॉट का व्याख्यान करना
एक बॉक्स और व्हिस्कर प्लॉट का उपयोग अलग-अलग डेटासेट के वितरणों की तुलना करने के लिए किया जा सकता है। मध्यांक, IQR और डेटासेट के दायरे की तुलना करके, आप डेटा की केंद्रीय प्रवृत्ति, विविधता और फैलाव में अंतरों की पहचान सकते हैं।
बॉक्स और व्हिस्कर प्लॉट आउटलायर्स की पहचान करने के लिए भी उपयोगी होते हैं। आउटलायर्स डेटा में त्रुटियों की प्रतीक हो सकते हैं या वे असामान्य अवलोकनों को प्रतिष्ठित कर सकते हैं जिनका जांच करना महत्वपूर्ण होता है।
डेटासेट में दो आउटलायर्स हैं, जिनका प्रतिनिधित्व परिधियों में 110 सेमी और 240 सेमी पर बिंदुओं द्वारा किया जाता है। इन आउटलायर्स कार. में डेटा की त्रुटियों का संकेत हो सकता है या वे असामान्य अवलोकनों को प्रतिष्ठित कर सकते हैं जिनका जांच करना महत्वपूर्ण होता है।
बॉक्स और व्हिस्कर प्लॉट बनाने के चरण
एक बॉक्स और व्हिस्कर प्लॉट, जिसे बॉक्स प्लॉट भी कहा जाता है, डेटा के वितरण का ग्राफिकल प्रतिष्ठान है। यह एक डेटासेट के पांच-संख्या सारांश: न्यूनतम, पहले क्वार्टाइल (Q1), मध्यांक, तीसरे क्वार्टाइल (Q3) और अधिकतम को प्रदर्शित करने का एक मानकीकृत तरीका है।
बॉक्स और व्हिस्कर प्लॉट बनाने के चरण
- अपना डेटा इकट्ठा करें। आपके पास कम से कम पांच डेटा बिंदुओं का एक डेटासेट होना चाहिए।
- पांच संख्या सारांश की गणना करें। पांच संख्या सारांश में न्यूनतम, पहले क्वार्टाइल (Q1), मध्यांक, तीसरे क्वार्टाइल (Q3) और अधिकतम होते हैं।
- न्यूनतम डेटासेट में सबसे छोटा मान है।
- पहले क्वार्टाइल (Q1) डेटा के निचले आध के मध्यांक होता है।
- मध्यांक डेटासेट में मध्यम मान है।
- तीसरे क्वार्टाइल (Q3) डेटा के ऊपरी आध का मध्यांक होता है।
- अधिकतम डेटासेट में सबसे बड़ा मान है।
- एक बॉक्स बनाएं। बॉक्स Q1 से Q3 तक आधारित है। मध्यांक बॉक्स के भीतर की ओर एक रेखा द्वारा चिह्नित होता है।
- व्हिस्कर्स बनाएं। व्हिस्कर्स बॉक्स से न्यूनतम और अधिकतम मानों तक फैलते हैं।
- लेबल जोड़ें। प्लॉट के अक्षों को उचित इकाइयों के साथ लेबल करें। आप मध्यांक, Q1 और Q3 को भी लेबल करना चाह सकते हैं।
उदाहरण
निम्नलिखित एक बॉक्स और व्हिस्कर प्लॉट का एक उदाहरण है:
इस प्लॉट को बनाने के लिए उपयोग किया गया डेटा है:
10, 15, 20, 25, 30, 35, 40, 45, 50
इस डेटा के लिए पांच संख्या सारांश है:
- न्यूनतम: 10
- Q1: 17.5
- मध्यांक: 30
- Q3: 42.5
- अधिकतम: 50
बॉक्स 17.5 से 42.5 तक बनाया गया है। माध्यिका 30 पर बॉक्स के अंदर एक रेखा से चिह्नित की गई है। व्हिस्कर बॉक्स से 10 और 50 तक फैले हैं।
बॉक्स और व्हिस्कर चित्र डेटा के वितरण को दृश्यीकरण करने का एक उपयोगी तरीका है। इसका उपयोग विभिन्न डेटासेट की तुलना करने, बाहरी मानों की पहचान करने और डेटा के स्रोत पर आधारित निष्कर्ष निकालने के लिए किया जा सकता है।
बॉक्स और व्हिस्कर चित्र का महत्व
एक बॉक्स और व्हिस्कर चित्र, जिसे बॉक्स प्लॉट भी कहा जाता है, डेटा के वितरण का एक ग्राफिकल प्रतिनिधित्व है। यह एक डेटासेट के माध्यिका, क्वार्टाइल और अतियोग्य मानों का एक दृश्य सारांश प्रदान करता है। बॉक्स और व्हिस्कर चित्र बहुत सारे डेटासेट की तुलना करने और बाहरी मानों की पहचान करने के लिए उपयोगी होते हैं।
एक बॉक्स और व्हिस्कर चित्र के तत्व
एक बॉक्स और व्हिस्कर चित्र निम्नलिखित तत्वों से मिलकर बना होता है:
- माध्यिका: माध्यिका एक डेटासेट का मध्यवर्ती मान होती है जबकि उन्हें संख्यात्मक क्रम में व्यवस्थित किया जाता है। यह बॉक्स के बीच में एक रेखा द्वारा प्रतिष्ठित होती है।
- क्वार्टाइल्स: क्वार्टाइल्स एक डेटासेट को चार बराबर भागों में बाँट देते हैं। पहला क्वार्टाइल (Q1) उस मान से नीचे होता है जिसके 25% डेटा पड़ते हैं। दूसरा क्वार्टाइल (Q2) माध्यिका होता है। तीसरा क्वार्टाइल (Q3) उस मान से नीचे होता है जिसके 75% डेटा पड़ते हैं।
- इंटरक्वार्टाइल रेंज (IQR): IQR Q3 और Q1 के बीच का अंतर है। यह डेटा के मध्य 50% के छलनी को दर्शाता है।
- व्हिस्कर्स: व्हिस्कर्स क्वार्टाइल्स से डेटासेट में सबसे अतियोग्य मानों तक फैलते हैं। वे डेटा की रेंज दिखाते हैं।
- बहिरी मान (आउटलायर्स): अतियोग्य मान वे मान हैं जो अन्य डेटा से विशेष रूप से अलग होते हैं। वे व्हिस्कर्स के बाहरी बाइंडर्स द्वारा प्रतिष्ठित होते हैं।
बॉक्स और व्हिस्कर चित्र का महत्व
बॉक्स और व्हिस्कर चित्र निम्नलिखित कारणों से महत्वपूर्ण हैं:
- वे डेटा के वितरण का एक दृश्य सारांश प्रदान करते हैं। बॉक्स और व्हिस्कर चित्र आपको त्वरितता से माध्यिका, क्वार्टाइल्स और अतियोग्य मानों को देखने की अनुमति देते हैं। यह जानकारी डेटा के सम्पूर्ण आकार को समझने और किसी अनोखे पैटर्न की पहचान करने के लिए मददगार हो सकती है।
- वे अतियोग्य मानों की पहचान करने में मदद करते हैं। अतियोग्य मानों की पहचान करना महत्वपूर्ण हो सकता है क्योंकि यह डेटा में त्रुटियों या असामान्य अवलोकनों की सूचना दे सकते हैं।
- वे एकाधिक डेटासेट की आसान तुलना करने की सुविधा प्रदान करते हैं। बॉक्स और व्हिस्कर चित्र एकाधिक डेटासेट की वितरण की तुलना करने के लिए उपयोगी हो सकते हैं। यह समूहों या उपचारों के बीच अंतरों की पहचान करने के लिए मददगार हो सकती है।
बॉक्स और व्हिस्कर चित्र डेटा के वितरण को दृश्यीकरण करने के लिए एक शक्तिशाली उपकरण हैं। उन्हें बनाना और समझना आसान होता है, और वहां से मूल्यवान जानकारी प्रदान कर सकते हैं।
बॉक्स और व्हिस्कर चित्र हल किए गए उदाहरण
एक बॉक्स और व्हिस्कर चित्र, जिसे बॉक्स प्लॉट भी कहा जाता है, डेटा के वितरण का एक ग्राफिकल प्रतिनिधित्व है। यह माध्यिका, क्वार्टाइल्स और अतियोग्य मानों को दिखाता है।
उदाहरण 1: माध्यिका, क्वार्टाइल्स और अतियोग्य मानों की पहचान
निम्नलिखित डेटासेट को विचार करें:
10, 15, 20, 25, 30, 35, 40, 45, 50
औसत, चौथाई, और अत्यंत मान ढूंढ़ने के लिए, हम पहले डेटा को आरोही क्रम में व्यवस्थित करते हैं:
10, 15, 20, 25, 30, 35, 40, 45, 50
माध्यिका, सामग्री की व्यवस्थितता का मध्य मान है। इस मामले में, माध्यिका 30 है।
चौथाई सामग्री को व्यवस्थित करने के लिए, हम पहले आधी डेटा की माध्यिका लेते हैं:
10, 15, 20, 25
इस आंकड़े की माध्यिका 17.5 है।
तीसरी चौथाई का पता लगाने के लिए, हम दूसरी आधी डेटा की माध्यिका लेते हैं:
35, 40, 45, 50
इस आंकड़े की माध्यिका 42.5 है।
अत्यंत मान डेटा में सबसे छोटे और सबसे बड़े मान हैं। इस मामले में, अत्यंत मान 10 और 50 हैं।
उदाहरण 2: एक बॉक्स और व्हिस्कर प्लॉट का अनुपात समझना
उदाहरण 2 में दिए गए बॉक्स और व्हिस्कर प्लॉट से पता चलता है कि सामग्री की माध्यिका 30 है। चौथाई 17.5 और 42.5 हैं। अत्यंत मान 10 और 50 हैं।
बॉक्स और व्हिस्कर प्लॉट भी दिखाता है कि डेटा दाहिने की ओर झुका हुआ है। इसका मतलब है कि माध्यिका से ऊपर अधिक मान हैं।
निष्कर्ष
बॉक्स और व्हिस्कर प्लॉट डेटा के वितरण को दृश्यीय बनाने के लिए एक उपयोगी उपकरण हैं। इसका उपयोग एक सामग्री की माध्यिका, चौथैयों और अत्यंत मानों का पता लगाने के लिए किया जा सकता है। इसे विभिन्न डेटासेट की तुलना करने के लिए भी इस्तेमाल किया जा सकता है।
बॉक्स और व्हिस्कर प्लॉट पूछे जाने वाले प्रश्न
बॉक्स और व्हिस्कर प्लॉट क्या है?
बॉक्स और व्हिस्कर प्लॉट डेटा के वितरण का ग्राफिकल प्रतिनिधित्व है। इसमें सामग्री की माध्यिका, चौथैयों, और विचलित मानों को दिखाया जाता है।
बॉक्स और व्हिस्कर प्लॉट के विभिन्न हिस्से क्या हैं?
बॉक्स और व्हिस्कर प्लॉट के विभिन्न हिस्से हैं:
- बॉक्स: बॉक्स सामग्री के मध्य 50% को प्रतिनिधित्व करता है। बॉक्स की निचली सीमा पहली चौथाई (Q1) होती है, और ऊपरी सीमा तीसरी चौथाई (Q3) होती है।
- माध्यिका: माध्यिका डेटासेट का मध्य आंकड़ा है। इसे एक रेखा द्वारा बॉक्स के बीच में प्रतिष्ठित किया जाता है।
- व्हिस्कर्स: व्हिस्कर्स बॉक्स से डेटा के न्यूनतम और अधिकतम मानों तक फैलते हैं।
- विचलित मान: विचलित मान वे डेटा बिंदु होते हैं जो समग्र डेटा से बहुत अलग होते हैं। वे व्हिस्कर के बाहरी बिंदुओं द्वारा प्रतिष्ठित किये जाते हैं।
बॉक्स और व्हिस्कर प्लॉट को कैसे समझें?
एक बॉक्स और व्हिस्कर प्लॉट को समझने के लिए, आप निम्नलिखित को देख सकते हैं:
-
माध्यिका: माध्यिका डेटा के केंद्र का माप है। यह विचलनकारी मानों से प्रभावित नहीं होती है।
-
चौथैयां: चौथैयां डेटा को चार बराबर भागों में विभाजित करती हैं। पहली चौथाई (Q1) डेटा के निचले आधे की माध्यिका होती है, और तीसरी चौथाई (Q3) ऊपरी आधे की माध्यिका होती है।
-
व्हिस्कर्स: व्हिस्कर्स सामग्री की दायरा दिखाते हैं। वे बॉक्स से डेटा के न्यूनतम और अधिकतम मानों तक फैलते हैं।
-
द्विगुली: द्विगुली डेटा बिंदु हैं जो बाकी डेटा से सार्थक रूप से भिन्न होते हैं। इन्हें व्हिस्कर्स के बाहरी बिंदुओं द्वारा प्रतिष्ठित किया जाता है।
बॉक्स और व्हिस्कर प्लॉट का कुछ उपयोग क्या हैं?
बॉक्स और व्हिस्कर प्लॉट का उपयोग करके निम्न कार्य संपादित कर सकते हैं:
- दो या अधिक डेटासेट की वितरण की तुलना करें।
- एक डेटासेट में द्विगुली बिंदुओं की पहचान करें।
- एक डेटासेट की सीमा देखें।
- एक डेटासेट की केंद्र की भावना प्राप्त करें।
निष्कर्ष
बॉक्स और व्हिस्कर प्लॉट डेटा की वितरण को दर्शाने के लिए एक शक्तिशाली उपकरण हैं। इन्हें डेटासेटों की तुलना करने, द्विगुली बिंदुओं की पहचान करने, सीमा और केंद्र को देखने के लिए उपयोग किया जा सकता है।