अध्याय 02 आंकड़ों का प्रक्रमण
आप पिछले अध्याय में पढ़ चुके हैं कि आंकड़ों का संगठन तथा प्रस्तुतीकरण उन्हें बोधगम्य बनाता है। इससे आंकड़ों का प्रक्रमण सरल हो जाता हैं। आंकड़ों के विश्लेषण के लिए अनेक विधियों को उपयोग किया जाता है। उदाहरणत:
- केंद्रीय प्रवृत्ति के माप
- प्रकीर्णन के माप
- संबंध के माप
जहाँ केंद्रीय प्रवृत्ति के माप पर्यवेक्षणों के समूह का आदर्श प्रतिनिधिकारी मूल्य प्रस्तुत करते हैं, वहीं प्रकीर्णन के माप आंकड़ों की आंतरिक विषमताओं का ब्यौरा देते हैं, जो अक्सर केंद्रीय प्रवृत्ति के माप के संदर्भ में होते हैं। दूसरी ओर संबंध के माप दो या दो से अधिक घटनाओं जैसे वर्षा तथा बाढ़ की घटना अथवा उर्वरकों का उपभोग तथा फ़सलों की उपज के मध्य साहचर्य की गहनता प्रस्तुत करते हैं। इस अध्याय में आप केंद्रीय प्रवृत्ति के माप के विषय में जानेंगे।
केंद्रीय प्रवृत्ति के माप
मापनीय विशेषताएँ जैसे वर्षा, ऊँचाई, जनसंख्या का घनत्व, उपलब्धियों के स्तर अथवा आयु वर्ग में विभिन्नताएँ पाई जाती हैं। यदि हमें उनको समझना है, तो हमें क्या करना होगा? उसके लिए हमें कदाचित एक मूल्य या मान की आवश्यकता होगी जो पर्यवेक्षणों के समूह का सर्वोत्तम प्रतिनिधित्व करता हो। यह एकल मान सामान्यतः वितरण के किसी भी छोर पर होने की बजाय उसके केंद्र के निकट स्थित होता है। वितरण का केंद्र ज्ञात करने वाली सांख्यिकीय विधियों को केंद्रीय प्रवृत्ति के माप के नाम से जाना जाता है। केंद्रीय प्रवृत्ति की द्योतक संख्या सारे आंकड़ों के समूह की प्रतिनिधि संख्या होती है क्योंकि यह उस बिंदु की प्रतीक होती है जिसके निकट इकाइयों के समूहन की प्रवृत्ति होती है।
केंद्रीय प्रवृत्ति के मापों को सांख्यिकीय औसत के नाम से भी जाना जाता है। केंद्रीय प्रवृत्ति के कई माप हैं जिनमें माध्य, माध्यिका तथा बहुलक सबसे महत्वपूर्ण हैं।
माध्य
माध्य वह मान है जो सभी मूल्यों के योग को कुल प्रेक्षणों की संख्या से विभाजित करने पर प्राप्त होता है।
माध्यिका
माध्यिका उस कोटि का मान होता है जो व्यवस्थित श्रेणी को दो बराबर संख्याओं में विभाजित करता है। यह मान वास्तविक मूल्यों से स्वतंत्र होता है। आंकड़ों को बढ़ते अथवा घटते क्रम में व्यवस्थित करना माध्यम की गणना में सबसे अधिक महत्वपूर्ण हैं। सम संख्याए होने पर दो मध्यस्थ कोटि मानों का औसत माध्यिका होगा।
बहुलक
किसी बिंदु या मान की अधिकतम पुनरावृत्ति अथवा आवृत्ति बहुलक होती है। आपने देखा होगा कि इनमें से प्रत्येक भिन्न-भिन्न प्रकार के आंकड़ों के समूह के लिए उपयुक्त एकल प्रतिनिधि संख्या निर्धारित करने को अलग विधि है।
माध्य
किसी चर के विभिन्न मूल्यों का साधारण अंकगणितीय औसत माध्य कहलाता है। अवर्गीकृत तथा वर्गीकृत आंकड़ों के लिए माध्य ज्ञात करने की विधियाँ निश्चित ही भिन्न हैं। वर्गीकृत व अवर्गीकृत दोनों प्रकार के आंकड़ों के लिए माध्य प्रत्यक्ष व अप्रत्यक्ष विधियों के द्वारा ज्ञात किया जा सकता है।
अवर्गीकृत आंकड़ों से माध्य की गणना
प्रत्यक्ष विधि
अवर्गीकृत आंकड़ों से प्रत्यक्ष विधि द्वारा माध्य की गणना करने के लिए पर्यवेक्षण के सभी मूल्यों को जोड़ कर घटनाओं/पदों की कुल संख्या से भाग देते हैं। इस प्रकार माध्य की गणना निम्नांकित सूत्र के उपयोग द्वारा की जाती है।
जिसमें
सारणी 2.1 : माध्य वर्षा की गणना
मालवा के पठार के जिले |
सामान्य वर्षा (मि.मी. में) |
अप्रत्यक्ष विधि |
---|---|---|
प्रत्यक्ष विधि |
||
इंदौर | 979 | 179 |
देवास | 1083 | 283 |
धार | 833 | 33 |
रतलाम | 896 | 96 |
उज्जैन | 891 | 91 |
मंदसौर | 825 | 25 |
शाजापुर | 977 | 177 |
6484 | 884 | |
926.29 | 126.29 |
उदाहरण 2.1 : मध्य प्रदेश में मालवा पठार के विभिन्न ज़िलों की, तालिका-2.1 में दी गई वर्षा के आधार पर उस क्षेत्र की माध्य वर्षा की गणना कीजिए।
- जिसमें 800 कल्पित माध्य है; d कल्पित माध्य से विचलन है।
तालिका 2.1 में दिए आंकड़ों के लिए माध्य की गणना निम्न विधि से की जाएगी-
माध्य की गणना से यह समझा जा सकता है कि वर्षा के अपरिष्कृत आंकड़ों का सीधा योग कर लिया गया है तथा उस योग को कुल पदों की संख्या अर्थात् (ज़िलों की संख्या) से विभाजित किया गया है। अतः इसे प्रत्यक्ष विधि कहते हैं।
अप्रत्यक्ष विधि
श्रेणी में जहाँ प्रेक्षणों की संख्याएँ बहुत अधिक होती हैं, वहाँ सामान्यतः अप्रत्यक्ष विधि से माध्य की गणना की जाती है। इस विधि में एक स्थिरांक को सभी मूल्यों से घटाने पर प्रेक्षणों की संख्या विस्तार कम हो जाती है। उदाहरण के लिए जैसा तालिका 2.1 में दर्शाया गया है, वर्षा के मान 800 से 1100 मिलीमीटर तक हैं। एक ‘कल्पित माध्य’ मानकर हम इन संख्याओं के विस्तार को कम कर सकते हैं। इस उदाहरण में हमने कल्पित माध्य 800 माना है। इस क्रिया को ‘कूट पद्धति’ कहते हैं। इसके पश्चात् घटाए हुए मूल्यों के आधार पर माध्य की गणना कर ली जाती है (तालिका-2.1 में स्तंभ-3)।
अप्रत्यक्ष विधि से माध्य की गणना निम्न सूत्र से की जाती है-
जिसमें,
तालिका-2.1 में दिए गए आंकड़ों के लिए अप्रत्यक्ष विधि द्वारा माध्य की गणना निम्नविधि से की जा सकती है-
यहाँ यह ध्यान देने योग्य तथ्य है कि चाहे किसी भी विधि से माध्य की गणना की गई हो, उसका मानसमान ही आता है।
वर्गीकृत आंकड़ों से माध्य की गणना
वर्गीकृत आंकड़ों से भी प्रत्यक्ष या अप्रत्यक्ष विधियों से माध्य की गणना की जाती है।
प्रत्यक्ष विधि
जब आवृत्ति वितरण के रूप में आँकड़े वर्गीकृत हों तो उसमें एकाकी मूल्य अपनी पहचान खो देते हैं। इन सभी मूल्यों का प्रतिनिधित्व वर्ग अंतराल के मध्य बिंदुओं द्वारा होता है, जहाँ वे स्थित हैं। प्रत्यक्ष विधि से वर्गीकृत आंकड़ों के लिए माध्य की गणना करते समय प्रत्येक वर्ग के मध्य बिंदुओं से संबंधित आवृत्ति (
जिसमें,
उदाहरण 2.2 : तालिका-2.2 में दिए गए आंकड़ों के प्रयोग से फैक्ट्री में काम करने वालों की माध्य मजदूरी दर की गणना कीजिए
तालिका 2.2 : फैक्ट्री श्रमिकों की मजदूरी दर
मजनूरी (रु./दिन) | शमिकों की संख्या (f) |
---|---|
वर्ग | |
50-70 | 10 |
70-90 | 20 |
90-110 | 25 |
110-130 | 35 |
130-150 | 9 |
तालिका
वर्ग | आवृत्ति (f) |
मध्य- बिंदु |
|||||
---|---|---|---|---|---|---|---|
50-70 | 10 | 60 | 600 | -40 | -400 | -2 | -20 |
70-90 | 20 | 80 | 1,600 | -20 | -400 | -1 | -20 |
90 - 110 | 25 | 100 | 2,500 | 0 | 0 | 0 | 0 |
110-130 | 35 | 120 | 4,200 | 20 | 700 | 1 | 35 |
130-150 | 9 | 140 | 1,260 | 40 | 360 | 2 | 18 |
तथा | |||||||
10,160 | 260 | 13 |
जिसमें,
तालिका-2.3 में वर्गीकृत आंकड़ों के लिए माध्य की गणना करने की विधि दी गई है। दिए हुए आवृत्ति वितरण में 99 मजदूरों को पारिश्रमिक दर के पाँच वर्गों में बाँटा गया है। इन वर्ग विस्तारों के मध्य बिंदु तृतीय स्तंभ में दिए गए हैं। माध्य ज्ञात करने के लिए प्रत्येक मध्य बिंदु
अप्रत्यक्ष विधि
वर्गीकृत आंकड़ों से अप्रत्यक्ष विधि द्वारा निम्न सूत्र से माध्य ज्ञात किया जा सकता है। इस विधि से माध्य की गणना के सिद्धांत वही हैं जो अवर्गीकृत आंकड़ों के लिए अप्रत्यक्ष विधि द्वारा माध्य की गणना में दिए गए थे। इसे निम्न प्रकार से अभिव्यक्त किया जाता है-
जिसमें,
तालिका-2.3 में अप्रत्यक्ष विधि द्वारा माध्य की गणना करने से संबंधित निम्नलिखित चरण स्पष्ट हैं-
(i) कल्पित माध्य 90-110 वाले वर्ग में माना गया है। कल्पित माध्य जहाँ तक संभव हो, वितरण श्रेणी के मध्य में माना जाता है। इस प्रक्रिया से गणना का परिमाण न्यूनतम होता है। तालिका 2.3 में
(ii) पाँचवें स्तंभ
(iii) छठे स्तंभ में
टिप्पणी : अप्रत्यक्ष विधि समान व असमान दोनों ही वर्ग अंतरालों वाले वितरणों के लिए प्रभावी होती हैफ
माध्यिका
माध्यिका स्थितिक औसत है। इसे “वितरण में ऐसे बिंदु जिसके दोनों ओर बराबर संख्या में पदीय मान हों” के रूप में परिभाषित किया जा सकता है। माध्यिका को प्रतीक
अवर्गीकृत आंकड़ों के लिए माध्यिका की गणना
आँकड़े अवर्गीकृत होने पर उन्हें बढ़ते या घटते क्रम में व्यवस्थित कर लिया जाता है। इस व्यवस्थित श्रेणी में मध्यवर्ती पद के मान की स्थिति ज्ञात करके माध्यिका प्राप्त की जा सकती है। बढ़ते या घटते क्रम में व्यवस्थित श्रेणी के किसी भी सिरे से मध्यवर्ती मान की स्थिति निर्धारित की जा सकती है। माध्यिका की गणना करने के लिए निम्नलिखित सूत्र का उपयोग किया जाता है-
उदाहरण 2.3 : निम्नांकित ऊँचाईयों का उपयोग करते हुए हिमालय की पर्वतीय-चोटियों की माध्यिका ऊँचाई की गणना कीजिए-
8,126 मी., 8,611 मी., 7,817 मी., 8,172 मी., 8,076 मी., 8,848 मी., 8,598 मी.
गणना : माध्यिका
(i) दिए हुए आंकड़ों को बढ़ते अथवा घटते क्रम में व्यवस्थित कीजिए।
(ii) श्रेणी में मध्यवर्ती मूल्य का मान जानने के लिए सूत्र का उपयोग कीजिए। इस प्रकार-
अर्थात् व्यवस्थित श्रेणी में चौथे पद का मान माध्यिका होगी।
आंकड़ों का बढ़ते क्रम में व्यवस्थापन-
7,817 ; 8,076 ; 8,126 ; 8,172 ; 8,598 ; 8,611 ; 8,848
172
अतः
वर्गीकृत आंकड़ों से माध्यिका की गणना
आँकड़े वर्गीकृत होने पर हमें उस बिंदु का मान ज्ञात करना होता है, जहाँ कोई व्यक्ति प्रेक्षण किसी वर्ग के माध्य में स्थित होता है। इसकी गणना निम्न सूत्र से की जा सकती है-
जिसमें,
उदाहरण-2.4 : निम्न वितरण के लिए माध्यिका की गणना कीजिए
वर्ग | ||||||
---|---|---|---|---|---|---|
3 | 7 | 11 | 16 | 8 | 5 |
तालिका- 2.4 : माध्यिका की गणना
वर्ग | आवृत्ति (f) |
संचयी आवृत्ति (F) |
माध्यिका वर्ग की गणना |
---|---|---|---|
50-60 | 3 | 3 | |
60-70 | 7 | 10 | |
70-80 | 11 | ||
80-90 (माध्यिका वर्ग ) |
37 | ||
8 | 45 | ||
5 | 50 | ||
=25 |
नीचे दिए गए चरणों के अनुसार माध्यिका की गणना की जाती है-
(i) तालिका-2.4 की भाँति आवृत्तियों के लिए सारणी बना ली जाती है।
(ii) तालिका-2.4 के स्तंभ 3 में दिए अनुसार प्रत्येक अगली साधारण आवृत्ति को जोड़कर संचयी आवृत्तियों (F) प्राप्त की जाती है।
(iii)
(iv)
(v) चौथे चरण में निर्धारित इस सभी मानों को निम्न सूत्र में प्रतिस्थापित करके माध्यिका की गणनी की जाती है-
बहुलक
किसी श्रेणी में जिस मान की सर्वाधिक पुनरावृत्ति होती है। वह मान बहुलक कहलाता है इसके संकेताक्षर
अवर्गीकृत आंकड़ों के लिए बहुलक की गणना
दिए हुए आंकड़ों के समूह से बहुलक की गणना करने के लिए पहले सभी मापों को बढ़ते या घटते क्रम में व्यवस्थित कर लिया जाता है। इससे सर्वाधिक पुनरावृत्ति वाले मान की पहचान करने में आसानी रहती है।
उदाहरण 2.5 : निम्नांकित दस विद्यार्थियों के भूगोल की परीक्षा में प्राप्तांकों के लिए बहुलक की गणना कीजिए।
गणना : बहुलक ज्ञात करने के लिए निम्नानुसार सभी प्राप्तांकों को बढ़ते क्रम में व्यवस्थित कर लिया जाता है-
दिए हुए आंकड़ों में तीन बार की पुनरावृत्ति वाला मान 61 , दी हुई श्रेणी का बहुलक है। चूँकि इस श्रेणी में अन्य किसी संख्या के मान में ऐसी विशेषता नहीं है, अतः यह, इस श्रेणी में एक-बहुलक है।
उदाहरण 2.6 : दस विद्यार्थियों के एक अन्य प्रतिदर्श के लिए निम्नांकित प्राप्तांकों के आधार पर बहुलक ज्ञात कीजिए-
गणना : निम्नानुसार सभी दिए गए प्राप्तांको को बढ़ते क्रम में व्यवस्थित कीजिए-
उपरोक्त व्यवस्थित श्रेणी में आसानी से देखा जा सकता है कि 11 तथा 82 , दोनों मानों के वितरण में तीन बार पुनरावृत्ति हुई है। अतः आंकड़ों के इस समूह का स्वरूप द्वि-बहुलक है। यदि किसी श्रेणी में तीन मानों की पुनरावृत्ति समान तथा सबसे अंधिक बार होती है तो उस श्रेणी को त्रि-बहुलक श्रेणी कहते हैं। ऐसे ही कई मानों की समान बार पुनरावृत्ति होने पर बहु-बहुलक श्रेणी बन जाती है तथापि किसी श्रेणी में एक भी मान की पुनरावृत्ति न होने पर वह बहुलक-रहित श्रेणी कहलाती है।
माध्य, माध्यिका तथा बहुलक की तुलना
सामान्य वितरण वक्र की सहायता से केंद्रीय प्रवृति के तीनों मापों की तुलना आसानी से की जा सकती है। सामान्य वक्र आवृत्तियों का ऐसा वितरण होता है जिसको प्रदर्शित करने वाला रेखाचित्र घंटाकार वक्र कहलाता है। बौद्धिकता, व्यक्तित्व, समंक तथा विद्यार्थियों की उपलब्धि के समंक जैसी अनेक मानवीय विशेषताओं
का सामान्य वितरण होता है। सामान्य वक्र की आकृति घंटाकार वक्र जैसी होती है क्योंकि यह वक्र सममित होता है। दूसरे शब्दों में अधिकांश प्रेक्षण श्रेणी के मध्य मान पर अथवा आस-पास एकत्रित होते हैं। जैसे-जैसे दूरस्थ मानों की ओर जाते हैं, वैसे-वैसे पर्यवेक्षित प्रेक्षणों की संख्या सममित रूप से घटती जाती है। सामान्य वक्र में आंकड़ों की परिवर्तनशीलता कम अथवा अधिक हो सकती है। सामान्य वक्र का एक उदाहरण चित्र- 2.3 में दर्शाया गया है।

चित्र 2.3 : सामान्य वितरण वक्र
सामान्य वितरण की एक विशेषता होती है। इसमें माध्य, माध्यिका तथा बहुलक का मान समान होता है (चित्र- 2.3 में यह मान 100 है) क्योंकि सामान्य वितरण सममित होता है। अधिकतम आवृत्ति का मान वितरण के मध्य में होता है तथा इस बिंदु से आधी इकाइयाँ ऊपर तथा आधी नीचे होती हैं। अधिकतर इकाइयाँ वितरण के मध्य में अथवा माध्य के निकट होती हैं। अति उच्च तथा अति निम्न मूल्यों की बारंबारता अधिक नहीं होता, अतः वे विरले ही होते हैं।
यदि आंकड़े किसी प्रकार विषम अथवा विकृत हों तो माध्य, माध्यिका तथा बहुलक संपाती नहीं होंगे तथा विषम आंकड़ों के प्रभाव पर विचार करने की आवश्यकता है (चित्र-2.4 तथा 2.5)


चित्र 2.5 : ॠणात्मक विषमता
अभ्यास
1. निम्नांकित चार विकल्पों में से सही विकल्प चुनिए :
(i) केंद्रीय प्रवृत्ति का जो माप चरम मूल्यों से प्रभावित नहीं होता है वह है :
(क) माध्य
(ख) माध्य तथा बहुलक
(ग) बहुलक
(घ) माध्यिका
(ii) केंद्रीय प्रवृत्ति का वह माप जो किसी वितरण के उभरे भाग से हमेशा संपाती होगा वह है :
(क) माध्यिका
(ख) माध्य तथा बहुलक
(ग) माध्य
(घ) बहुलक
2. निम्नलिखित प्रश्नों के उत्तर लगभग 30 शब्दों में दीजिए :
(i) माध्य को परिभाषित कीजिए।
(ii) बहुलक के उपयोग के क्या लाभ हैं?
3. निम्नलिखित प्रश्नों के उत्तर लगभग 125 शब्दों में दीजिए :
(i) आरेखों की सहायता से सामान्य तथा विषम वितरणों में माध्य, माध्यिका तथा बहुलक की सापेक्षिक स्थितियों को व्याख्या कीजिए।
(ii) माध्य, माध्यिका तथा बहुलक की उपयोगिता पर टिप्पणी कीजिए (संकेत : उनके गुण तथा दोषों से)।
क्रियाकलाप
1. भौगोलिक विश्लेषण के लिए प्रयुक्त कोई काल्पनिक उदाहरण लीजिए तथा अवर्गीकृत आंकड़ों की गणना करने को प्रत्यक्ष व अप्रत्यक्ष विधियों को समझाइए।