अध्याय 03 आँकड़ों का संगठन

1. प्रस्तावना

पिछले अध्याय में आपने पढ़ा कि आँकड़ों का संग्रहण कैसे करते हैं। साथ ही, आप जनगणना एवं प्रतिचयन के बीच अंतर को भी जान चुके हैं। इस अध्याय में आप यह सीखेंगे कि जो आँकड़ें आपने संगृहीत किए थे, उन्हें कैसे वर्गीकृत करते हैं। अपरिष्कृत आँकड़ों को वर्गीकृत करने का उद्देश्य उन्हें व्यवस्थित करना है, ताकि उन्हें आसानी से आगे के सांख्यिकीय विशलेषण के योग्य बनाया जा सके।

क्या आपने कभी स्थानीय कबाड़ी वाले या रद्दी सामान खरीदने वाले को देखा है, जिसे आप अपना पुराना अखबार, टूटे-फूटे घरेलू सामान, खाली-काँच की बोतलें, प्लास्टिक आदि बेचते हैं। वह आपसे इन चीजों को खरीदता है और उन लोगों को बेच देता है जो इनका पुनः चक्रण करते हैं। लेकिन अपनी दुकान में अधिक कबाड़ के इकट्ठे होने से उसे अपना व्यापार चलाने में मुश्किल हो सकती है, अगर वह इन्हें उचित ढंग से व्यवस्थित न करे। वह इस स्थिति को सरल बनाने के लिए विभिन्न कबाड़ों को उपयुक्त समूह में रखता है, अर्थात् उन्हें वर्गीकृत करता है। वह पुराने अखबारों को एक साथ रस्सी से बाँध कर रखता है। इसके बाद सभी खाली काँच की बोतलों को एक बोरे में रखता है। वह धातु के सामानों का एक ढेर अपनी दुकान के एक कोने में लगाता है और फिर उनको ‘लोहा’, ‘पीतल’, ‘ताँबा’, ‘एल्यूमिनियम’ आदि वर्गों में छाँट कर रखता है। इस प्रकार से वह अपने कबाड़ को भिन्न वर्गो - ‘अखबार’, ‘प्लास्टिक’, ‘काँच’, ‘धातु’ आदि में विभाजित कर उन्हें व्यवस्थित करता है। जब एक बार उसका सारा कबाड़ व्यवस्थित एवं वर्गीकृत हो जाता है, तब खरीददार की माँग पर, उसे सामग्री विशेष को खोजकर देने में आसानी हो जाती है।

ठीक इसी प्रकार से, जब आप अपने विद्यालय की पुस्तकों को एक विशेष क्रम में रखते हैं, तो उनको संभालना आसान हो जाता है। आप उन्हें विषयों के अनुसार वर्गीकृत कर सकते हैं, जहाँ प्रत्येक विषय एक समूह या वर्ग बन जाता है। उदाहरणार्थ, जब आपको इतिहास की कोई विशेष पुस्तक की आवश्यकता पड़ती है तो आप को केवल यह करना है कि ‘इतिहास’ समूह में उस पुस्तक को खोजें। अन्यथा आप को अपनी यह विशेष पुस्तक सारी पुस्तकों के ढेर में खोजनी पड़ेगी।

यद्यपि पदार्थों अथवा वस्तुओं का वर्गीकरण बहुमूल्य श्रम और समय को बचाता है, इसे मनमाने तरीके से नहीं किया जाता है। कबाड़ी वाले ने अपने कबाड़ को इस तरह से समूहों में रखा कि प्रत्येक समूह में एक ही प्रकार की चीजें हों। उदाहरण के लिए, उसने ‘काँच’ के समूह में खाली काँच की बोतलें, टूटे खिड़की के काँच तथा टूटे दर्पण आदि रखे। ठीक इसी तरह से जब आपने अपनी इतिहास की पुस्तक को ‘इतिहास’ समूह में वर्गीकृत किया, तो आप उसमें अन्य विषयों की पुस्तकें नहीं रखेंगे। अन्यथा समूह-गठन का पूरा उद्देश्य ही निरर्थक हो जाएगा। इसलिए, वर्गीकरण का तात्पर्य एक वस्तुओं को समूह या वर्गों में किसी खास आधार पर वर्गीकृत या व्यवस्थित करने से है।

क्रियात्मक गतिविधि

  • अपने स्थानीय डाकघर जायें और देखें कि पत्रों कि छँटाई कैसे की जाती है। क्या आप जानते हैं कि पत्र में पिन कोड का क्या अर्थ है। अपने डाकिए से पूछें।

2. अपरिष्कृत आँकड़े

कबाड़ीवाले के कबाड़ की भाँति, अवर्गीकृत आँकड़े अथवा अपरिष्कृत आँकड़े भी अत्यधिक अव्यवस्थित होते हैं। ये प्रायः अति विशाल होते हैं, जिन्हें संभालना कठिन होता है। इनसे सार्थक निष्कर्ष निकालना श्रमसाध्य कार्य है, क्योंकि सांख्यिकीय विधियों का इन पर सरलता से प्रयोग नहीं किया जा सकता। इसलिए इस प्रकार के आँकड़ों का उचित संगठन तथा प्रस्तुतीकरण आवश्यक होता है, ताकि व्यवस्थित रूप से साँख्यिकीय विश्लेषण किया जा सके। अतः आँकड़ों के संग्रह के पश्चात् अगला चरण उन्हें संगठित कर वर्गीकृत रूप में प्रस्तुत करना है।

मान लीजिए, कि आप गणित में छात्रों की प्रगति जानना चाहते हैं और आपने अपने स्कूल के 100 छात्रों के गणित के अंकों के आँकड़े एकत्रित कर लिये हैं। अगर आप इन्हें एक सारणी में प्रस्तुत करते हैं तो वे संभवतः सारणी 3.1 जैसे प्रतीत हो सकते हैं।

सारणी 3.1

किसी परीक्षा में 100 छात्रों द्वारा गणित में प्राप्त अंक
47 45 10 60 51 56 66 100 49 40
60 59 56 55 62 48 59 55 51 41
42 69 64 66 50 59 57 65 62 50
64 30 37 75 17 56 20 14 55 90
62 51 55 14 25 34 90 49 56 54
70 47 49 82 40 82 60 85 65 66
49 44 64 69 70 48 12 28 55 65
49 40 25 41 71 80 0 56 14 22
66 53 46 70 43 61 59 12 30 35
45 44 57 76 82 39 32 14 90 25

या फिर आप अपने पड़ोस के 50 परिवारों से, भोजन पर उनके मासिक व्यय के आँकड़ों का संग्रह यह जानने के लिए करते हैं कि भोजन पर उनका औसत व्यय कितना है। इस मामले में संगृहीत आँकड़ों को जब आप सारणी में प्रस्तुत करते हैं, तो वे सारणी 3.2 की तरह दिख सकते हैं। सारणी 3.1 तथा सारणी 3.2 , दोनों ही आँकड़े अपरिष्कृत अथवा अवर्गीकृत हैं। दोनों ही सारणियों में संख्याओं को किसी भी क्रम में व्यवस्थित नहीं किया गया है। अब अगर आपसे यह पूछा जाए कि सारणी 3.1 में गणित में सर्वोच्च अंक कितने हैं, तब आपको 100 छात्रों के अंकों को आरोही या अवरोही क्रम में व्यवस्थित करना होगा। यह एक बेहद थका देने वाला काम है। यदि आपको 100 छात्रों के स्थान पर 1000 छात्रों के अंक संभालने हों तो यह और भी अधिक थकानेवाला होगा।

सारणी 3.2

खाद्य पर 50 परिवारों के मासिक पारिवारिक व्यय (रु में )
1904 1559 3473 1735 2760
2041 1612 1753 1855 4439
5090 1085 1823 2346 1523
1211 1360 1110 2152 1183
1218 1315 1105 2628 2712
4248 1812 1264 1183 1171
1007 1180 1953 1137 2048
2025 1583 1324 2621 3676
1397 1832 1962 2177 2575
1293 1365 1146 3222 1396

ठीक इसी प्रकार से, सारणी 3.2 में आपके लिए काफी मुश्किल होगा कि 50 परिवारों के खाने पर मासिक व्यय के औसत को पता कर सकें। यही कठिनाई तब कई गुना बढ़ जाएगी यदि यह संख्या बहुत बड़ी हो, जैसे 5000 परिवार। ठीक कबाड़ीवाले की भाँति ही (जब कबाड़ का ढेर बहुत बड़ा और अव्यवस्थित हो तो उसे एक विशेष वस्तु को ढूँढ़ने में बहुत कठिनाई होती है) आपकी भी स्थिति होगी, यदि अपरिष्कृत आँकड़ों का भंडार बहुत बड़ा हो और आप उससे कोई सूचना प्राप्त करना चाहें। इसलिए, संक्षेप में अवर्गीकृत विशाल आँकड़ों से कोई सूचना प्राप्त करना एक बेहद थका देने वाला एवं उबाऊ काम है।

वर्गीकरण के द्वारा अपरिष्कृत आँकड़ों को संक्षिप्त एवं बोधगम्य बनाया जाता है। जब एक प्रकार की विशेषताओं वाले तथ्यों को एक ही वर्ग में रखा जाता है तो वे बिना किसी कठिनाई के ढूँढ़ने, तुलना करने तथा निष्कर्ष निकालने योग्य हो जाते हैं। आपने अध्याय 2 में पढ़ा है कि प्रति दस साल बाद भारत सरकार जनसंख्या की गणना कराती है। सन् 2001 की जनगणना में लगभग 20 करोड़ लोगों से संपर्क किया गया। जनगणना के अपरिष्कृत आँकड़े बहुत विशाल एवं विखंडित होते हैं। उन से कोई भी अर्थपूर्ण निष्कर्ष निकालना असंभव कार्य लगता है। लेकिन जनगणना के यही आँकड़े जब लिंग, शिक्षा, वैवाहिक स्थिति, पेशे आदि के अनुसार वर्गीकृत किये जाते हैं तब भारत की जनसंख्या की प्रकृति एवं संरचना आसानी से समझ में आ जाती है।

अपरिष्कृत आँकड़े चरों के प्रेक्षणों से बने होते हैं। सारणी 3.1 तथा 3.2 में दिए गए अपरिष्कृत आँकड़े विशेष या चर समूह पर किए गए प्रेक्षणों को प्रदर्शित करते हैं। उदाहरण के लिए सारणी 3.1 को देखें जिसमें 100 छात्रों द्वारा गणित में प्राप्त किए गए अंकों को दर्शाया गया है। इन अंकों से हम कैसे अर्थ निकाल सकते हैं? गणित के शिक्षक इन अंकों को देखकर सोच रहे होंगे - मेरे छात्रों ने कैसा किया? कितने असफल रहे? आँकड़ों का वर्गीकरण हमारे उद्देश्यों पर निर्भर करता है इस स्थिति में, शिक्षक गहनतापूर्वक समझने की कोशिश करेंगे - छात्रों ने कैसा किया? संभवतया वह बारंबारता वितरण बनाने का चयन करे। इस पर अगले भाग में विवेचना की जायेगी।

क्रियात्मक गतिविधि

  • आप अपने परिवार के एक वर्ष के साप्ताहिक व्यय के आँकड़े संगृहीत कीजिए और उसे एक सारणी में व्यवस्थित कीजिए। देखिए कि उसमें कितने प्रेक्षण हैं। आँकड़ों को मासिक आधार पर व्यवस्थित कीजिए और देखिए कि अब कितने प्रेक्षण हैं।

3. आँकड़ों का वर्गीकरण

किसी वर्गीकरण के वर्ग या समूह कई तरीकों से बनाए जा सकते हैं। आप अपनी पुस्तकों को विषयों-‘इतिहास’, ‘भूगोल’, ‘गणित’, ‘विज्ञान’ आदि में वर्गीकृत करने के स्थान पर इन्हें वर्णमाला के क्रम में लेखकों के आधार पर वर्गीकृत कर सकते हैं। अथवा, आप इन्हें प्रकाशन- वर्ष के आधार पर भी वर्गीकृत कर सकते हैं। आप उन्हें किस प्रकार से वर्गीकृत करना चाहते हैं, यह आपकी आवश्यकता पर निर्भर करेगा।

ठीक इसी प्रकार से, अपरिष्कृत आँकड़ों को भी विभिन्न तरीकों से वर्गीकृत किया जा सकता है जो आपके अध्ययन के उद्देश्य पर निर्भर करता है। उन्हें समय के अनुसार समूहित किया जा सकता है। इस प्रकार के वर्गीकरण को कालानुक्रमिक वर्गीकरण कहते हैं। इस प्रकार के वर्गीकरण में, आँकड़ों को समय के संदर्भ-जैसे वर्ष, तिमाही, मासिक या साप्ताहिक आदि के रूप में, आरोही या अवरोही क्रम में वर्गीकृत किया जा सकता है। निम्नलिखित उदाहरण वर्षों के आधार पर भारत की जनसंख्या के वर्गीकरण को दिखाता है। चर ‘जनसंख्या’ एक काल-श्रेणी है, क्योंकि इसमें विभिन्न वर्षों के मानों की एक श्रेणी चित्रित की गई है।

उदाहरण 1

भारत की जनसंख्या (करोड़ में)

वर्ष जनसंख्या (करोड़ में)
1951 35.7
1961 43.8
1971 54.6
1981 68.4
1991 81.8
2001 102.7
2011 121.0

स्थानिक वर्गीकरण के अंतर्गत आँकड़ों का वर्गीकरण भौगोलिक स्थितियों जैसे कि देश, राज्य,शहर, जिला, कस्बा आदि के संदर्भानुसार होता है। उदाहरण 2 में विभिन्न देशों में गेहूँ की उपज दिखाई गई है।

उदाहरण 2

विभिन्न देशों में गेहूँ की उपज (2013)

देश गोहूँ की उपज (किग्रा/एकड़)
कनाडा 3594
चीन 5055
फ्रांस 7254
जर्मनी 7998
भारत 3154
पाकिस्तान 2787

स्रोत: कृषि आँकड़े, भारत सरकार, 2015

क्रियात्मक गतिविधियाँ

  • उदाहरण 1 में, उस वर्ष को बताएँ जिसमें भारत की जनसंख्या न्यूनतम और अधिकतम है।
  • उदाहरण 2 में, उस देश का पता लगाइये, जिसकी गेहूँ की उपज भारत से थोड़ी अधिक है। यह प्रतिशत में कितनी होगी?
  • उदाहरण दो में दिए गए देशों को गेहूँ की उपज के आरोही क्रम में रखिये। ठीक यही अभ्यास उपज को अवरोही क्रम में रखते हुए कीजिए।

कई बार आपका सामना ऐसी विशेषताओं से होता है, जिन्हें मात्रात्मक रूप में व्यक्त नहीं किया जा सकता है।

इस प्रकार की विशेषताओं को ‘गुण’ कहते हैं। उदाहरण के लिए-राष्ट्रीयता, साक्षरता, धर्म, लिंग, वैवाहिक स्थिति आदि। इन्हें मापा नहीं जा सकता है। इन गुणों को गुणात्मक विशेषता की उपस्थिति या अनुपस्थिति के आधार पर वर्गीकृत कर सकते हैं। विशेषताओं पर आधारित आँकड़ों के ऐसे वर्गीकरण को गुणात्मक वर्गीकरण कहा जाता है। निम्नलिखित उदाहरण में हम किसी देश जोंख्या को गुणात्मक चर ‘लिंग’ के आधार पर समूहित किया हुआ पाते हैं। इसमें प्रेक्षण स्त्री या पुरुष हो सकता है। इन दो विशेषताओं को आगे वैविक्ति के आधा त्तार्वर्गीकृत्त किया जा सकता है, केसा कि नाचच दया गया है

उदाहरण 3

प्रथम चरण में यह वर्गीकरण पहले विशेषता की उपस्थिति या अनुपस्थिति पर आधारित है जैसे कि ‘पुरुष’ या ‘पुरुष नहीं’ (स्त्री) है। दूसरे चरण में, प्रत्येक वर्ग ‘स्त्री’ या ‘पुरुष’ आगे दूसरी विशेषता की उपस्थिति या अनुपस्थिति के आधार पर विभाजित है, जैसे विवाहित या अविवाहित। ऊँचाई, भार, आयु, आय, छात्रों के अंक आदि विशेषताओं की प्रकृति मात्रात्मक है। जब ऐसी विशिष्टताओं के संगृहीत आँकड़ों को वर्गो में समूहित किया जाता है तो यह वर्गीकरण मात्रात्मक वर्गीकरण कहलाता है।

क्रियात्मक गतिविधियाँ

  • आस-पास की वस्तुओं को सजीव या निर्जीव के रूप में समूहित किया जा सकता है। क्या यह मात्रात्मक वर्गीकरण है?

उदाहरण 4

100 छात्रों के गणित के प्राप्तांकों का बारंबारता वितरण

अंक बारंबारता
010 1
1020 8
2030 6
3040 7
4050 21
5060 23
6070 19
7080 6
8090 5
90100 4
योग 100

उदाहरण 4 में 100 छात्रों के गणित के प्राप्तांकों का मात्रात्मक वर्गीकरण दिखाया गया है, जिन्हें सारणी 3.1 में बारंबारता वितरण के रूप में दिया गया है।

क्रियात्मक गतिविधियाँ

  • उदाहरण 4 की बारंबारता के मानों को कुल बारंबारता के अनुपात में या प्रतिशत में प्रकट कीजिए। ध्यान रहे कि इस प्रकार से प्रकट की गई बारंबारता को सापेक्षिक बारंबारता के रूप में जाना जाता है।
  • उदाहरण 4 में किस वर्ग के अंतर्गत आँकड़ों का अधिकतम संकेंद्रण है? इसे कुल प्रेक्षणों के प्रतिशत के रूप में प्रकट कीजिए। किस वर्ग में आँकड़ों का न्यूनतम संकेंद्रण है?

4. चर : संतत और विविक्त

चर की सरल परिभाषा, जिसका आपने पिछले अध्याय में अध्ययन किया था, यह नहीं बतलाती कि यह कैसे परिवर्तित होता है। चरों में अंतर विशेष वर्गीकरण के आधार पर होता है इन्हें सामान्यतः दो वर्गों में वर्गीकृत किया जाता है:

(क) संतत तथा

(ख) विविक्त

संतत चर का कोई भी संख्यात्मक मान हो सकता है। यह पूर्णांक मान (1,2,3,4), भिन्नात्मक मान (1/2,2/3,3/4), तथा वे मान जो यथातथ भिन्न नहीं हैं (2=1.414,3=1.732, , 7=2.645 ) हो सकते हैं। उदाहरण के लिए, मान लिजिए कि एक छात्र का कद 90150 सेमी तक बढ़ता है, तो उसके कद के मान इसके बीच आने वाले सभी मान हो सकते हैं। यह संपूर्ण संख्या वाले मान को भी प्रकट कर सकता है, जैसे कि 90 सेमी, 100 सेमी, 108 सेमी, 150 सेमी। इसके साथ ही यह भिन्नात्मक मान जैसे 90.85 सेमी, 102.34 सेमी, 149.99 सेमी आदि भी हो सकते हैं, जो पूर्णांक नहीं हैं। इस प्रकार ‘ऊँचाई’ चर किसी भी कल्पित मान को अभिव्यक्त करने में सक्षम है और इसके मानों को अनन्त श्रेणियों में बाँटा जा सकता है। संतत चर के अन्य उदाहरण भार, समय तथा दूरी आदि हैं।

संतत चर के विपरीत विविक्त चर केवल निश्चित मान हो सकते हैं। इसके मान केवल परिमित ‘उछाल’ से बदलते हैं। यह उछाल एक मान से दूसरे मान के बीच होते हैं, परंतु इसके बीच में कोई मान नहीं आता है। उदाहरण के लिए, कोई चर जैसे ‘किसी कक्षा में छात्रों की संख्या’, भिन्न वर्गो के लिए उन मानों की कल्पना करता है, जिसमें केवल पूर्ण संख्याएँ हों। यह कोई भी भिन्नात्मक मान जैसे 0.5 नहीं हो सकता, क्योंकि ‘एक छात्र का आधा’ निरर्थक है। इस प्रकार से इसमें 25 एवं 26 के बीच का मान 25.5 नहीं हो सकता है। इसकी अपेक्षा इसका मान या तो 25 होगा या फिर 261 हम देखते हैं कि जब इसका मान 25 से 26 में बदलता है, तो इन दोनों के बीच के भिन्नों को इसमें नहीं लिया जाता है। लेकिन ऐसा नहीं सोचना चाहिए कि किसी विविक्त चर का मान भिन्न में नहीं हो सकता। मान लीजिए कि x एक चर है जिसमें 1/8,1/16,1/32,1/64, जैसे मान हैं तो क्या यह एक विविक्त चर है? हाँ, क्योंकि यद्यपि x के मान भिन्नों में हो सकते हैं, तथापि ये दो सन्निकट भिन्नों के बीच नहीं हो सकते। यह 1/8 से 1/16 में और फिर 1/16 से 1/32 में ‘बदलता’ है, परंतु 1/8 से 1/16 के बीच या 1/16 से 1/32 के बीच के मान नहीं ले सकता।

क्रियात्मक गतिविधि

  • निम्नलिखित चरों का संतत तथा विविक्त में वर्गीकरण करें: क्षेत्रफल, आयतन, ताप, पाँसे पर आने वाली संख्या, फसल-उपज,जनसंख्या, वर्षा, सड़क पर कारों की संख्या और आयु।

हमने पहले यह बताया है कि उदाहरण 4 में 100 छात्रों के गणित में प्राप्तांक का बारंबारता वितरण दिया गया है, जैसा कि सारणी 3.1 में दिखाया गया है। यह दिखाता है कि 100 छात्रों के अंकों को वर्गों में कैसे समूहित किया गया है। आपको आश्चर्य होगा कि हमने सारणी 3.1 के अपरिष्कृत आँकड़ों से इसे कैसे प्राप्त किया। लेकिन इस प्रश्न का समाधान प्रस्तुत करने से पहले आपका यह जानना आवश्यक है कि बारंबारता वितरण क्या होता है।

5. बारंबारता वितरण क्या है?

बारंबारता वितरण अपरिष्कृत आँकड़ों को एक मात्रात्मक चर में वर्गीकृत करने का एक सामान्य तरीका है। यह दिखाता है कि किसी चर के भिन्न मान (यहाँ छात्र द्वारा गणित में प्राप्तांक) विभिन्न वर्गों में, अपने अनुरूप वर्गों की बारंबारताओं के साथ कैसे वितरित किए जाते हैं। इस उदाहरण में हमारे पास प्राप्तांकों के 10 वर्ग हैं। 010,1020,...90100 । वर्ग-बारंबारता पद का अर्थ है एक विशेष वर्ग में मानों की संख्या। उदाहरण के लिए वर्ग 30-40 में सारणी 3.1 में प्राप्तांकों के 7 मान हैं। ये 30,37,34,30,35,39,32 हैं। इस प्रकार से वर्ग 30-40 की बारंबारता 7 हुई। पर शायद आपको आश्यर्च हो कि 40 का अंक जो अपरिष्कृत आँकड़ों में दो बार आया है, उसे 30-40 वर्ग में शामिल क्यों नहीं किया गया? अगर इसे 3040 वर्ग की बारंबारता में शामिल किया जाता, तो ये 7 की अपेक्षा 9 होते। यह पहेली तब स्पष्ट हो जाएगी, जब आप इस अध्याय को पर्याप्त धैर्य के साथ सावधानी पूर्वक पढ़ेंगे। इसलिए पढ़ना जारी रखें। आपको स्वयं ही इसका उत्तर प्राप्त हो जाएगा।

बारंबारता वितरण सारणी में प्रत्येक वर्ग, वर्ग सीमाओं द्वारा घिरा होता है। वर्ग में ये सीमाएँ दो छोरों पर होती हैं। इसमें न्यूनतम मान को निम्नवर्ग सीमा तथा उच्चतम मान को उच्च वर्ग सीमा कहते हैं। उदाहरण के लिए वर्ग 60-70 में वर्ग सीमाएँ 60 एवं 70 हैं। इसकी निम्न वर्ग सीमा 60 और उच्च वर्ग सीमा 70 है। वर्ग मध्यांतर या अंतराल या वर्ग विस्तार उच्च वर्ग सीमा तथा निम्न वर्ग सीमा के बीच का अंतर है। वर्ग 6070 के लिए वर्ग अंतराल 10 है, (उच्च वर्ग सीमा में से निम्न वर्ग सीमा को घटाकर)।

वर्ग मध्यबिन्दु अथवा वर्ग चिह्न किसी वर्ग का मध्य-मान है। यह वर्ग की निम्न वर्ग सीमा तथा उच्च वर्ग सीमा के बीच होता है। इसे निम्नलिखित तरीके से पता किया जा सकता है:

वर्ग मध्य बिन्दु या वर्ग चिह्न = (उच्च वर्ग सीमा + निम्न वर्ग सीमा)/2

प्रत्येक वर्ग का वर्ग चिह्न या वर्ग मध्य-बिन्दु एक वर्ग के प्रतिनिधित्व के लिए प्रयुक्त किया जाता है। एक बार जब अपरिष्कृत आँकड़ों को वर्गों में समूहित कर दिया जाता है, तब आगे की गणनाओं में व्यष्टि प्रेक्षणों का प्रयोग नहीं किए जाता है बल्कि इसकी जगह वर्ग चिह्न प्रयुक्त किया जाता है।

सारणी 3.3

निम्न वर्ग सीमा, उच्च वर्ग सीमा तथा वर्ग चिह्न

वर्ग बारंबारता निम्नवर्ग
सीमा
उच्चवर्ग
सीमा
वर्ग
चिह्न
010 1 0 10 5
1020 8 10 20 15
2030 6 20 30 25
3040 7 30 40 35
4050 21 40 50 45
5060 23 50 60 55
6070 19 60 70 65
7080 6 70 80 75
8090 5 80 90 85
90100 4 90 100 95

बारंबारता वक्र किसी बारंबारता वितरण का आलेखीय प्रस्तुतीकरण है। चित्र 3.1 के अंतर्गत उपरोक्त उदाहरण में दिए गए आँकड़ों का आरेखी प्रस्तुतीकरण दिया गया है। बारंबारता वक्र प्राप्त करने के लिए, हम वर्ग चिह्न को एक्स ( x ) अक्ष पर तथा बारंबारता को वाई (y) अक्ष पर आलेखित करते हैं।

चित्र 3.1 आँकड़ों के बारंबारता वितरण का आरेखी प्रस्तुतीकरण।

बारंबारता वितरण कैसे तैयार करें?

बारंबारता वितरण तैयार करते समय हमें निम्न पाँच प्रश्नों की व्याख्या पर ध्यान देने की आवश्यकता है:

1. वर्ग अंतराल समान आकार के हों या असमान आकार के?

2. हमें कितने वर्ग रखने चाहिए?

3. प्रत्येक वर्ग का आकार क्या हो?

4. वर्ग सीमाओं का निर्धारण कैसे किया जाय?

5. प्रत्येक वर्ग के लिए बारंबारता कैसे प्राप्त की जाय?

वर्ग अंतराल, समान अंतराल के हों या असमान अंतराल के?

दो परिस्थितियों में असमान आकार के वर्ग अंतरालों का प्रयोग किया जाता है। पहली, जब हमारे पास आय तथा ऐसे ही चरों के आँकड़े हों, जहाँ परास काफी अधिक होता है। उदाहरण के लिए, दैनिक आय लगभग शून्य से लेकर कई सौ करोड़ रुपये तक हो सकती है। ऐसी स्थिति में, समान वर्ग अंतराल उपयुक्त नहीं है, क्योंकि (i) यदि वर्ग अंतराल छोटे तथा समान आकार के होंगे, तो वर्गों की संख्या बहुत अधिक हो जाएगी। (ii) यदि वर्ग अंतराल अधिक है,

तो आय के बहुत कम या बहुत अधिक स्तरों पर जानकारी छिपी हुई रह जाएगी।

दूसरी, यदि मानों की एक बहुत बड़ी संख्या परास के एक छोटे से भाग में केंद्रित होती है, तो समान वर्ग अंतराल से कई मानों की सूचना प्राप्त नहीं हो पाएगी।

अन्य सभी स्थितियों में, आवृत्ति-वितरण में समान आकार के वर्ग अंतरालों का प्रयोग होता है।

वर्गों की संख्या कितनी होनी चाहिए?

वर्गों की संख्या सामान्यतः 6 तथा 15 के बीच होती है। यदि हमारे वर्ग अंतराल समान आकार के हों, तो वर्गों की संख्या, परास (चर के अधिकतम तथा न्यूनतम मान में अंतर) को वर्ग अंतराल से भाग देने पर प्राप्त की जा सकती है।

क्रियात्मक गतिविधियाँ

निम्नलिखित का परास ज्ञात करें:

  • उदाहरण 1 में भारत की जनसंख्या।
  • उदाहरण 2 में गेहूँ की उपज।

प्रत्येक वर्ग का आकार क्या होना चाहिए?

इस प्रश्न का उत्तर पहले के प्रश्न के उत्तर पर निर्भर करता है। समीकरण (2) प्रकट करती है कि एक बार वर्ग अंतराल को तय करने पर चर के दिए गए परास से हम वर्गों की संख्या निर्धारित कर सकते हैं। ठीक इसी प्रकार से हम वर्ग अंतराल निर्धारित कर सकते हैं, जब एक बार हम वर्गों की संख्या तय कर लेते हैं। इस तरह हम पाते हैं कि ये दोनों निर्णय एक दूसरे से जुड़े हुए हैं। पहले का निर्णय लिए बिना हम दूसरे पर निर्णय नहीं ले सकते।

उदाहरण 4 में, हमारे पास वर्गों की संख्या 10 है तथा परास का दिया गया मान 100 है, तब वर्ग-अंतराल स्वतः ही (समानता 2 के द्वारा) 10 है। ध्यान दें कि वर्तमान संदर्भ में हमने वह वर्ग अंतराल चुना है, जिनका परिमाण समान है। तथापि हम ऐसा वर्ग अंतराल चुन सकते हैं जिसका परिमाण समान न हो, तब ऐसे मामले में वर्गों की चौड़ाई असमान होगी।

हमें वर्ग सीमाएँ कैसे निर्धारित करनी चाहिए?

वर्ग सीमाएँ निश्चित तथा स्पष्ट रूप से होनी चाहिए। सामान्ययतः मुक्तोत्तर वर्ग, जैसे- ’ 70 तथा अधिक’ या ’ 10 से कम’ वांछनीय नहीं होते। निम्न तथा उच्च वर्ग सीमाओं का निर्धारण इस प्रकार से किया जाना चाहिए कि प्रत्येक वर्ग की आवृत्तियों की प्रवृत्ति वर्ग अंतराल के मध्य में संकेंद्रण की हो। वर्ग अंतराल दो प्रकार के होते हैं-

1. समावेशी वर्ग अंतरालः इस स्थिति में, वर्ग की निम्न तथा उच्च सीमाओं के मूल्य वाले मानों को उस वर्ग की आवृत्ति में शामिल किया जाता है।

2. अपवर्जी वर्ग अंतरालः इस स्थिति में, वर्ग की निम्न तथा उच्च सीमाओं के मूल्य वाली मदों को उस वर्ग की आवृत्ति में शामिल नहीं किया जाता। असतत चरों की स्थिति में, अपवर्जी तथा समावेशी, दोनों प्रकार के वर्ग अंतरालों का प्रयोग किया जा सकता है।

सतत चरों की स्थिति में, समावेशी वर्ग अंतरालों का प्रयोग बहुधा किया जाता है।

उदाहरण

मान लीजिए, हमारे पास एक परीक्षा में विद्यार्थियों द्वारा प्राप्तांकों के आँकड़े हैं तथा सभी प्राप्तांक पूर्णांक हैं (भिन्नात्मक अंकों की अनुमति नहीं है)। मान लीजिए, विद्यार्थियों द्वारा प्राप्तांक 0 से 100 के बीच हैं।

यह असतत चरों की स्थिति है, क्योंकि भिन्नात्मक अंकों की अनुमति नहीं है। इस स्थिति में, यदि हम समान आकार वाले वर्ग अंतरालों का उपयोग करते हैं तथा 10 वर्ग अंतरालों का प्रयोग करते हैं, तो वर्ग अंतरालों के निम्न रूप हो सकते हैंवर्ग अंतराल का समावेशी रूप 010

1120

2130

91100

वर्ग अंतराल का अपवर्जी रूप

010

1020

2030

90100

अपवर्जी वर्ग अंतराल की स्थिति में, हमें यह अग्रिम रूप से निर्धारित करना होता है कि वर्ग सीमा के मान के बराबर किसी चर का मान होने पर क्या करना है। उदाहरण के लिए, हम यह निर्णय कर सकते हैं कि 10,30 आदि मानों को क्रमशः वर्ग अंतराल " 0 से 10 " तथा " 20 से 30 " में रखा जाए। इस स्थिति में वर्ग की निचली सीमा को वर्ग अंतराल में शामिल नहीं किया जाता।

या फिर हम 10,30 आदि मानों को क्रमशः वर्ग अंतराल " 10 से 20 " तथा " 30 से 40 " में रख सकते हैं। इस स्थिति में वर्ग की उच्च सीमा को वर्ग अंतराल में शामिल नहीं किया जाता।

सतत चर के उदाहरण

मान लें कि हमारे पास किसी चर के आँकड़े उपलब्ध हों, जैसे कद (से.मी.) या वज़न (कि.ग्रा.)। यह आँकड़ा सतत प्रकार का है। ऐसी स्थितियों में वर्ग अंतराल निम्नलिखित प्रकार से दर्शाया जा सकता है-

30 कि.ग्रा.- 39.999 …कि.ग्रा.

40 कि.ग्रा.- 49.999 …कि.ग्रा.

50 कि.ग्रा.- 59.999…कि.ग्रा. आदि।

इन वर्ग अंतरालों को निम्नलिखित प्रकार से समझा जा सकता है- 30 कि.ग्रा. और अधिक तथा 40 कि.ग्रा. से कम

40 कि.ग्रा. और अधिक तथा 50 कि.ग्रा. से कम 50 कि.ग्रा. और अधिक तथा 60 कि.ग्रा. से कम आदि।

सारणी 3.4

एक कंपनी के 550 कर्मचारियों की आय का बारंबारता वितरण

आय (रु में) कर्मचारियों की संख्या
800899 50
900999 100
10001099 200
11001199 150
12001299 40
13001399 10
योग 550

वर्ग अंतराल में समायोजन

सारणी 3.4 में समावेशी विधि के सूक्ष्म अध्ययन से पता चलता है कि यद्यपि चर ‘आय’ एक संतत चर है, तथापि जब वर्गों को बनाया जाता है तो संततता नहीं रहती। हम एक वर्ग की उच्च सीमा तथा अगले वर्ग की निम्न सीमा में ‘अंतर’ या असंततता पाते हैं। उदाहरण के लिए, पहले वर्ग की उच्च सीमा 899 और दूसरे वर्ग की निम्न सीमा 900 के बीच हम 1 (एक) का ‘अंतर’ पाते हैं। तब हम आँकड़ों के वर्गीकरण में चर की संततता को कैसे सुनिश्चित करते हैं? इसे वर्ग अंतराल के बीच समायोजन करके किया जाता है। समायोजन निम्नलिखित तरीके से किया गया है।

1. द्वितीय वर्ग की निम्न सीमा और प्रथम वर्ग की उच्च सीमा के बीच अंतर पता करें। उदाहरण के लिए, सारणी 3.4 में द्वितीय वर्ग की निम्न सीमा 900 और प्रथम वर्ग की उच्च सीमा 899 के बीच अंतर 1 है (अर्थात 900899=1 )।

2. प्राप्त किए गए अंतर (1) को 2 से विभाजित करें (अर्थात 1/2=0.5 )।

3. सभी वर्गों की निम्न सीमाओं से (2) में प्राप्त किए गए मान को घटाइए (निम्न वर्ग सीमा 0.5)

4. सभी वर्गो की उच्च सीमा में (2) में प्राप्त किए गए मान को जोड़िए (उच्च वर्ग सीमा + 0.5)

समायोजन के पश्चात्, जिससे बारंबारता वितरण में आँकड़ों की संततता की पुनः प्राप्ति होती है, सारणी 3.4 संशोधित होकर सारणी 3.5 बन जाती है। वर्ग सीमाओं में समायोजन के पश्चात्, समानता (1) जोकि वर्ग चिह्न का मान निर्धारित करती है, निम्नलिखित प्रकार से संशोधित हो जाएगी:

समायोजित वर्ग चिह्न = (समायोजित उच्च वर्ग सीमा + समायोजित निम्न वर्ग सीमा)/2

सारिणी 3.5

एक कंपनी के 550 कर्मचारियों की आय का बारंबारता वितरण

आय (रु में) कर्मचारियों की संख्या
799.5899.5 50
899.5999.5 100
999.51099.5 200
1099.51199.5 150
1199.51299.5 40
1299.51399.5 10
योग 550

हमें प्रत्येक वर्ग की बारंबारता कैसे प्राप्त करनी चाहिए

साधारण शब्दों में, एक प्रेक्षण की बारंबारता का अर्थ है कि अपरिष्कृत आँकड़ों में कितनी बार वह प्रेक्षण प्रकट होता है। सारणी 3.1 में, हमने देखा कि 40 का मान तीन बार आया है, जबकि 0 और 10 का मान एक बार, 49 का मान 5 बार और ऐसे ही अन्य मान आये हैं। इस प्रकार से 40 की बारंबारता 3,0 की 1,10 की 1,49 की 5 तथा ऐसे ही। लेकिन जब आँकड़े वर्गों में समूहित कर दिए जाते हैं, जैसा कि उदाहरण 3 में किया गया है, तो किसी वर्ग की बारंबारता से तात्पर्य उस वर्ग के मानों की संख्याओं से है। वर्ग-बारंबारताओं की गिनती विशेष वर्ग के सामने मिलान चिह्नों को लगाकर की जाती है।

मिलान चिह्न अंकन द्वारा वर्ग बारंबारता को ज्ञात करना

मिलान चिह्न (/) किसी वर्ग के प्रत्येक छात्र के सामने लगाया जाता है, जिसके प्राप्तांक उस वर्ग में शामिल हैं। उदाहरण के लिए, यदि किसी छात्र का प्राप्तांक 57 है तो उस छात्र के लिए वर्ग 50-60 में एक मिलान चिह्न (/) लगाया जाता है। यदि प्राप्तांक 71 हैं तो मिलान चिह्न (/) को वर्ग 70-80 में लगाया जाता है। यदि कोई 40 अंक प्राप्त करता है तो उसके लिए मिलान चिह्न वर्ग 40-50 में लगाया जाता है। सारणी 3.1 के 100 छात्रों के गणित में प्राप्तांकों के मिलान चिह्नों को सारणी 3.6 में दिखाया गया है।

मिलान चिह्नों का परिकलन तब आसान हो जाता है जब 4 चिह्न खड़े (////) लगाए जाते हैं और पाँचवाँ चिह्न सबको काटता हुआ तिरछा लगाया जाता है, जैसे ( X / ) । मिलान चिह्नों की गणना पाँच के समूह में की जाती है, इसलिए यदि किसी वर्ग में 16 मिलान चिह्न हैं तो उन्हें इस प्रकार से N/N/N/ लिखते हैं, ताकि परिकलन में सुविधा रहे। इसलिए एक वर्ग की बारंबारता उतनी ही होगी, जितनी उस वर्ग में मिलान चिह्नों की संख्या।

सूचना की हानि (Loss of Information)

बारंबारता वितरण के रूप में आँकड़ों के वर्गीकरण में एक अंतर्निहित दोष पाया जाता है। यह अपरिष्कृत आँकड़ों का सारांश प्रस्तुत कर उन्हें संक्षिप्त एवं बोध गम्य तो बनाता है, परंतु इसमें वे विस्तृत विवरण नहीं

प्रकट हो पाते जो अपरिष्कृत आँकड़ों में पाए जाते हैं। यद्यपि अपरिष्कृत आँकड़ों को वर्गीकृत करने में सूचना की क्षति होती है, तथापि आँकड़ों को वर्गीकरण द्वारा संक्षिप्त करने पर पर्याप्त जानकारी मिल जाती है। एक बार जब आँकड़ों को वर्गों में समूहित कर दिया जाता है तब व्यष्टि प्रेक्षणों का आगे सांख्यकीय परिकलनों में कोई महत्व नहीं होता। उदाहरण 4 में, वर्ग 20-30 के अंतर्गत 6 प्रेक्षण 25,25,20,22,25 एवं 28 हैं। इसलिए जब इन आँकड़ों को बारंबारता वितरण में वर्ग 20-30 में समूहित कर दिया जाता है, तब यह बारंबारता वितरण उस वर्ग की बारंबारता (जैसे 6) को दिखाता है, न कि उनके वास्तविक मानों को। इस वर्ग के सभी मानों को उस वर्ग के वर्ग-अंतराल के मध्य मान या वर्ग चिह्न के बराबर माना जाता है (अर्थात् 25)। आगे की सांख्यिकीय परिकलनों के लिए वर्ग चिह्न के मान को आधार बनाया जाता है, न कि उस वर्ग के प्रेक्षणों के मान को। यही बात सभी वर्गों के लिए सत्य है। इस प्रकार प्रेक्षणों के वास्तविक मान के स्थान पर वर्ग चिह्नों के प्रयोग को सांख्यिकीय विधियों में शामिल करने पर पर्याप्त मात्रा में सूचनाओं की क्षति होती है। यद्यपि अपरिष्कृत आँकडों का जैसा कि नीचे इससे अधिक दिखाया गया है, अधिक अर्थपूर्ण लगता है।

असमान वर्गों में बारंबारता वितरण

अब तक आप समान वर्ग अंतराल के बारंबारता वितरण से परिचित हो चुके हैं। आप जान गए हैं कि इन्हें अपरिष्कृत आँकड़ों से कैसे गठित किया जाता है। लेकिन कुछ मामलों में असमान वर्ग अंतराल के साथ बारंबारता वितरण अधिक उपयुक्त होता है। यदि आप उदाहरण 4 के बारंबारता वितरण की सारणी 3.6 को देखें, तो आप पायेंगे कि अधिकांश प्रेक्षण वर्ग 40-50, 5060 तथा 6070 में संकेंद्रित हैं। उनकी बारंबारताएँ क्रमशः 21,23 एवं 19 हैं। इसका अर्थ है कि 100 छात्रों में से 63(21+23+19) प्रेक्षण इन वर्गों में सकेंद्रित हैं। इस प्रकार 63 प्रतिशत आँकड़े 40-70 के बीच समाहित है और आँकड़ों का शेष 37 प्रतिशत 010,1020,2030,3040 तथा 7080, 8090 एवं 90100 वर्गों में हैं। इन वर्गों में प्रेक्षणों का विरल घनत्व है। आप यह भी देखेंगे कि इन वर्गों के प्रेक्षणों में अन्य वर्गों की अपेक्षा उनके अपने वर्गों के वर्ग-चिह्नों से अधिक विचलन है। लेकिन यदि वर्गो का गठन इस प्रकार से करना हो कि वर्ग चिह्न, जहाँ तक संभव है, उस मान के बराबर हो जाए, जिसके आस-पास उस वर्ग के प्रेक्षणों के संकेंद्रण की प्रवृत्ति होती है, तो असमान वर्ग अंतराल अधिक उपयुक्त होता है।

सारणी 3.6

गणित में 100 छात्रों के प्राप्तांको के मिलान चिद्न

वर्ग प्रेक्षण मिलान चिह्न बारंबारता वर्ग चिह्न
010 0 / 1 5
1020 10,14,17,12,14,12,14,14 8 15
2030 25,25,20,22,25,28 6 25
3040 30,37,34,39,32,30,35 7 35
4050 47,42,49,49,45,45,47,44,40,44
49,46,41,40,43,48,48,49,49,40
41 21 45
5060 59,51,53,56,55,57,55,51,50,56
59,56,59,57,59,55,56,51,55,56
55,50,54 23 55
6070 60,64,62,66,69,64,64,60,66,69
62,61,66,60,65,62,65,66,65
19 65
7080 70,75,70,76,70,71 6 75
8090 82,82,82,80,85 5 85
90100 90,100,90,90 //// 4 95
योग 100

असमान वर्गों के रूप में, सारणी 3.7 में सारणी 3.6 के उसी बारंबारता वितरण को दिखाया गया है। 4050,5060 तथा 6070 के प्रत्येक वर्ग को दो भागों में विभाजित किया गया है। वर्ग 4050 को अब 40-45 तथा 45-50 में बाँटा गया है। वर्ग 5060 को 5055 और 5560 में बाँटा गया है तथा वर्ग 6070 को 6065 तथा 6570 में बाँटा गया है। अब नए वर्ग 4045,4550,5055, 5560,6065 तथा 6570 हैं जिनमें वर्ग अंतराल 5 है। बाकी अन्य वर्गों 010,1020,2030, 3040, तथा 7080,8090,90100 में ठीक वही पूर्ववत वर्ग अंतराल 10 है। इस सारणी का अंतिम स्तंभ इन वर्गों के नये वर्ग चिह्नों को प्रदर्शित कर रहा है। सारणी 3.6 के पुराने वर्ग चिह्नों से उनकी तुलना करें। ध्यान दें कि इन वर्गों के प्रेक्षणों में नये वर्ग चिह्न मानों की अपेक्षा पुराने वर्ग चिह्न मानों से विचलन अधिक है। इस प्रकार से नये वर्ग चिह्न मान, इन वर्गों के आँकड़ों का पुराने मान की अपेक्षा बेहतर प्रतिनिधि त्व करते हैं।

चित्र 3.2 में, सारणी 3.7 के बारंबारता वितरण के बारंबारता वक्र को दिखाया गया है। इसमें सारणी के वर्ग चिह्नों को X-अक्ष पर तथा बारंबारताओं को y-अक्ष पर आलेखित किया गया है।

3.2 बारंबारता वक्र

क्रियाकलाप

  • यदि आप चित्र 3.2 के साथ चित्र 3.1 की तुलना करते हैं तो आप क्या देखते हैं? क्या आपने इनके बीच कोई अंतर पाया? क्या आप उस अंतर की व्याख्या कर सकते हैं?

सारणी 3.7

असमान वर्गों में बारंबारता वितरण

वर्ग प्रेक्षण बारंबारता वर्ग चिह्न
010 0 1 5
1020 10,14,17,12,14,12,14,14 8 15
2030 25,25,20,22,25,28 6 25
3040 30,37,34,39,32,30,35 7 35
4045 42,44,40,44,41,40,43,40,41 9 42.5
4550 47,49,49,45,45,47,49,46,48,48,49,49 12 47.5
5055 51,53,51,50,51,50,54 7 52.5
5560 59,56,55,57,55,56,59,56,59,57,59,55,
56,55,56,55 16 57.5
6065 60,64,62,64,64,60,62,61,60,62 10 62.5
6570 66,69,66,69,66,65,65,66,65 9 67.5
7080 70,75,70,76,70,71 6 75
8090 82,82,82,80,85 5 85
90100 90,100,90,90 4 95
योग 100

बारंबारता सरणी (Frequency Array)

अब तक हमने गणित में 100 छात्रों द्वारा प्राप्त किए गए प्रतिशत अंकों के उदाहरण का प्रयोग करते हुए संतत चर के लिए आँकड़ों के वर्गीकरण पर चर्चा की है। विविक्त चर के लिए, आँकड़ों का वर्गीकरण बारंबारता सरणी के नाम से जाना जाता है। चूँकि एक विविक्त चर मानों को धारण करता है न कि दो पूर्णाकों के बीच माध्यमिक भिन्नीय मानों को, अतः हम ऐसी बारंबारता रखते हैं जोकि अपने पूर्णांक मानों से संगत हों।

सारणी 3.8

परिवारों के आकार की बारंबारता सारणी

परिवार का आकार परिवारों की संख्या
1 5
2 15
3 25
4 35
5 10
6 5
7 3
8 2
योग 100

सारणी 3.8 में दिया गया उदाहरण बारंबारता सरणी को प्रदर्शित करता है। इस सारणी में चर ‘परिवार का आकार’ एक विविक्त चर है जो सारणी में दिखाए गए पूर्णाकों को ही धारण करता है।

6. द्विचर बारंबारता वितरण

बहुत बार, जब हम किसी जनसंख्या में से एक प्रतिदर्श लेते हैं, तो हम प्रतिदर्श के हर अवयव से एक से अधिक प्रकार की सूचना संगृहीत करते हैं। उदाहरण के लिए, मान लीजिए कि हमने एक शहर की कंपनियों की सूची में से 20 कंपनियों का एक प्रतिदर्श लिया है। मान लीजिए कि हम प्रत्येक कंपनी से P बिक्री तथा विज्ञापनों पर किए गए व्यय की जानकारी संगृहीत करते हैं। इस स्थिति में, हमारे पास प्रतिदर्श के द्विचर आँकड़े हैं। इस तरह के द्विचर आँकड़ों को द्विचर बारंबारता वितरण द्वारा संक्षिप्त रूप में दर्शाया जा सकता है।

सारणी 3.9

20 कंपनियों की बिक्री (लाख रु में) एवं विज्ञापन व्यय (हजार रु में) का द्विचर बारंबारता वितरण

115125 125135 135145 145155 155165 165175 योग
6264 2 1 3
6466 1 3 4
6668 1 1 2 1 5
6870 2 2 4
7072 1 1 1 1 4
योग 4 5 6 3 1 1 20

एक द्विचर बारंबारता वितरण को दो चरों के बारंबारता वितरण के रूप में परिभाषित किया जा सकता है।

सारणी 3.9, 20 कंपनियों के दो चर-बिक्री एवं विज्ञापन व्यय (लाख रु में) के बारंबारता वितरण को प्रदर्शित कर रही है। यहाँ पर बिक्री मानों को भिन्न स्तंभों में तथा विज्ञापन व्यय के मानों को भिन्न पंक्तियों में वर्णित किया गया है। प्रत्येक प्रकोष्ठ संतत पंक्ति एवं स्तंभ के मान की बारंबारता दिखाता है। उदाहरण के लिए, यहाँ पर तीन फर्म ऐसी हैं, जिनकी बिक्री रु 135-145 लाख रु के बीच है और उनका विज्ञापन व्यय 6466 हजार रु के बीच है। द्विचर वितरण के बारे में अध्याय 8 ‘सहसंबंध’ में अध्ययन किया जाएगा।

7. सारांश

प्राथमिक या द्वितीयक स्रोतों से संगृहीत किए गए आँकड़े अपरिष्कृत या अवर्गीकृत होते हैं। जब एक बार आँकड़े संगृहित हो जाएँ तो अगला चरण आगे के सांख्यिकीय विश्लेषण के लिए आँकड़ों का वर्गीकरण करना है। वर्गीकरण से आँकड़ों में क्रमबद्धता आ जाती है। यह अध्याय आप को यह जानने के योग्य बनाता है कि आँकड़ों को बारंबारता वितरण के माध्यम से बोधगम्य तरीके से किस प्रकार वर्गीकृत किया जाता है। एक बार जब आप वर्गीकरण की तकनीकों को जान जाते हैं तो आपके लिए यह आसान होगा कि आप संतत तथा विविक्त दोनों चरों के लिए ही बारंबारता वितरण की रचना कर सकें।

पुनरावर्तन

  • वर्गीकरण अपरिष्कृत आँकड़ों को क्रमबद्धता प्रदान करता है।
  • बारंबारता वितरण यह प्रदर्शित करता है कि किसी चर के विभिन्न मान, संगत वर्ग-बारंबारताओं सहित, किस प्रकार विभिन्न वर्गों में वितरित किए जाते हैं।
  • अपवर्जी विधि के अंतर्गत उच्च वर्ग सीमा को छोड़ा तथा निम्नवर्ग सीमा को शामिल किया जाता है।
  • समावेशी विधि में निम्नवर्ग सीमा तथा उच्च वर्ग सीमा, दोनों को ही शामिल किया जाता है।
  • बारंबारता वितरण में, आगे के साँख्यिकीय परिकलन केवल वर्ग चिह्न मान पर आधारित होते हैं, न कि प्रेक्षणों के मान पर।
  • वर्गों को इस प्रकार से बनाया जाना चाहिए कि, जहाँ तक संभव हो सके, प्रत्येक वर्ग का वर्ग चिह्न उस मान के अधिक से अधिक निकटतम हो, जिस मान के आस-पास, किसी वर्ग के प्रेक्षणों की संकेन्द्रण की प्रवृत्ति हो।

अभ्यास

1. निम्नलिखित में से कौन सा विकल्प सही है?

  • एक वर्ग मध्यबिन्दु बराबर है:

(क) उच्च वर्ग सीमा तथा निम्न वर्ग सीमा के औसत के।

(ख) उच्च वर्ग सीमा तथा निम्न वर्ग सीमा के गुणनफल के।

(ग) उच्च वर्ग सीमा तथा निम्न वर्ग सीमा के अनुपात के।

(घ) उपरोक्त में से कोई नहीं।

  • दो चरों के बारंबारता वितरण को इस नाम से जानते हैं:

(क) एक विचर वितरण

(ख) द्विचर वितरण

(ग) बहुचर वितरण

(घ) उपरोक्त में से कोई नहीं

  • वर्गीकृत आँकड़ों में साँख्यिकीय परिकलन आधारित होता है:

(क) प्रेक्षणों के वास्तविक मानों पर

(ख) उच्च वर्ग सीमाओं पर

(ग) निम्न वर्ग सीमाओं पर

(घ) वर्ग के मध्यबिन्दुओं पर

  • अपवर्जी विधि के अंतर्गत

(क) किसी वर्ग की उच्च वर्ग सीमा को वर्ग अंतराल में समावेशित नहीं करते।

(ख) किसी वर्ग की उच्च वर्ग सीमा को वर्ग अंतराल में समावेशित करते हैं।

(ग) किसी वर्ग की निम्न वर्ग सीमा को वर्ग अंतराल में समावेशित नहीं करते।

(घ) किसी वर्ग की निम्न वर्ग सीमा को वर्ग अंतराल में समावेशित करते हैं।

  • परास का अर्थ है

(क) अधिकतम एवं न्यूनतम प्रेक्षणों के बीच अंतर

(ख) न्यूनतम एवं अधिकतम प्रेक्षणों के बीच अंतर

(ग) अधिकतम एवं न्यूनतम प्रेक्षणों का औसत

(घ) अधिकतम एवं न्यूनतम प्रेक्षणों का अनुपात

2. वस्तुओं को वर्गीकृत करने में क्या कोई लाभ हो सकता है? अपने दैनिक जीवन से एक उदाहरण देकर व्याख्या कीजिए।

3. चर क्या है? एक संतत तथा विविक्त चर के बीच भेद कीजिए।

4. आँकड़ों के वर्गीकरण में प्रयुक्त अपवर्जी तथा समावेशी विधियों की व्याख्या कीजिए।

5. सारणी 3.2 के आँकड़ों का प्रयोग करें, जो 50 परिवारों के भोजन पर मासिक व्यय (रु में) को दिखलाती है, और

(क) भोजन पर मासिक परिवारिक व्यय का प्रसार ज्ञात कीजिए।

(ख) परास को वर्ग अंतराल की उचित संख्याओं में विभाजित करें तथा व्यय का बारंबारता वितरण प्राप्त करें।

  • उन परिवारों की संख्या पता कीजिए जिनका भोजन पर मासिक व्यय

(क) 2000/ रु से कम है

(ख) 3000/ रु से अधिक है

(ग) 1500/ रु और 2500/ रु के बीच है

6. एक शहर में, यह जानने हेतु 45 परिवारों का सर्वेक्षण किया गया कि वे अपने घरों में कितनी संख्या में सेल फोनों का इस्तेमाल करते हैं। नीचे दिए गए उनके उत्तरों के आधार पर एक बारंबारता सरणी तैयार कीजिए।

1 3 2 2 2 2 1 2 1 2 2 3 3 3 3
3 3 2 3 2 2 6 1 6 2 1 5 1 5 3
2 4 2 7 4 2 4 3 4 2 0 3 1 4 3

7. वर्गीकृत आँकड़ों में ‘सूचना की क्षति’ का क्या अर्थ है?

8. क्या आप इस बात से सहमत है कि अपरिष्कृत आँकड़ों की अपेक्षा वर्गीकृत आँकड़े बेहतर होते हैं?

9. एक-विचर एवं द्विचर बारंबारता वितरण के बीच अंतर बताइए?

10. निम्नलिखित आँकडों के आधार पर 7 का वर्ग अंतराल लेकर समावेशी विधि द्वारा एक बारंबारता वितरण तैयार कीजिए।

28 17 15 22 29 21 23 27 18 12 7 2 9 4
1 8 3 10 5 20 16 12 8 4 33 27 21 15
3 36 27 18 9 2 4 6 32 31 29 18 14 13
15 11 9 7 1 5 37 32 28 26 24 20 19 25
19 20 6 9

क्रियात्मक गतिविधि

  • अपनी पुरानी अंक सारणियों से, अपनी पूर्व कक्षा में अर्द्धवार्षिक तथा वार्षिक परीक्षाओं में प्राप्त गणित के प्राप्तांकों को पता कीजिए। इन्हें वर्ष के क्रम में व्यवस्थित कीजिए। अब यह जाँच कीजिए कि क्या उक्त विषय में आप द्वारा प्राप्त किए अंक चर हैं या नहीं। इसके साथ यह भी देखिए कि क्या बाद के वर्षों में गणित में आपकी स्थिति में सुधार हुआ है?