आंकड़ाशास्त्र विषय

आँकड़े (JEE और CBSE)

केंद्रीय प्रवृत्तियों के माप:

  • औसत: एक संख्या सेट का औसत.

  • माध्य: अर्झित क्रम में व्यवस्थित किए जाने पर संख्या सेट का मध्यमीय मान।

  • मोड: संख्या सेट में सबसे अधिक बार प्राप्त होने वाला मान।

विस्तार की माप:

  • सीमांक: संख्या सेट में सबसे बड़े और सबसे छोटे मानों के बीच का अंतर.

  • विप्रकृति: प्रत्येक संख्या और औसत के बीच के वर्गीकृत अंतरों का औसत.

  • मानक विचलन: विप्रकृति का वर्गमूल.

संभावना:

  • नमूना स्थान: प्रायोगिक के सभी संभावित परिणामों का सेट।

  • घटना: नमूना स्थान का एक उपसेट।

  • स्वतंत्र घटनाएं: घटनाओं का प्रकट होना जो एक दूसरे पर प्रभाव नहीं डालती हैं।

  • शर्तानुसार संभावना: एक आईनी घटना हो चुकने की संभावना जब बताये जाने वाले कारणों के मानक और इसकी पूर्व संभावनाओं के साथ निर्धारित करने के लिए एक सूत्र।

  • बेज़ थ्योरेम: एक घटना की शर्तानुसार संभावना की गिनती करने के लिए एक सूत्र, जिसमें इसकी पूर्व संभावनाएं और उसके संभावित कारणों की संभावनाएं शामिल होती हैं।

यादृच्छिक प्रायोज्यों:

  • विक्रमी यादृच्छिक प्रायोज्य: ऐसा यादृच्छिक प्रायोज्य जो केवल एक सीमित या गिनतीशील संख्या मान ले सकता है।

  • निरंतर यादृच्छिक प्रायोज्य: ऐसा यादृच्छिक प्रायोज्य जो निर्दिष्ट सीमा में किसी भी मान को ले सकता है।

  • संभावना वितरण: एक यादृच्छिक प्रायोज्य के प्रत्येक संभावित मान की संभावना देने वाला फ़ंक्शन।

    • बिनोमियल वितरण: एकाधिकार में होने वाले अनुरूप प्रायोज्य की संभावना वितरण, जिनमें प्रत्येक प्रायोज्य की एक स्थिर सफलता की संभावना होती है।

    • पॉयसन वितरण: किसी निर्दिष्ट समय या स्थान के आंतराल में होती घटनाओं की संख्या की संभावना वितरण अगर ये घटनाएं आदित्य दर से होती हैं और आदित्य दर से पहले होने के समय के अनुरूप स्वतंत्र होती हैं।

    • सामान्य वितरण: एक घटनाओं के उपयोग से चरित्रित एक संभावना वितरण, जिसमें घटनाएं एक घड़ीवाले कर्वट द्वारा करिये जाते हैं।

नमूनाकरण:

  • नमूना विधियाँ: जनसंख्या से एक नमूना चुनने के उपयोग में आने वाली तकनीकें।

    • सरल यादृच्छिक नमूनाकरण: जनसंख्या के प्रत्येक सदस्य का एक समान मौका चुना जाना।

    • पंचीकृत यादृच्छिक नमूनाकरण: जनसंख्या को स्तरों में बांटा जाता है, और फिर प्रत्येक स्तर से सरल यादृच्छिक नमूना लिया जाता है।

    • यायात्मक यादृच्छिक नमूनाकरण: जनसंख्या के सदस्यों को नियमित अंतरालों पर चुना जाता है।

    • गुच्छ नमूनाकरण: कार्यान्वयन के लिए यथावत खर्च क्षमता के साथ फैला हुआ होने के कारण, जब सदस्य नमूना फ्रेम में व्याप्त होते हैं।

परीक्षण का परीक्षण:

  • शून्य अभिकथन: दो समूहों या जनसंख्याओं के बीच कोई महत्वपूर्ण अंतर नहीं होने का कथन।

  • वैकल्पिक अभिकथन: दो समूहों या जनसंख्याओं के बीच एक महत्वपूर्ण अंतर होने का कथन।

    • प्रकार I त्रुटियाँ: सत्य शून्य अभिकथन को खारिज करने की त्रुटि

    • प्रकार II त्रुटियाँ: झूठे शून्य अभिकथन को स्वीकार करने की त्रुटि

  • महत्व का स्तर: प्रकार I त्रुटि करने की अधिकतम संभावना।

  • परीक्षा आँकड़ों के जोखिम को खारिज करने का प्रमाण: एक माप जो यह निर्धारित करने के लिए प्रयुक्त किया जाता है कि क्या नमूना आँकड़े खारिजीवाद का समर्थन करता है या नहीं।

  • p-मान: यह संभावना है कि एक परीक्षा आँकड़ा प्राप्त किया जा सकता है, जो कि सर्वोच्च तथा अधिक सर्वोच्च को बाहरी हो या जहां परीक्षित किया जाता है, यह मानते हुए कि खाली कल्पना सत्य है।

  • चि-वर्ग परीक्षण: एक सांख्यिकीय परीक्षण जिसका उपयोग किया जाता है ताकि दो या अधिक श्रेणियों में घटनाओं के औसत आवृत्तियों के बीच में अनुमानित आवृत्तियों से यथार्थ भिन्नता दिखा सकें।

t-परीक्षा: एक सत्यापित करने के लिए प्रयुक्त परीक्षा आँकड़ा जो यह निर्धारित करता है कि दो निर्पेक्ष समूहों के औसत एक दूसरे से प्रमुख रूप से भिन्न हैं या नहीं।

एफ-परीक्षा: दो या अधिक निर्पेक्ष समूहों के विचार की गणना करने के लिए प्रयुक्त सांख्यिकीय परीक्षण है। *

**एक-वाय एएनओवीए:** एक सांख्यिकीय परीक्षण जो तीन या उससे अधिक स्वतंत्र समूहों के औसत की तुलना करता है जिनमें दो से अधिक डेटा बिंदु होते हैं, उनके संबंधित नमूना औसतों के बीच की भेदभाव स्थापित करने के लिए और यह निष्कर्ष निकालने के लिए कि क्या सभी आबादी औसत समान हो सकती है।

रैखिक प्रसारण:

  • सबसे छोटे वर्गों का विधि: डेटा बिंदुओं का एक सेट पर सबसे अच्छा मेल खोजने के लिए उपयोग किया जाता है

  • प्रसारित पंक्ति: रैखिक प्रसारण के आधार पर एक सेट डेटा बिंदुओं के सबसे अच्छे मेल को दिखाने वाली पंक्ति

  • संबंध संकेतक: दो चरों के बीच एक रैखिक संबंध की मजबूती और दिशा का मापन करता है

  • निर्धारण के संकेतक का गुणांक: निर्धारण के संकेतक कोई और माप है जिसे लगाया जाता है ताकि संबंधित कल्पित रैखिकीय पंक्ति के साथ डेटा कितना संकर करता है।