قبل از آمار استنباطی، در یک مقاله جداگانه آمار توصیفی را شرح داده و برخی از روشهای مورد استفاده در آن را نیز توضیح دادیم. در این مقاله قصد داریم که راجعبه آمار استنباطی توضیحاتی را ارائه دهیم.
اجازه دهید با این سوال شروع کنیم که “اگر قرار باشد که رفتار مردم یک کشور بزرگ را مورد بررسی قرار دهید، میتوانید که تک تک افراد آن کشور را آزمایش کنید و به نتیجه بررسید؟” بدیهی است که حتی اگر این کار ممکن باشد، مقرونبهصرفه نیست زیرا نیازمند هزینه و زمان فراوانی است. حال بحث آمار استنباطی به وسط میآید که شامل روشهای پیشرفتهتری نسبت به آمار توصیفی است.
گاهی در تحلیلهای آماری به جامعه مورد نظر دسترسی نداریم ولی باید بتوانیم آن را تحلیل کرده و به اطلاعات مفیدی راجعبه آن برسیم. در این حالت، سادهترین روش، گرفتن مجموعهای کوچکتر از جامعه مورد نظر و سپس تحلیل آن است. در حقیقت باید از یک جامعه آماری نمونه گیری کنیم. در نهایت باید بتوانیم اطلاعات به دست آمده از تحلیل را به جامعه بزرگتر تعمیم دهیم. اینکارها در حقیقت با استفاده از آمار استنباطی امکانپذیر است.
از آنجایی که در آمار استنباطی ما به همه جامعه آماری دسترسی نداریم باید نمونه کوچکی از جامعه را مورد بررسی قرار داده و آن را به جامعه بزرگتر تعمیم دهیم.
همانطورکه پیشتر اشاره کردیم، در آمار استنباطی ما باید مجموعه کوچکتری از جامعه آماری را مورد بررسی قرار داده و نتیجه را به جامعه آماری تعمیم دهیم. در حقیقت جامعه آماری همان جامعهای است که بررسیها قرار است روی آن صورت گیرد. نمونه گیری در جامعه آماری به روشهای مختلفی صورت میگیرد که برخی از آنها عبارتنداز: نمونه گیری تصادفی، طبقهای و سهمیهای.
روش های بیشتری موجود هستند که در ادامه مورد بررسی قرار میگیرند. به طورکلی در آمار و احتمال، روشهای نمونه گیری به سه دسته احتمالی، غیر احتمالی، اُریب و نااُریب تقسیم میشوند. انتخاب یک نمونه مناسب از جامعه، یکی از مهمترین مراحل در آمار استنباطی است.
این در حالی است که در آمار توصیفی قصد داریم تعداد زیادی از دادهها را با نمودارها و جداول خلاصه توصیف کنیم، اما در مورد جمعیتی که نمونه از آنها گرفته شده است نتیجهگیری نمیکنیم.
در آمار توصیفی نمادها لاتین و در آمار استنباطی نمادها یونانی هستند.
روشهای مختلفی در آمار و احتمال برای نمونه گیری از جامعه آماری موجود است. هر کدام از این روشها در یک مجموعه جداگانه قرار داشته و پیادهسازی آنها متفاوت است. مهم ترین مسئله در آمار استنباطی نمونه گیری است. همانطور که پیشتر اشاره کردیم، سه دسته برای نمونه گیری داریم:
1- احتمالی
2- غیر احتمالی
3- اُریب و نااُریب
در ادامه مطلب به معرفی انواع آمار استنباطی میپردازیم.
آمار استنباطی ناپارامتریک زمانی استفاده میشود که ما از نحوه توزیع دادهها اطلاعات کمی در اختیار داریم. در حقیقت با مفروضات کمتر آزمونهای آماری خود را انجام میدهیم. فرد محقق نیز بسته به هدف خود در آمار استنباطی ناپارامتریک میتواند از روشهای مختلفی استفاده کند که برخی از آنها عبارتند از تحلیل واریانس، تحلیل کواریانس، همبستگی و…
در سایت بیگ پرو1 شما میتوانید به راحتی دیتاستهای خود تحلیل کنید و از آنها اطلاعات مفیدی استخراج کنید. کافی است در پروفایل کاربری خود به بخش دادهکاوی رفته و سپس روی گزینه تحلیل آماری کلیک کنید. در مرحله بعد کافی است که یکی از دیتاستهای خود را انتخاب کنید و بسته به هدف خود یکی از روشهای تحلیل آماری را انتخاب کنید. در بیگ پرو1 این امکان وجود دارد که از آزمونهای ناپارامتری استفاده کنید.
هنگام استفاده از آمار استنباطی پارامتری ما از شکل دادهها در جامعه آماری مطلع هستیم و این آزمونها بیشتر در مورد دادههای کمی مورد استفاده قرار میگیرد که معمولا دارای توزیع نرمال هستند. هنگامی که ما درباره شکل توزیع دادهها اطلاعاتی در اختیارداریم آرمون های پارامتری ارجحیت بیشتری نسبت به آزمونهای پارامتری دارند.
در آزمون دقت شما می توانید دقت مدل خود را هنگام استفاده از دادههای دودویی(داده هایی که دو حالت دارند) برای مقادیر درست ارزیابی کنید و معیارهای مختلف ماتریس درهمریختگی را به دست آورید. هر چند اگر حد آستانه خاصیهم نداشته باشید باز هم میتوانید با استفاده از نمودار roc curve و به دست آوردن سه مقدار حد آستانه بالا، پایین و متوسط یکی از آنها را انتخاب کرده و به عنوان حد آستانه در نظر بگیرید.
این آزمون میزان همبسته بودن ویژگیها را محاسبه میکند؛ این آزمون هم در آمار توصیفی کاربرد دارد و هم در آمار استنباطی. در بیگ پرو1 میتوانید با استفاده از تعیین نوع داده (کمی یا کیفی) و انتخاب حد اقل دو ستون میزان همبسته بودن این دو ویژگی را با استفاده از آزمون های فرض آماری بدست آورید.
به زبان ساده تحلیل ضرایب همبستگی ضرایبی را به دست میآورد که میزان وابستگی متغییرهای آماری را نشان میدهد. این ضریب بین یک (مستقیم) تا منفی یک (معکوس) است و در صورت عدم وجود رابطه بین دو متغیر، برابر صفر است. منظور از رابطه مستقیم این است که با کمشدن یک متغییر، متغییر وابسته دیگر نیز کم میشود و عکس این قضیه؛ و منظور از معکوس این است که با کم شدن یکی دیگری زیاد میشود.
Quick support