حال آمار توصیفی به عنوان مجموعهای از روشها که برای جمعآوری، خلاصهکردن، طبقهبندی و توصیف حقایق عددی در تحلیل آماری بهکار میرود و به توصیف دادهها و اطلاعات پژوهش پرداخته و قسمتی از کار مُحقق خواهد بود.
آمار توصیفی اطلاعاتی مثلا درباره “درآمد” پاسخگویان فراهم میکند و یا نشان میدهد که سطح تحصیلات بر الگوی رأی دادن افراد نمونه موثر است یا خیر. اما ما عموما در آمار توصیفی در پی اطلاع از نگرشها و خصوصیات مثلا 3000 نفر از اعضای نمونه نیستیم؛ بلکه در پی آن هستیم که در واقع یک توصیف را ایجاد کنیم. در بیان ساده “آمار توصیفی قصد دارد تعداد زیادی از داده ها را با نمودارها و جداول خلاصه توصیف کند، اما در مورد جمعیتی که نمونه از آنها گرفته شده است نتیجه گیری نمیکند”.
از آنجا که نمودارها و جداول، اجزای اصلی هستند؛ آمار توصیفی درک و تجسم دادههای خام را آسانتر میکند. بطور کلی با انجام آمار توصیفی نکات پنهان در دادهها مشخص شده و بررسی اکتشافی در داده انجام میگیرد.
این عملیات در آمار توصیفی سه روش کلی دارد:
1- جداول آماری
2- استفاده از نمودارهای آماری
3- محاسبه مقادیر خاص
با تشکیل جدول توزیع فراوانی میتوان حجم وسیعی از دادههای نامنظم را به آسانی نمایش داد. دلیل ایجاد جدول آماری توزیع فراوانی، سازماندهی دادهها یا مشاهدات به صورت طبقات همراه با فراوانی هر طبقه میباشد. در ایجاد یک جدول توزیع فراوانی از فرمولهای خاصی برای محاسبه حجم، دامنه تغییرات و تعداد طبقات استفاده میشود. در جدول آماری توزیع فراوانی، از عناوینی تحت عنوان فراوانی مطلق دادهها برای آگاهی از تعداد دادهها در هر طبقه، فراوانی نسبی، فراوانی تجمعی، فراوانی تجمعی نسبی استفاده میشود.
تشکیل جدول توزیع فراوانی یک روش اقتصادی و آسان برای نمایش انبوهی از دادههای نامنظم است. اما در طبقهبندی کردن ممکن است برخی از اطلاعات به علت خطای گروهبندی از دست بروند و در نهایت بر محاسبه شاخص های مرکزی تحلیل آماری نیز تاثیر بگذارند. ولی مقدار آن اغلب ناچیز است و اشکال عمدهای ایجاد نمیکند.
نمودار آماری در آمار توصیفی یک ابزار مناسب برای نمایش تصویری اطلاعات است. نمودار آماری انواع مختلفی دارد؛ از جمله نمودار هیستوگرام، نمودار ستونی یا میلهای، نمودار چند ضلعی، نمودار دایرهای یا در اصطلاح کلوچهای، نمودار سریهای زمانی، نمودار پراکنش میتوان نام برد.
یک مسئله مهم در محاسبات آماری، تعیین ویژگیها و موقعیت کلی دادهها یا محل تمرکز دادهها است؛ که به آن محاسبه شاخص های مرکزی گفته میشود. اگر شاخص های مرکزی به سادگی قابل محاسبه بوده و امکان استفاده و بکارگیری تمام دادهها وجود داشته باشد؛ همینطور امکان محاسبه آنها به فرم ریاضی نیز فراهم باشد؛ میتوان گفت شاخص معتبر و دارای ارزش میباشد.
سه نوع از شاخص های مرکزی برای محاسبه:
1- نما Mode: این شاخص در تحقیقاتی که معیار اندازهگیری اسمی بوده و برای یافتن عددی با تکرار بالا و داشتن اطلاع از گرایشهای مرکزی در سریعترین زمان، مورد استفاده قرار میگیرد.
2- میانه Median: میانه نیز مانند نما برای اطلاعات اسمی و رتبهای مورد استفاده قرار میگیرد.
3- میانگین Mean: برای یافتن یک مقدار متوسط و در تحقیقاتی که مقیاس اندازهگیری دادهها حداقل فاصله باشد، مورد استفاده قرار میگیرد.
شاخص های پراکندگی میزان پراکنش هر متغیر در اطراف میانگین و نقطه تمرکز میباشد. به بیان سادهتر میتوان گفت: میزان تغییر و پراکندگی در بین دادههای نتایج تحقیقات را به محقق نشان میدهند. ازجمله شاخصهایی که برای این منظور مورد استفاده قرار میگیرند میتوان به شاخص انحراف استاندارد (Standard Deviation) برای نمایش میزان پراکندگی توزیعات پیوسته بر حسب واحد اندازه گیری، واریانس (Variance) که انحراف میان یکی از مقادیر داده و میانگین آن است، دامنه تغییرات به معنای فاصله کوچکترین و بزرگترین مقادیر در کل دادههای موجود و انحراف چارگی (Quartile Deviation) اشاره کرد.
از آنجایی معیارهای پراکندگی معرفی شده از جمله انحراف معیار، به واحد اندازهگیری دادهها بستگی دارند؛ برای مقایسه پراکندگی دو جامعه دارای واحد های متفاوت و بیان میزان پراکندگی به صورت درصدی،می توانید از ضریب تغییرات استفاده کنید.
کم بودن پراکندگی، نشانگر همگن بودن جامعه بوده و داشتن ضریب تغییرات کمتر به دلیل دقت بیشتر نتایج گرفته شده از شاخص میانگین، نشاندهنده یک جامعه بهتر است. ضریب تغییرات تنها برای مقیاسهای نسبی کاربرد دارد و امکان استفاده از آن برای سنجش مقادیری که میتوانند مقدار منفی بگیرند وجود ندارد.
در برخی از تحقیقات، به منظور تعیین رابطه بین دو متغیر باید از روشهای همبستگی (Correlation) استفاده کرد. مقیاس اندازهگیری متغییرها تاثیر زیادی برضریب همبستگی محاسبه شده دارد.
در محاسبه ضریب همبستگی، نوع مقیاس اندازهگیری متغییرها تاثیر بسیاری دارد و با توجه به نوع متغییر ضریب همبستگی ممکن است مقادیر متفاوتی داشته باشد. که معمولا این ضرایب توسط نرمافزارها به دست میآیند.
شما براحتی و حتی بدون نیاز به این نرمافزارها و یا داشتن تخصصی میتوانید با استفاده از سرویس تحلیل آماری آنلاین در بیگ پرو 1 به صورت آنلاین، تحلیل خود را تنها با چند کلیک و به سادگی انجام دهید.
رگرسیون (Regression) به روش خاصی که برای مطالعه سهم متغییرهای مستقل در پیشبینی متغیر وابسته استفاده میشود، اطلاق میگردد. این تحلیل یک روش برای مدلسازی ارتباط بین متغییرها و همینطور بررسی آنهاست. و جالب است که بدانید که کاربرد رگرسیون تنها به تحلیل آماری ختم نمیشود بلکه در سایر زمینهها نیز کاربرد دارد؛ چراکه علم پیشبینی مورد توجه اکثر علوم و مشاغل در دنیاست.
رگرسیون انواع خاصی دارد از جمله: رگرسیون خطی، انحنایی، رگرسیون لوجیستیک و تحلیل کواریانس که هم در تحقیقات توصیفی و هم تغییرات آزمایشی قابل استفاده است.
همانطور که در بخش مربوط به رگرسیون گفته شد، تحلیل ماتریس کواریانس یا ماتریس همبستگی یکی از تحلیلهای همبستگی است. دو نوع از معروفترین این تحلیلها عبارتند از :1- مدل معادلات ساختاری برای بررسی روابط بین متغیرها 2- مدل تحلیل عاملی برای پی بردن به متغیرهای زیربنایی یک پدیده در دو دسته اکتشافی و تاییدی.
Quick support
2 Comments
سلام، ممنون از توضیحات کاملتون، خیلی خوب و مفید بود
سلام دوست عزیز،
خوشحالیم که از بیگ پرو1 راضی هستید