ضريب همبستگي و انواع آن در تحليل آماري

  1. خانه
  2. chevron_right
  3. مقالات تحلیل آماری
  4. chevron_right
  5. همبستگی و رگرسیون
  6. chevron_right
  7. ضريب همبستگي و انواع آن در تحليل آماري
نام دسته مطالب: همبستگی و رگرسیون

ضريب همبستگي و انواع آن در تحليل آماري

7 دیدگاه


مقدمه

در اين مقاله به بررسي موضوع ضريب همبستگي يا correlation coefficient که يکي از مفاهيم بنيادي در علم آمار است خواهيم پرداخت و به نقش آن در مدل سازي معادلات ساختاري اشاره خواهيم نمود.

1- انواع ضرایب همبستگی

سر فرانسیس گالتون همبستگی و رگرسیون را برای وارسی کواریانس در دو یا تعداد بیشتری از خصیصه ها مفهوم سازی کرد و کارل پیرسون (1896) براساس نظریه گالتون فرمول آماری برای ضریب همبستگی و رگرسیون ارائه داد(1986).به مدت کوتاهی پس از آن چارلز اسپیرمن(1904) روش همبستگی را برای روش تحلیل عاملی به کار برد. تکنیک های همبستگی ،رگرسیون و تحلیل عاملی برای دهه های متمادی پایه و اساس تهیه ی آزمون ها و تعریف سازه ها را شکل داده اند . .

ضریب همبستگی پیرسون پایه ای را برای ارائه و آزمون مدل ها در میان متغیرهای اندازه گیری شده و پنهان مهیا می کند. علاوه برآن همبستگی های تفکیکی و نیمه تفکیکی تعریف خاصی از روابط دو متغیره را بین متغیرها امکان پذیر می سازند که در آن واریانس صرفاً مشترک بین دو متغیر، در حالی که نفوذ سایر متغیرها کنترل شده است، تبیین می شود. همبستگی هایتفکیکی و نیمه تفکیکی نیز همچون ضریب همبستگی پیرسون می توانند مورد آزمون معناداری قرار گیرند.

در کنار ضریب همبستگی پیرسون که تأثیرات فراوانی بر علم آمار دارد سایر ضرایب همبستگی نیز بسته به سطح سنجش متغیرها معرفی شده اند.استیونز(1968) انواعی از مقیاس های اندازه گیری را معرفی کرده است که به عنوان مقیاس های اسمی، ترتیبی، فاصله ای و نسبی شناخته شده اند. انواع ضرایب همبستگی توسعه یافته برای این سطوح اندازه گیری در جدول زیر مشخص شده اند.

انواع ضريب همبستگی

در ادامه با توجه به نقش با اهمیتی که همبستگی(واریانس مشترک) در مدل سازی معادله ساختاری بازی می کند، عواملی را طرح می کنیم که بر ضرایب همبستگی اثر می گذارند.

2- عوامل موثر بر ضرایب همبستگی

عوامل اصلی در این رابطه عبارتند از: سطح اندازه گیری، محدودیت دامنه تغییرات مقادیر(تغییر پذیری، چولگی و کشیدگی)، داد های از دست رفته، غیر خطی بودن، مقادیر دورافتاده ، تصحیح تضعیف و موارد مرتبط با تغییر نمونه گیری، فاصله اطمینان، حجم اثر، معناداری و توان بیان شده در برآوردهای خودگردان.

1-2. سطح اندازه گیری و دامنه تغییرات مقادیر

چهار نوع یا سطح اندازه گیری برای مقیاس های سنجش متغیرهای اسمی ، ترتیبی، فاصله ای و نسبی تعریف شده است (استیونز 1968).در مدل سازی معادله ساختاری هر یک از انواع چهارگانه ی مذکور را می توان در ساخت مدل مشارکت داد. مدل سازی معادله ساختاری به متغیرهای اندازه گیری شده در سطح فاصله ای یا نسبی نیاز داشته و لذا ضرایب همبستگی گشتاوری پیرسون دررگرسیون، تحلیل مسیر، تحلیل عاملی و مدل سازی معادله ساختاری مورد استفاده قرار می گیرد.همچنین لازم است که مقادیر متغیرهای فاصله ای و نسبی برای محاسبه واریانس دارای دامنه تغییرات به اندازه کافی بزرگ باشند.اگر دامنه تغییرات نمرات محدود باشد شدت همبستگی کاهش می یابد.

نکته ی دیگری که در مورد همبستگی بین مقادیر بایستی بدان اهمیت داده شود این است که اگر توزیع متغیرها به طور گسترده ای واگرا هستند، همبستگی می تواند تحت تأثیر قرار گیرد.برای جلوگیری از این موضوع تغییر شکل هایی مانند تبدیل ریشه دوم، تبدیل لگاریتمی، تبدبل معکوس و …پیشنهاد می شود.

2-2. غیر خطی بودن

ضریب همبستگی پیرسون نشان دهنده ی درجه رابطه خطی بین دو متغیر است.بنابراین ممکن است دو متغیری که دارای رابطه ی غیر خطی با یکدیگر هستند براساس این ضریب رابطه ای را نشان ندهند. در اینجا از ضریب اتا به عنوان شاخصی برای رابطه غیرخطی بین دو متغیر و با آزمون اثرات خطی ، درجه دوم و درجه سوم استفاده می شود.

3-2. داده های از دست رفته

در یک ماتریس همبستگی با چندین متغیر، ضرایب همبستگی متفاوتی برای حجم نمونه های متفاوت می توانند محاسبه شوند.حذف انفرادی یا زوجی آزمودنی ها منجر به تفاوت در حجم نمونه برای ضرایب همبستگی موجود در ماتریس همبستگی می شود.

یک رویکرد مقدماتی در برخورد با داده های از دست رفته ، حذف هر مورد مشاهده شده ای است که دارای داده ی از دست رفته باشد. اما این روش توصیه نمی شود چراکه باعث از دست رفتن اطلاعات برای سایر متغیرها خواهد شد.روش دیگرحذف زوجی می باشد، این رویکرد داده ها را تنها هنگامی کنار می گذارد که آن ها برای دو متغیر از متغیرهای گزینش شده در تحلیل دارای داده از دست رفته باشند. سومین رویکرد که جایگزین کردن داده ها است، مقادیر از دست رفته را با یک برآورد جایگزین میکند. به عنوان مثال میانگین یک متغیر برای داده های موجود، با مقادیر از دست رفته برای کلیه موارد داده های فاقد داده همان متغیر جایگزین می شود.

4-2. مقادیر دور افتاده

ضریب همبستگی پیرسون به طور قابل توجهی به وسیله ی یک داده ی دورافتاده منفرد چه برای X و چه برای Y تحت تأثیر قرار می گیرد. در پژوهش های بسیاری این موضوع به دقت مورد بررسی قرار گرفته است که چگونه داده های دور افتاده متفاوت برای x یا Y یا هردو روبط همبستگی را تحت تأثیر قرار می دهند و چگونه می توان با استفاده از آماره های استوارار به تحلیل بهتری دست یافت.

5-2. تصحیح تضعیف

یک مفروضه ی اصلی در نظریه اندازه گیری این است که داده های مشاهده شده دارای خطای سنجش هستند. یک ضریب همبستگی پیرسون بسته به اینکه آیا آن ضریب با نمرات مشاهده شده (دارای خطا) یا نمرات واقعی(هنگامی که خطای سنجش را کنار گذاشته ایم) محاسبه شود مقادیر متفاوتی را نشان می دهد. ضریب همبستگی پیرسون می تواند برای خطاهای سنجش تضعیف کننده و ناپایدار در نمرات، تصحیح شده و به این ترتیب به یک مقدار واقعی از ضریب دست یابیم.در عین حال ضریب تصحیح شده می تواند مقداری بیش از 1 را نیز به خود بگیرد. پایین بودن قابلیت اعتماد در متغیرهای مستقل یا وابسته همراه با یک همبستگی بالا بین متغیر مستقل و وابسته می تواند ضریب همبستگی را به بالاتر از مقدار 1 برساند.

6-2. ماتریس های معین غیر مثبت

ضرایب همبستگی بالاتر از مقدار1 در یک ماتریس همبستگی باعث معین و غیر مثبت شدن ماتریس همبستگی می شود.در اینصورت حل معادله مجاز نبوده و برآورد پارامترها قابل محاسبه نمی باشد.

ماتریس کواریانس معین غیر مثبت هنگامی رخ می دهد که دترمینان ماتریس صفر است و یا اینکه محاسبه معکوس ماتریس ممکن نیست. عواملی که چنین وضعیتی را بوجود می آورند عبارتند از ضریب همبستگی بزرگتر از 1، وابستگی خطی در میان متغیرهای مشاهده شده، همخطی در میان متغیرهای مشاهده شده، وجود وتغیری که ترکیب خطی از سایر متغیرها است، حجم نمونه کمتر از تعداد متغیرها، وجود واریانس صفر یا منفی، واریانس-کواریانس(همبستگی) خارج از دامنه تغییرات مجاز(∓1) و مقدار شروع کننده نامناسب در مدل هایی که توسط کاربر تعریف شده اند.

راه حل های ممکن برای حل چنین خطایی عبارتند از : کاهش میزان اشتراک یا تثبیت آن به مقدار کمتر از1، بیرون کشیدن تعدادی از عامل ها، تعریف مقیاس جدید برای متغیرهای مشاهده شده.

7-2. حجم نمونه

در مدل سازی معادله ساختاری، محقق اغلب به حجم نمونه بسیار بزرگتری از حد معمول نیاز دارد تا با حفظ توان لازم به برآوردهای باثبات تری از پارامترها و خطاهای استاندارد دست یابد. همچنین بخشی از نیاز به حجم نمونه به وجود متغیرهای پنهان مربوط است. علاوه برمقادیر مختلفی که برای حجم نمونه پیشنهاد شده است، برخی از قاعده سرانگشتی به ازای هر متغیر 10 واحد نمونه یا به ازای هر متغیر 20 واحد نمونه استفاده کنند. با این حال باید توجه داشت که هرچه حجم نمونه بزرگتر باشد احتمالاً باعث می شود که فرد بتواند با استفاده از روش دو نیمه کردن به اعتبار بیشتری برای مدل ها دست یابد.

منبع: مقدمه ای بر مدل سازی معادله ساختاری ، انتشارات جامعه شناسان. نویسندگان : رندال ای ، شوماخر و ریچارد جی لومکس. ترجمه : دکتر وحید قاسمی.

براي مشاهده ساير مقاله هاي تحليل آماري اين وب سايت بر لينک زير کليک نماييد: صفحه مقاله هاي تحليل آماري

3- مدل سازي معادلات ساختاري چيست؟

پژوهشگر گرامي، چنانچه مايليد در خصوص مدل سازي معادلات ساختاري بيشتر بدانيد، پيشنهاد مي شود به وب سايت ويژه مدل سازي معادله ساختاري با نرم افزار اسمارت پي ال اس (Smart Pls) این شرکت آماری مراجعه نماييد: مدل سازي معادلات ساختاري با نرم افزار اسمارت پي ال اس

ساير منابع مرتبط با نکات تحليلي آماري

در خصوص موضوعات مختلف تحليل آماري مي توانيد از مطالب وب سايت ديگر اين شرکت آماری نيز استفاده نماييد: مقاله و موضوعات تحليل آماري

5/5 - (7 امتیاز)
, ,
آثار همخطی چند گانه در یک مدل رگرسیون
ضریب همبستگی کرامر

سایر مطالب مرتبط با موضوع فوق:

توجه شود که بخش سوال و جواب ها و کامنتها بعد از این بخش قرار دارد.

ضریب همبستگی

ضریب همبستگی پیرسون و ضريب همبستگي اسپيرمن

comment293 دیدگاه
1- ضریب همبستگی پیرسون ضریب همبستگی پیرسون که به نام های ضریب همبستگی گشتاوری و یا ضریب همبستگی مرتبه ی صفر نیز نامیده می شود ، توسط سر کارل پیرسون معرفی شده است. این ضریب به منظور تعیین میزان رابطه،…
آنالیز واریانس

تحلیل واریانس چند متغیری مانوا و مفروضه های آن

comment40 دیدگاه
مقدمه برای مقایسه میانگین اثرات یک یا چند متغیر مستقل بر روی یک متغیر وابسته براساس طرح های آزمایشی مختلف، روش های آماری متعددی مانند آزمون t و آزمون تحلیل واریانس تک متغیری ANOVA بکار گرفته می شود. اما در حالتی که…
chi-square

آزمون مربع کای يا خي دو

comment23 دیدگاه
خی دو یا آزمون مقایسه داده های مستقل رده اي به منظور بررسی ارتباط بین دو متغیر مستقل رده ای، چنانچه متغیرهای مورد نظر بیش از دو رده داشته باشند، داده های آن ها را در یک جدول  r*c  خلاصه…
فیشر تست

آزمون فیشر- آزمون مقایسه داده های مستقل رده ای

comment21 دیدگاه
به منظور بررسی وابستگی میان دو گروه از داده های غیر زوجی، در صورتیکه داده های مورد نظر کیفی باشند از روش تحلیل جداول توافقی استفاده می شود. فرض صفر مورد آزمون در این حالت استقلال متغیرهای سطری و ستونی…
تحلیل آماری

سوال و جواب پیرامون این مبحث از طریق ارسال دیدگاه:
– نیاز به عضویت در سایت ندارد
– از طریق ایمیل خود، از دریافت پاسخ مطلع می گردید
– اگر کامنتها زیاد است، برای جستجو و یافتن سوال مد نظر خود از (f + Ctrl) استفاده نمایید.
– لطفا دوستانی که اطلاعاتی تخصصی و یا تجربه ای دارند، به سوالات پاسخ دهند تا محققان سراسر کشور بهره ببرند (زکات علم نشر آن است)

7 دیدگاه. همین الان خارج شوید

  • سلام. لطفا سوالات و نظرات خود در خصوص اين مطلب را در همين بخش ديدگاه مطرح نماييد. از طريق ايميل از پاسخ ما مطلع خواهيد شد.
    براي جستجو در ميان کامنت ها از Ctrl + f استفاده نماييد.

    پاسخ
  • وقتی که همبستگی تفکیکی یا نیمه تفکیکی را به دست میاوریم و این ضریب همبسگی نسبت به ضریب همبستگی پیرسونی که در صورت سوال داشتیم کاهش یا افزایش پیدا کند به چه معناست؟

    پاسخ
    • فاطمه توکلی
      سپتامبر 24, 2020 9:38 ق.ظ

      سلام
      همبستگی جزیی دو متغیر Y و X همبستگی آن دو متغیر بعد از برداشتن اثر متغیرهای مستقل دیگر از روی هر دو متغیر Y و X است.
      کاربرد همبستگی جزئی:
      1. همبستگی جزئی دو متغیر اساساً برای کنترل رابطه دو متغیر با ثابت نگه داشتن آماری اثر سایر متغیرهایی است که شاید هر دو متغیر به آنها وابسته باشند.
      2. کاربرد دیگر همبستگی جزئی تعیین سودمندی افزودن یک متغیر مستقل به رگرسیون خطی است.
      همبستگی نیمه جزیی دو متغیر وابسته Y و متغیر مستقل X همبستگی آن دو متغیر بعد از برداشتن اثر متغیرهای مستقل دیگر از روی X است.
      کاربرد همبستگی نیمه جزئی:
      همبستگی نیمه جزئی برای محاسبه اثر متغیر مستقل (X) بر متغیر وابسته (Y) بعد از کنار گذاشتن اثر سایر متغیرهای مستقل موثر بر متغیر مستقل به کار می‌رود.
      در واقع همبستگی تفکیکی و نیمه تفکیکی در حضور سایر متغیرها هست اما در همبستگی پیرسون فقط دو متغیر حضور دارند

      پاسخ
  • سلام ببخشید از چه روشی برای محاسبه همبستگی بین دو متغیر اسمی مرتب شده ؛ استفاده میشود ؟

    پاسخ
  • در صورتی‌ که بین دو متغیر همبستگی وجود داشته باشد، چنان چه حجم نمونه افزایش پیدا کند، ضریب همبستگی آن ها چه تغییری خواهد کرد؟

    پاسخ
    • به نظرم در خود ضریب همبستگی اتفاق خاصی نمی افتد اما قطعا با افزایش حجم نمونه، معنی داری ضریب همبستگی افزایش می یابد.
      یعنی با 40 تا داده ممکن است میزان همبستگی از نظر آماری معنی دار نباشد اما با 80 تا داده همان میزان همبستگی (که ممکن است همبستگی پایینی هم باشد)، معنی دار خواهد شد.

      پاسخ

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این قسمت نباید خالی باشد
این قسمت نباید خالی باشد
لطفاً یک نشانی ایمیل معتبر بنویسید.

19 + 5 =

فهرست
0
    0
    سبد خرید شما
    سبد خرید شما خالی استرفتن به فروشگاه