آثار همخطی چند گانه در یک مدل رگرسیون

  1. خانه
  2. chevron_right
  3. مقالات تحلیل آماری
  4. chevron_right
  5. همبستگی و رگرسیون
  6. chevron_right
  7. آثار همخطی چند گانه در یک مدل رگرسیون
نام دسته مطالب: همبستگی و رگرسیون

آثار همخطی چند گانه در یک مدل رگرسیون

7 دیدگاه

1- مقدمه

تفسیر و استفاده از یک مدل رگرسیون چندگانه اغلب به برآوردهای تک تک ضرایب رگرسیونی بستگی دارد. پاره ای از کاربردهای مدل رگرسیون عبارتند از:

1) شناسایی اثرات نسبی متغیرهای وابسته،

2) پیشگویی و یا برآورد کردن و

3) گزینش مجموعه ی مناسبی از متغیرها برای ساخت مدل.

اگر بین متغیرهای مستقل در رگرسیون چندگانه رابطه خطی وجود داشته باشد، گفته می شود که نامتعامد هستند. وقتی متغیرهای مستقل متعامد باشند، نتیجه گیری های فوق را به آسانی می توان انجام داد. اما در اکثر موارد متغیرهای مستقل متعامد نیستند.

گاهی این امر مشکلاتی را فراهم نمی آورد. اما در برخی موارد متغیرهای مستقل همبستگی دارند و نتیجه گیری بر مبنای مدل رگرسیون می تواند گمراه کننده باشد. در مواردی که بین متغیرهای مستقل وابستگی خطی مشاهده می‎شود، گفته می‎شود که هم‎خطی (هم‎راستایی) چندگانه وجود دارد.

مثال هایی از هم‎خطی چندگانه عبارتند از:

1. ارتباط بین مصرف سرانه(Y) با درآمد(X1) و آموزش(X2)، درآمد و آموزش معمولا رابطه معنی داری دارند.

2. ارتباط بین مقدار فروش (Y) با در آمد سرانه (X1)، قیمت(X2) و اشتغال (3X) با استفاده از داده هایی که در یک دوره زمانی جمع آوری شده اند.

2- انواع همخطی

انواع همخطی را می توان در دو دسته همخطی کامل و همخطی ناقص در نظر گرفت. همخطی کامل زمانی اتفاق می افتد که یک رابطه دقیق بین دو یا چند متغیر مستقل وجود داشته باشد. یعنی

همخطی (هم راستایی) چندگانه در مدل رگرسيون

در این حالت ضرایب مدل رگرسیون قابل برآورد نخواهند بود. زیرا برای برآورد ضرایب رگرسیون باید ماتریس ((XX)) ́ معکوس پذیر باشد. اما در اینجا چون مرتبه ماتریس ضرایب کمتر از p است، ماتریس مورد نظر معکوس پذیر نمی شود. همخطی کامل عملا هیچگاه اتفاق نمی افتد و در بیشتر موارد با همخطی ناقص مواجه می شویم.

در این حالت یک رابطه خطی غیردقیق بین دو یا چند متغیر مستقل برقرار است و داریم :

همخطی چندگانه در مدل رگرسيون

وجود متغیر vi نشان دهنده ی غیردقیق بودن این رابطه است. در این حالت هرچند ماتریس ((XX)) ́ وارون پذیر است، اما برآورد ضرایب بیش از حد بزرگ می شود. به عبارت دیگربا بیش برازش ضرایب مواجه می شویم.

3- روش های تعیین وجود همخطی چندگانه

با توجه به نکات زیر می توان در مورد وجود همخطی در مدل اظهار نظر کرد؛

1- تغییرات زیاد در برآورد ضرایب وقتی که یک متغیر به مدل اضافه شده یا از آن حذف می شود.

2- تغیرات زیاد در ضرایب وقتی که یک یا چند نقطه از داده ها تغییر کنند یا از آن حذف شوند.

وقتی که نمودار پراکنش مانده ها نشان دهنده ی مناسب بودن مدل باشد، موارد زیر نیز نشان دهنده ی همخطی چندگانه خواهند بود.

3- علامتهای جبری ضرایب برآورد شده برخلاف انتظار باشند.

4- خطای معیار ضرایب رگرسیون متغیرها زیاد باشد.

5- بررسی بزرگی ضرایب همبستگی بین متغیرهای مستقل. ضریب همبستگی بزرگ بین یک جفت متغیر مستقل، نشان از رابطه قوی میان آن ها و وجود همخطی دارد.

6- استفاده از عامل تورم واریانس (VIF) 

یکی دیگر از روش های تشخیص همخطی استفاده از معیار VIF می باشد. ماتریس (C=((XX)) ́^(-1 را در نظر بگیرید. می توان نشان داد که اعضای روی قطر اصلی این ماتریس قطری برابر است با (C_jj=1/(1-R_j^2  ، که در آن R_j^2 برابر است با ضریب تبیین چندگانه حاصل از رگرسیون X_j (به عوان متغیر وابسته) بر سایر متغیرهای مستقل.

اگر همخطی چندگانه وجود داشته باشد، R_j^2 به 1 نزدیک خواهدشد. از آنجایی که واریانس b_j (ضریب رگرسیون متغیر j ام) برابر است با V(b_j )=C_jj σ^2 ، وجود همخطی چندگانه بدین معنا است که واریانس ضرایب رگرسیون نیز بزرگ خواهند شد. چون σ^2 تحت تأثیر همخطی قرار نمی گیرد، بنابراین عامل تورم واریانس به صورت زیر تعریف می شود :
(VIF)_j=C_jj=((1-R_j^2))^(-1)

معمولا مقادیر بزرگتر از 10 برای این معیار نشان دهنده ی وجود همخطی است.

4- تصحیح همخطی چندگانه

متأسفانه راه حل ساده و روشنی برای برطرف نمودن همخطی چندگانه وجود ندارد. اما پاره ای از توصیه ها عبارتند از:

1) دقت در انتخاب متغیرها. اگر بدانیم که چند متغیر الزاما عامل مشابهی را اندازه گیری می کنند، در آن صورت نباید بیش از یکی از آن ها را مورد استفاده قرار داد مگر آن که دلیل موجهی وجود داشته باشد

2) گاهی تیبل ها یا ترکیب های جدید مفید هستند. برای مثال ممکن است X و X2  و یا  (X-X ̅) و (X-X ̅)^(2) چنین نباشند.

3) در برخی موارد تئوری یا سایر ملاحظات، ممکن است لزوم وارد ساختن متغیرهای همبسته در مدل را ایجاب نماید. در چنین مواردی روشهای برآورد اریب دار ضرایب رگرسیون، نظیر رگرسیون ریج، می تواند قابل قبول باشد.

5- رگرسیون ریج

رگرسیون ریج روشی است برای برآورد ضرایب رگرسیون در مورد داده هایی که غیرمتعامد هستند. ضرایب برآورد شده در این روش اریب هستند، ولی در مقایسه با برآوردهای کمترین مربعات به روش معمول، میانگین مربعات خطای کوچکتری دارند.

برآوردهای کمترین مربعات ریج پایدار بوده، تحت تأثیر تغییرات جزئی در داده ها واقع نمی شوند. از آنجا که میانگین مربعات خطا در روش ریج کوچکتر است، مقادیر برآورد شده با این روش در مقایسه با روش معمول به مقادیر واقعی ضرایب رگرسیون نزدیک تر هستند. میزان برتری این روش در مقایسه با روش معمول در برآورد ضرایب، به مقادیر حقیقی این ضرایب در مدل بستگی دارد. چون مقادیر حقیقی مجهول هستند، استفاده از این روش در مواقعی که همخطی چندگانه وجود دارد، می تواند مفید باشد.

منبع : مقدمه ای بر تحلیل رگرسیون کاربردی/ نوشته : دکتر عبدالمجید رضایی و مهندس افشین سلطانی/ انتشارات دانشگاه صنعتی اصفهان.

براي مشاهده ساير مقاله هاي تحليل آماري اين وب سايت بر لينک زير کليک نماييد: صفحه مقاله هاي تحليل آماري

قبول سفارش تحلیل فصل 4 پایان نامه با رگرسیون

برای سفارش انجام تحلیل مدل رگرسیوني با spss، با ما تماس بگیرید.

4.4/5 - (7 امتیاز)
آزمون معنی داری رگرسیون و ضرایب آن با نرم افزار SPSS
ضريب همبستگي و انواع آن در تحليل آماري

سایر مطالب مرتبط با موضوع فوق:

توجه شود که بخش سوال و جواب ها و کامنتها بعد از این بخش قرار دارد.

مفهوم رگرسیون

مفهوم رگرسيون به زبان ساده

comment93 دیدگاه
رگرسيون چيست؟ رگرسيون يعني بازگشت. يعني پيش بيني و بيان تغييرات يک متغير بر اساس اطلاعات متغير ديگر. مثال: رابطه بين قد و وزن انسانها را در نظر بگيريد. همه مي دانيم که اين رابطه يک رابطه مستقيم رياضي و…
معنی داری مدل رگرسیون

آزمون معنی داری رگرسیون و ضرایب آن با نرم افزار SPSS

comment38 دیدگاه
1- بررسی معنی دار بودن مدل رگرسیون برای آزمون این که آیا رابطه ی رگرسیونی ارائه شده بین متغیر پاسخ (وابسته) و متغیرهای پیشگو (مستقل) معنی دار است یا خیر با تعریف مدل رگرسیون به صورت، فرضیه ی”  ”  را در…

روش های گزینش متغیرها و مدل سازی در رگرسيون

comment6 دیدگاه
هنگامی که در بررسی یک مدل رگرسیونی، متغیر مستقل و رابطه بین آن ها با متغیر وابسته از قبل تعین شده است، پس از تعین معادله رگرسیونی مناسب، ضرایب متغیرها مورد آزمون قرار گرفته و اعتبار مانده نیز سنجیده می…
فرمولهای رگرسیون ساده

کلیات رگرسیون خطی ساده (فرمولها)

comment2 دیدگاه
مدل رگرسیونی یکی از پرکاربردترین روش های آماری در علوم مختلف، اجرای انواع روش های رگرسیون برای تعیین رابطه ی بین یک متغیر وابسته با یک یا چند متغیر مستقل می باشد . متغیر وابسته ، پاسخ و متغیرهای مستقل ، متغیرهای…
تحلیل آماری

سوال و جواب پیرامون این مبحث از طریق ارسال دیدگاه:
– نیاز به عضویت در سایت ندارد
– از طریق ایمیل خود، از دریافت پاسخ مطلع می گردید
– اگر کامنتها زیاد است، برای جستجو و یافتن سوال مد نظر خود از (f + Ctrl) استفاده نمایید.
– لطفا دوستانی که اطلاعاتی تخصصی و یا تجربه ای دارند، به سوالات پاسخ دهند تا محققان سراسر کشور بهره ببرند (زکات علم نشر آن است)

7 دیدگاه. همین الان خارج شوید

  • باسلام
    لطفا راهنمایی بفرمایید چگونه و با چه نرم افزاری ریج رگرسیون انجام دهم؟
    باسپاس

    پاسخ
    • سید مجتبی فرشچی
      اکتبر 9, 2018 11:28 ق.ظ

      سلام. با توجه به کاربرد بسیار کم رگرسیون ریچ، متاسفانه اطلاعاتی بیشتر از آنچه در متن این صفحه می بینید نداریم. همیشه سعی می کنیم همخطی را برطرف کنیم.
      دوستان دیگر اگر می دانند اعلام دیدگاه داشته باشند

      پاسخ
    • میخواستم پایان نامه، در مورد رگرسیون ریج تعمیم یافته بنویسم چقدر منابع است که بتوانم استفاده کنم شما می توانید راهنمایی کنید ممنون می شوم

      پاسخ
  • باسلام و خسته نباشید
    من در نصب نرم افزار ایویو10قسمت patchمشکل دارم لطفا کمکم کنید.

    پاسخ
  • سلام
    من برای پایان نامه نیاز به کار با روش رگرسیون ریج دارم میخواستم ببینم آیا شما میتونید کمکم بکنید

    پاسخ
  • سلام
    روزخوش
    یه سوال داشتم: آیا برای بررسی مدل معادلات ساختاری،بررسی هم خطی لازمه؟
    اگر جواب مثبت هست برای چه متغیرهایی باید بررسی بشه؟ متغیرهای مستقل یا میانجی؟
    ممنون

    پاسخ

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

این قسمت نباید خالی باشد
این قسمت نباید خالی باشد
لطفاً یک نشانی ایمیل معتبر بنویسید.

سیزده − هفت =

فهرست
0
    0
    سبد خرید شما
    سبد خرید شما خالی استرفتن به فروشگاه