آزمون مربع کای يا خي دو

آزمون chi-square

خی دو یا آزمون مقایسه داده های مستقل رده اي

به منظور بررسی ارتباط بین دو متغیر مستقل رده ای، چنانچه متغیرهای مورد نظر بیش از دو رده داشته باشند، داده های آن ها را در یک جدول  r*c  خلاصه می کنیم. که در آن r تعداد رده های متغیر سطری و c  تعداد رده های متغیر ستونی است:

فرض صفر مورد آزمون، استقلال متغیرهای سطری و ستونی و یا به عبارت دیگر یکسان بودن نسبت یکی از رده های متغیر سطری در رده های دیگر متغیر ستونی (یا برعکس) می باشد، که آن را به صورت   H_0: p_i1=p_i2=⋯=p_ic  با یک رده معین i از متغیر سطری نشان می دهند، (i=1,2,…,r).

در صورت بزرگ بودن حجم نمونه از آماره آزمون از توزیع مجانبی مربع کای پیروی می کند. آماره آزمون به صورت زیر تعریف می شود :

که در آن O_ij فراوانی مشاهده شده در خانه  ij  جدول و  E_ij  مقدار مورد انتظار خانه  ij  تحت فرض  H_0  می باشد. یعنی :

، درجه آزادی آماره مورد آزمون برابر (r-1)(c-1) است. شرط برقراری تقریب آن است که در تمامی خانه های جدول : E_ij≥5 .

مثالی از آزمون خی دو (مربع کای)

فرض کنید که تولید یک محصول در سه نوبت کاری مختلف صورت می گیرد. عیوب ممکن محصول از 4 نوع متفاوت است. تعداد عیب های مشاهده شده در 3 نوبت کاری در قالب جدول زیر نشان داده شده است:

آیا نوبت کاری و نوع عیب مشاهده شده از یکدیگر مستقل هستند؟

در واقع فرض آزمون     است که در آن نوع عیب i ام می باشد.

برای حل مسئله ابتدا مقادیر مورد انتظار را تحت فرض یکسانی انواع عیب ها در نوبت های کاری مختلف محاسبه می کنیم.

سپس با استفاده از رابطه (1) مقدار آماره    محاسبه می شود که برابر 19.17 بدست می آید.

این مقدار با عدد حاصل از جدول توزیع کای دو با  6= 2*3=(r-1)(c-1) در سطح خطای آلفا مقایسه می شود. این عدد برابر 12.592 می باشد.

بنابراین از آنجایی که 12.592< 19.17 است، نوبت کاری و نوع عیب مشاهده شده، فرض H0  یعنی فرض استقلال رد می شود. به عبارت دیگر بروز انواع عیب ها تحت تأثیر نوبت های کاری قرار داشته و بهم وابسته هستند.

منبع : مقدمه ای بر روش های آماری ناپارامتری / نوشته : اکبر گلدسته / انتشارات جهاد دانشگاهی / 1390

براي مشاهده ساير مقاله هاي تحليل آماري اين وب سايت بر این لينک کليک نماييد: صفحه مقاله هاي تحليل آماري

4.5/5 - (14 امتیاز)

مشاهده دیدگاه ها (23)

  • با سلام و عرض ادب.
    تعریف و کاربرد 3 آزمون فرض ( اندرسون دارلینگ ، مربع کای ، کلموگروف اسپرنوف ) را میخواستم و مقایسه بین آنها.

  • با سلام و احترام
    ضمن تشکر از سایت خوبتون یه سوال داشتم : سه نوع آزمون فرض برازندگی ( مربع کای و KS و اندرسون -دارلینگ ) هر کدام برای چه مواقعی کاربرد دارند ؟

    • سلام، بزرگوارید
      این آزمونها برای بررسی نرمال بودن داده ها و متغیرها مورد استفاده قرار می گیرند. بسته آموزشی 11 روش برای بررسی نرمالیتی را تهیه نمایید:
      https://spss-iran.ir/product/normal-test/

  • سلام برای تحقیقی با عنوان دلایل گرایش سربازان به سمت مصرف مواد مخدر بهتر است از چه آزمونی استفاده شود

  • سلام ، ضمن عرض تشکر برای درج مطالب مفید :
    برای اعتبار بخشی از یک الگو از پرسشنامه با مقیاس لیکرت استفاده کردم که دارای 30 سوال است
    آیا برای تایید یا عدم تایید الگو می توان از آزمون خیدو استفاده کرد؟ چگونه؟

    • سلام. خیر. براي تاييدي يا عدم تاييد الگو از نرم افزار معادلات ساختاري استفاده مي شود که نرم افزار بر اساس حجم نمونه انتخاب مي شود.
      اگر حجم نمونه تان بالا باشد از لیزرل و در غیر اینصورت از اسمارت پی ال اس استفاده می گردد.
      از سایت های ویژه نرم افزار لیزرل یا اسمارت پی ال اس این شرکت آماری بازدید داشته باشید:
      https://www.lisrel.ir/ or https://www.smartpls.ir/

  • سلام
    در یک پایان نامه با موضوع رابطه بین مزیت رقابتی پایدار و عوامل کلیدی موفقیت در صنعت دارو از دو ازمون خی دو و همبستگی پیرسون استفاده شده ایا امکان این که این دو ازمون با هم استفاده شوند وجود دارد

    • سلام,اگر منظورتان آزمون کای دو استقلال هست که در جداول توافقی بکار میره, استفاده از یکی از این دو کفایت میکنه.
      در واقع اگر داده های مربوط به دو متغیر، کمی پیوسته و نرمال باشند از همبستگی پیرسون و اگر داده ها اسمی مثل جنست و میزان تحصیلات هست از جدول توافقی و ازمون کای دو استفاده می گردد.

  • با سلام در ازمون كاي دو وقتي از ما سئوال مي شود آیا درصد افراد سیگاری در شهر و روستا و زن و مرد یکسان است منظور ايت است كه يكبار سيگاري ها را در شهر و روستا بررسي كنيم يكبار بين مرد و زن يا اينكه منظور بررسي مرد شهري سيگاري يا زن شهري سيگاري مي باشد ايا مي شود يك متغير وابسته مانند سيگار را همزمان با دو متغير مستقل ازمون كنيم؟

  • سلام و خسته نباشید.
    در یک مثال کارکنان یک سازمان را به 3 گروه دارای علاقه شغلی 1=کم 2=متوسط 3= زیاد تقسیم کردم.میزان پیشرفت این کارکنان در سه سطح پیشرفت کم=1 پیشرفت متوسط=2 پیشرفت زیاد=3 مورد سنجش قرار دادیم.میخواهیم بررسی کنیم آیا میزان علاقه شغلی افراد با پیشرفت شغلی آنها رابطه معنی دار دارد یا خیر؟
    برای حل دستی باید از جدول استفاده کنم؟
    و فرمول جایگذاری را راهنمایی بفرمایید؟

    • سلام. بله باید فراوانی هر سلول جدول توافقی رو بدست بیارین و داخل فرمول بذارین. برای فرمول هم به کتاب آمار و احتمال مقدماتی دکتر بهبودیان مراجعه فرمایید

  • بنظرم یک بار دیگه بررسی بشه حل مساله !
    میدانیم توزیع کای دو یکطرفه راست به ازای الفای ۰٫۰۵ برابر ۱۲٫۵۹۱۵۹ است
    همچنین میزان کای دو را از تابع فراوانی مورد انتظار ۱۹٫۱۷۷۹۷ بدست اوردیم
    همچنین فرض h0 یعنی استقلال متغیرها است
    ‍‍اگر کای دو بدست امده بین بازه صفر تا ۱۲٫۵۹۱۵۹ باشد یعنی فرض h0 قابل رد نمی باشد ولی در اینجا کای دو بدست امده در بازه فوق نمی باشد لذا طبق نتیجه گیری فرض h0 قابل قبول نمی باشد بنابراین یعنی متغیرها به هم وابسته اند بعبارت دیگر نوع عیب وابسته به شیفت کاری است.
    بنظرم اصلاح کنید

    • این مطلب از منبع ذکر شده استخراج شده بود. اما فرمایش و محاسبات شما صحیح است. چون مقدار کای دو بیشتر از حد بحرانی است، فرض H0 (فرض استقلال) رد می شود.
      و نوشته در سایت اصلاح گردید

  • سلام،
    در مورد تاثير دوره هاي ضمن خدمت بر عملكرد كاركنان بهتره از آزمون t(پيش آزمون-پس آزمون) استفاده كرد يا خي؟و دليل انتخاب رو هم مي فرماييد.

    • سلام. پیش آزمون و پس آزمون دارای قدرت بالایی است و می تواند به خوبی تاثیر دوره را استخراج کند. کلا این روش، روشی توانمند است.

  • samani irani درست می فرمایند: چون میزان کای دو را از سمت راست حساب می کنند اگر از مقدار بحرانی عبور نکند می توان H0: " مستقل بودن را پذیرفت و اگر عدد آماره حساب عبور کند به منطقه رد فرض صفر می رسیم.
    اگر آماره محاسبه شده > = مقدار بحرانی: نتیجه معنادار است، فرض صفر (H0) را رد کنید ، یعنی وابسته است( دراینجا).
    اگر آمار محاسبه شده<مقدار بحرانی: نتیجه معنادار نیست ، فرضیه صفر (H0) را رد نکنید ، مستقل است.
    در اینجا p-value هم اینو اثبات می کند که برابر با 0.0038 است سطح آزمون 0.05 کمتر است.

  • سلام
    ضمن عض خسته نباشید بابت مطالب مفیدتان.
    برای بررسی رقابت پذیری در شهرستانی تعداد 10 فاکتور باید بررسی شود و جامعه ی نمونه 384 مورد پرسش نامه است. برای اینکه بتوان میانگین را تعمیم داد آیا می شود از خی دو استفاده کرد و میانگین به دست آمده و مطلبق موارد مورد انتظار را برای میانگین کل جامعه در نظر گرفت؟
    ممنونم

  • با سلام، ضمن تشکر از زحمات شما می خواستم بدانم آیا در هنگام سرشماری که همه افراد جامعه به عنوان نمونه انتخاب شده است، استفاده از ضریب همبستگی پیرسون و آزمون مجذور کای مجاز است یا خیر؟

  • سلام. از یک محاسبه گر برای p-value و آزمون کای اسکور استفاده کردم. دو عدد برای p-value نشان میدهد. یکی significant هست یکی نیست. نوشته یکی مربوط به متغیر مستقل و یکی وابسته است. من نمیدونم کدوم رو باید در نظر بگیرم در هر آزمونی به هر حال اثر مستقل بر وابسته سنجیده میشه!!!!!!!!!
    اگه راهنمایی کنید ممنون میشم

    • سلام. چه نرم افزاری بوده؟ آیا محاسبه گر معتبری بوده؟ به راهنمای آن نرم افزار مراجعه کنید تا جزئیات خروجی آنرا کامل بررسی و دلیل دو تا P-Value روشن شود

مطالب مرتبط