پروژه رشته ریاضی در مورد رگرسیون خطی ساده و همبستگی – قسمت چهارم

همانگونه كه در مبحث گذشته اشاره كردیم، ایده اساسی آنالیز واریانس مبتنی است بر نمایش دادن میزان كل پراكندگی ( تغییرات) یك مجموعه آماری به صورت جمع چند عبارت كه بتوان هر یك را به منشاء یا علت خاص وجود پراكندگی (تغییرات) یك مجموعه آماری به صورت جمع چند عبارت كه بتوان هر یك را به منشاء یا علت خاص وجود پراكندگی(تغییرات) نسبت داد. در ارتباط با مدل رگرسیون، كل تغییرات در متغیر وابسته Y را می توان به ” تغییرات توضیح داده شده (تبیین شده ) ” كه به ارتباط بین X و Y نسبت داده می شود تفكیك كرد.شكل زیر مقیاسهای تغییرات مختلف را در این ارتباط نشان می دهد.

نکته مهم : برای استفاده از متن کامل تحقیق یا مقاله می توانید فایل ارجینال آن را از پایین صفحه   کنید. سایت ما حاوی تعداد بسیار زیادی مقاله و تحقیق دانشگاهی در رشته های مختلف است که می توانید آن ها را به رایگان   کنید

كل تغییرات عبارت از اختلاف بین مشاهده شده از میانگین خود، است. تغییرات توضیح داده شده عبارت است از اختلاف بین ( میانگین مقادیر ) و ( مقادیر كه بر اساس معادله رگرسیون پیش بینی می شود). تغییرات توضیح داده نشده عبارت است از آن میزان تغییرات در كه توسط خط رگرسیون توضیح داده نشده عبارت است از آن میزان تغییرات در كه توسط خط رگرسیون توضیح داده نشده است و مربوط به اختلاف بین (مقدار واقعی و به ازاء مقدار خاصی از X ) است.
تغییرات توضیح داده نشده + تغییرات توضیح داده شده = كل تغییرات (پراكندگی)
شاخصی كه برای نمایش كل تغییرات (پراكندگی) مورد استفاده قرار می گیرد كل مجموع مجذورات است كه با SST نشان داده می شود.

شاخصی كه برای نمایش تغییرات توضیح داده نشده به كار می رود مجموع مجذورات خطا است كه با SSE نشان داده می شود.

شاخصی كه برای نمایش تغییرات توضیح داده شده به كار می رود مجموع مجذورات رگرسیون است كه با SSR نشان داده می شود.

=SST-SSE
=
توجه داشته باشید كه در ارتباط با فرمول محاسبه انحراف معیار خطای تخمین، قبلاً میزان تغییرات توضیح داده نشده را در صورت كسر داشته ایم.
برای انجام آزمون فرضیه در مقابل فرضیه اكنون می توانیم جدول آنالیز واریانس را به صورتی كه در جدول زیر آمده است تشكیل دهیم.
F MSR=SSR SSR 1 X

SSE
خطا
SST
جمع

چنانچه مقدار آماره آزمون F محاسبه شده بزرگتر از مقدار بحرانی به دست آمده از جدول F باشد آنگاه همانگونه كه در شكل زیر مشاهده می شود، فرضیه در سطح معنی دار رد می شود.

مثال: چنانچه ارتباط رگرسیون مربوط به مثال زیر یعنی كه بر اساس یك نمونه 16 تایی برآورد شده بود، را در نظر بگیریم و داشته باشیم:

می توان جدول آنالیز واریانس را به صورتی كه در جدول زیر آمده است تشكیل داد. برای این منظور محاسبات زیر را انجام می دهیم:
F میانگین مجذورات مجموع مجذورات درجه آزادی منشاء تغییرات
5/69 47/688 47/688 1 X
90/9 66/138 14 خطا
13/727 15 جمع
مقدار بحرانی از جدول برابر 60/4 است. با توجه به مقدار محاسبه شده آماره آزمون بر اساس جدول آنالیز واریانس كه بزرگتر از مقدار بحرانی است، می توان نتیجه گیری كرد كه فرضیه در سطح معنی دار 5 درصد رد می شود. یعنی یك ارتباط خطی بین متغیر وابسته Y و متغیر مستقل X وجود دارد.

بدین معنی كه ضریب تعیین عبارت است از نسبت تغییرات توضیح داده شده توسط متغیر مستقل X به كل تغییرات. چنانچه هیچگونه تغییری در Y توسط ارتباط رگرسیون توضیح داده نشود، مقدار بین صفر و یك است.

ضریب تعیین مربوط به رگرسیون مثال قبلی با توجه به مقادیر محاسبه شده SSR و SST برابر است با:

این رقم بدان معنی است كه 2/83% تغییرات متغیر وابسته Y می تواند توسط تغییرات در متغیر مستقل X توضیح داده شود. این مورد مثالی است از حالتی كه ارتباط خطی قوی بین دو متغیر وجود دارد زیرا استفاده از مدل رگرسیون توانسته است 2/83% تغییرات Y را در ارتباط با X توضیح دهد و فقط 8/16% تغییرات در Y توسط عواملی بجز متغیر X توضیح داده می شود.
مقدار ضریب تعیین را می توان به صورت مستقیم، بدون برآورد ارتباط رگرسیون، با استفاده از فرمول زیر از روی مشاهدات به دست آورد.

مثال:‌در جدول قبل آمار مربوط به درآمد و مصرف آمده است. با استفاده از اطلاعات مندرج در این جدول ضریب تعیین را می توان از روی مشاهدات به صورت زیر محاسبه كرد.

مصرف
درآمد
49 100 70 7 10
441 400 420 21 20
529 900 690 23 30
1156 1600 1360 34 40
1296 2500 1800 36 50
2809 3600 3180 53 60

مقدار بدین معنی است كه تغییرات توضیح داده شده (SSR) برابر 95% كل تغییرات (SST) است. بنابراین به بیانی دیگر می توان چنین عنوان كرد كه 95% تغییرات در مصرف توسط ارتباط خطی بین مصرف و درآمد توضیح داده شده است.
آزمون فرض پارامتر
مراحل آزمون فرض به صورت زیر است:
1) آزمون به یکی از سه صورت زیر می باشد:

2) ناحیه بحرانی در سطح تشخیص به صورت های زیر می باشد:

3) آماره آزمون به صورت می باشد که در آن است.
4) مقدار عددی آماره آزمون را بدست می آوریم و به آن عبارت محاسباتی می گوییم چنانچه عبارت محاسباتی در ناحیه بحرانی ( هاشور خورده) قرار گیرد فرض را رد می کنیم.
آزمون فرض پارامتر
مراحل آزمون را به صورت زیر انجام می دهیم.
1) آزمون به یکی از سه صورت زیر می باشد:
(ج (ب ( الف

2) ناحیه بحرانی در سطح تشخیص به صورت های زیر می باشد:

3) آماره آزمون به صورت می باشد.
4) مقدار عددی آماره آزمون را بدست می آوریم و به آن عبارت محاسباتی می گوییم. چنانچه عبارت محاسباتی در ناحیه بحرانی ( هاشور خورده) قرار گیرد فرض را رد می کنیم.

آزمون فرض پارامترهای و را می توان در جدولی به صورت زیر خلاصه کرد:
ناحیه بحرانی
آماره آزمون

داده های زیر پیشرفت در سرعت خواندن 10 دانشجو را در مقابل برنامه هفته های تدریس نشان می دهد.
7 5 7 9 5 4 11 8 3 2 تعداد هفته
90 62 85 105 57 52 130 102 42 21 پیشرفت در سرعت خواندن

الف) معادله خط رگرسیون را بیابید و با استفاده از آن پیش بینی کنید که اگر دانشجویی از برنامه 7 هفته ای استفاده کند چقدر در سرعت خواندن او پیشرفت حاصل می گردد.
ب) یک فاصله اطمینان 95 درصدی برای بسازید.
ج) آیا در سطح معنی دار 01/0 می توان گفت که اگر است؟
حل: الف) تعداد هفته را برابر x و پیشرفت در سرعت خواندن را برابر y در نظر می گیریم.
داریم:

درنتیجه معادله خط رگرسیون عبارت است از:
حال اگر باشد، آنگاه
ب) دیدیم که

از طرفی

می دانیم در نتیجه . در نتیجه

ج) مراحل آزمون فرض را به صورت زیر در نظر می گیریم:

2) ناحیه بحرانی و مقدار مرزی (عبارت جدول) به صورت زیر است:
3) آماره آزمون به صورت زیراست:

5) چون پس عبارت محاسبه در خارج ناحیه هاشور خورده قرار می گیرد. یعنی رد نمی شود.
داده های زیر افزایش طول میله فولادی را در مقابل نیروی کشش وارد به آن نشان می دهد.
6 5 4 3 2 1 نیروی کشش وارده
9 8 6 5 4 2 افزایش طول میله

الف) معادله خط رگرسیون را بیابید و با استفاده از آن پیش بینی کنید که اگر نیروی کشش معادل 5/2 واحد به میله وارد کنیم افزایش طول میله چقدر خواهد بود.
ب) یک فاصله اطمینان 98 درصد برای بسازید.
ج) آیا در سطح معنی دار 1/0 می توان گفت که است؟
حل: الف) نیروی کشش وارده را برابر x و افزایش طول میله را برابر y در نظر می گیریم. داریم:

در نتیجه معادله خط رگرسیون به صورت است. حال اگر باشد آنگاه
ب) دیدیم که:

که در آن همچنین در نتیجه همچنین در نتیجه

در نتیجه
ج) مراحل آزمون فرض را به صورت زیر در نظر می گیریم:
1)
2) ناحیه بحرانی و مقدار مرزی به صورت زیر است:

3) آماره آزمون به صورت زیر است:

4) چون 68/3- در ناحیه هاشور خورده می افتد پس فرض رد می شود یعنی نمی باشد.

برای دیدن قسمت های دیگر این تحقیق لطفا” از منوی جستجوی سایت که در قسمت بالا قرار دارد استفاده کنید. یا از منوی سایت، فایل های دسته بندی رشته مورد نظر خود را ببینید.

لینک متن کامل با فرمت ورد

Leave a comment