پروژه رشته ریاضی در مورد رگرسیون خطی ساده و همبستگی – قسمت سوم

استنباط های آماری در مورد پارامترهای خط رگرسیون جامعه
آزمون فرضیه و ساختن فاصله اطمینان برای ، و
تصور کنید که مقادیر متغیر مستقل X ثابت نگه داشته شده است و بارها نمونه ای تصادفی مرکب از n مشاهده انتخاب شده است. مقادیر متغیر وابسته Y که در ارتباط با مقادیر ثابت X ها هستند از نمونه ای به نمونه ای دیگر متفاوت اند. در نتیجه برآوردهای و و همچنین میانگین و واریانس آنها را بدانیم. از آنجا که شیب خط معمولاً بیشتر مورد توجه اقتصاددانان است تا عرض از مبداء تابع ، ما به توزیع توجه بیشتری مبذول خواهیم داشت.
در مبحث گذشته عنوان کردیم که است. به عبارت دیگر تابعی خطی از مقادیر مشاهده شده متغیر وابسته Yاست. با توجه به اینکه مقادیر متغیر مستقل X را ثابت نگه داشته ایم، اکنون اگر مقدار ثابت را معادل قرار دهیم عبارت فوق را می توانیم به صورت زیر بنویسیم.

نکته مهم : برای استفاده از متن کامل تحقیق یا مقاله می توانید فایل ارجینال آن را از پایین صفحه   کنید. سایت ما حاوی تعداد بسیار زیادی مقاله و تحقیق دانشگاهی در رشته های مختلف است که می توانید آن ها را به رایگان   کنید

حال چنانچه مقدار را در ارتباط فوق قرار دهیم خواهیم داشت:

توجه کنید که برابر صفر است زیرا برابر صفر است. از طرفی:

بنابراین خواهیم داشت:

برای پیدا کردن میانگین کافی است که از طرفین ارتباط فوق امید ریاضی بگیریم.

زیرا برابر صفر است. بنابراین نشان دادیم که برآورد کننده ای بدون تورش از شیب خط رگرسیون جامعه است.
برای بدست آوردن واریانس به این نکته توجه می کنیم که ها از یکدیگر مستقل اند و دارای واریانس ثابت هستند، در نتیجه داریم:

حال چنانچه بجای مقدارش را جایگزین کنیم و به توان دو برسانیم خواهیم داشت:

بنابراین واریانس برابر است با:

به طریق مشابه می توان نتیجه گرفت که نیز برآورد کننده بدون تورشی از عرض از مبدأ خط رگرسیون جامعه است.

و واریانس آن برابر است با:

اکنون چنانچه در فرمولهای فوق بجای برآورد آن یعنی را قرار دهیم انحراف معیار و به صورت زیر از نمونه برآورد خواهد شد.

از آنجا که و توابعی خطی از متغیر تصادفی هستند، چنانچه توزیع نرمال باشد و نیز دارای توزیع نرمال با میانگین و انحراف معیار به دست آمده فوق خواهند بود.
در این صورت آماره زیر:

نیز دارای توزیع t با درجه آزادی است.
اکنون آماره های آزمون فوق می توانند برای انجام آزمون فرضیه در مورد ضرایب و مورد استفاده قرار گیرند. همچنین با توجه به آماره فوق، فاصله اطمینان برای ضریب به صورت زیر خواهد بود:

به طریق مشابه می توان فاصله اطمینانی برای عرض از مبدأ خط رگرسیون نیز تشکیل داد.
آزمون فرضیه در مورد بر اساس توزیع کای دو صورت می گیرد که دارای آماره آزمون زیر است:

مثال: تصور كنید نشان دهنده یك تابع تولید است كه در آن X مقدار كود شیمیایی مصرف شده و Y مقدار یونجه تولید شده است. ضریب مقدار اضافه تولید یونجه را به ازاء یك واحد افزایش در میزان كود شیمیایی مصرف شده نشان می دهد. به عبارت دیگر تولید نهائی عامل كود شیمیایی است. فرض كنید كه بر اساس آمار مربوط به 12 قطعه زمین تابع تولید زیر برآورد شده است.

كه در آن Y بر حسب تن در هكتار و X بر حسب صد كیلوگرم مصرف كود در هكتار است. انحراف معیار هر یك از برآوردهای و یعنی و در داخل پرانتز زیر ضریب مربوطه نوشته شده است.
اگرشیب خط رگرسیون واقعی جامعه صفر باشد، در آن صورت تغییر در میزان مصرف كود شیمیایی تأثیری در میزان محصول یونجه نخواهد داشت. برآوردهای جامعه برابر صفر است، مورد استفاده قرار گیرد. برای آزمون اینكه:
در سطح معنی دار 5 درصد، ابتدا آماره آزمون زیر را محاسبه می كنیم:

مقدار بحرانی t با درجه آزادی از جدول برابر است با:

توزیع آماره آزمون در شكل 11-13 رسم شده است و با توجه به فرضیه به دو ناحیه رد و عدم رد تفكیك شده است.
از آنجا كه مقدار محاسبه شده آماره آزمون بیشتر از مقدار بحرانی است پس تفكیك شده است.
از آنجا كه مقدار محاسبه شده آماره آزمون بیشتر از مقدار بحرانی 2281/2 است پس رد می شود. یعنی اینكه در سطح معنی دار این امر كه كود شیمیایی تأثیری بر میزان محصول بدست آمده ندارد رد می شود. پس از مصرف كود شیمیایی بر میزان محصول یونجه بدست آمده اثر می گذارد.
هنگامی كه كشاورزی می خواهد تصمیم بگیرد كه مصرف كود شیمیایی، با توجه به قیمت آن و افزایشی كه در محصول ایجاد می كند، مقرون به صرف است یا نه، وی می تواند فاصله اطمینان برای را مورد توجه قرار دهد. اگر مشاهده شود كه افزایش میزان محصول یونجه در اثر كود شیمیائی كم است، ممكن است مصرف كود شیمیایی مقررون به صرفه نباشد. برای مثال فرض كنید قیمت هر تن یونجه 150 تومان و قیمت هر صد كیلو كود شیمیایی 30 تومان باشد. اگر مصرف 100 كود شیمیایی تولید برابر با: تن افزایش دهد، درآمد حاصل از این افزایش تولید برابر با: تومان خواهد بود.در صورتی كه اگر میزان واقعی افزایش محصول در هكتار فقط باشد میزان درآمد مورد انتظار معادل تومان خواهد بود كه در این صورت استفاده از كود شیمیایی برای كشاورز مقرون به صرفه نیست.
فاصله اطمینان 90 درصد برای شیب تابع تولید فوق را می توان به صورت زیر تشكیل داد :

كشاورزی كه می خواهد تصمیم بگیرد آیا مصرف كود شیمیایی برا وی مقرون به صرفه است یا نه می تواند 90 درصد اطمینان داشته باشد كه فاصله اطمینان فوق شیب خط رگرسیون واقعی را در بر می گیرد. در نتیجه وی می تواند حداقل و حداكثر درآمد مورد انتظار خود را با اطمینان 90 درصد محاسبه كند و تصمیم نهائی را اتخاذ نماید.
برآورد فاصله اطمینان به ازاء مقدار داده شده x
هنگامی كه خط رگرسیون بر اساس نمونه برآورد شد، می تواند به عنوان برآوردی از خط رگرسیون جامعه مورد استفاده قرار گیرد. مقدار كه از قراردادن مقدار در خط رگرسیون نمونه محاسبه می شود برآوردی از میانگین جامعه به ازاء مقدار است. مسلماً مقدار برآورد شده بر اساس نمونه متفاوت از خواهد بود. ما نیاز به شاخصی برای اندازه گیری این میزان اختلاف خواهیم داشت تا بتوانیم فاصله اطمینانی برای بسازیم. این شاخص ” انحراف معیار خطای تخمین به ازاء x ” نامیده می شود و با مشخص می گردد. در مورد مدل رگرسیون، فرمول زیر را برای محاسبه مورد استفاده قرار می دهیم.

كه در آن انحراف معیار خطای تخمین است، n حجم نمونه، X مقداری كه برای آن برآورد می شود و میانگین نمونه یعنی است.
فاصله اطمینان برای مقدار داده شده X به صورت زیر خواهد بود:

كه در آن
در این ارتباط برای مقدار مقدار برابر 65/31 خواهد بود. با توجه به مقادیر محاسبه شده زیر:

مقدار برابر خواهد بود با:

فاصله اطمینان 95 درصد برای با توجه به برابر خواهد بود با:

چنانچه در فرمول دقت كنیم مشخص می شود كه فاصله اطمینان ساخته شده به چند عامل بستگی دارد. برای سطح اطمینان داده شده هر چه میزان پراكندگی حول خط رگرسیون كه توسط اندازه گیری می شود بیشتر باشد، فاصله اطمینان را كوچكتر(دقیق تر) خواهد كرد. وقتی كه مقادیر را برای مقادیر X نزدیك به برآورد كنیم، فاصله اطمینان به مراتب كوچكتر خواهد بود از فاصله اطمینان برای مقادیری از Xكه از بیشتر فاصله دارند. این اثر را می توان به صورت ترسیمی در شكل زیر نشان داد.

همانگونه كه ملاحظه می شود هر چه از مقدار دورتر می شویم، در سطح اطمینان ثابت ، فاصله اطمینان برای Y به ازاء مقدار داده شده X
مقادیر Y به ازاء X ، بر خلاف و و یا كه مقادیر ثابتی هستند، مقادیر متغیر تصادفی است. اكنون می خواهیم فاصله اطمینانی برای مقدار به ازاء مقدار X بسازیم. فرمول انحراف معیار خطای تخمین Y به ازاء X عبارت است از:‌

عدد یك كه در زیر رادیكال ظاهر شده است، در فرمول انحراف معیار مربوط به وجود نداشت. وجود عدد یك در اینجا باعث می شود كه بزرگتر از شود. بنابراین برآورد فاصله اطمینان به ازاء x از برآورد فاصله اطمینان به ازاء x بزرگتر خواهد بود.
فرمول فاصله اطمینان برای Y به ازاء X به صورت زیر است.

كه در آن و درجه آزادی است.
آنالیز واریانس
طریق دیگر انجام آزمون فرضیه در مورد ضرایب مدل رگرسیون استفاده از روش آنالیز واریانس است. در مورد رگرسیون ساده فرض كردیم كه متغیر تصادفی تابعی است از مقادیری كه متغیر x به خود می گیرد. اگر بین X و Y ارتباط ای خطی وجود داشته باشد آنگاه انتظار می رود كه تغییرات مشاهده شده در Y توسط X توضیح داده شود. در غیر این صورت نتیجه گیری خواهیم كرد كه ارتباط ای خطی بین Y و X وجود ندارد.

برای دیدن قسمت های دیگر این تحقیق لطفا” از منوی جستجوی سایت که در قسمت بالا قرار دارد استفاده کنید. یا از منوی سایت، فایل های دسته بندی رشته مورد نظر خود را ببینید.

لینک متن کامل با فرمت ورد

Leave a comment