سایت دانلود

تحقیق ها مقاله ها و پایان نامه ها
ریاضی

پروژه رشته ریاضی در مورد رگرسیون خطی ساده و همبستگی – قسمت دوم

خط رگرسیون جامعه اصلی به صورت زیر نمایش داده می شود:

آمدن در طرف چپ ارتباط فوق بدین مفهوم است که حتی اگر خط رگرسیون جامعه اصلی را می داشتیم، حداکثر کاری که می توانستیم با آن بکنیم این بود که میانگین Y را برای یک مقدار خاص داده شده X به دست آوریم. این به آن خاطر است که نقاط متعلق به جامعه همانگونه که در شکل دیده می شود در اطراف خط رگرسیون پراکنده هستند. برای مثال: چنانچه دو متغیر درآمد قابل تصرف (x) و مصرف (y) را در نظر بگیرید، واضح است که مصرف برای کلیه افرادی که دارای درآمد قابل تصرف مساوی هستند یکسان نخواهد بود. به عبارت دیگر برای هر تعداد زیادی مقادیر متفاوت وجود خواهد داشت و خط رگرسیون بهترین کاری که می تواند بکند این است که فقط تخمینی از میانگین مصرف را در سطح درآمدی ارائه کند. این امر در شکل برای سطح درآمدی به نمایش گذاشته شده است.

نکته مهم : برای استفاده از متن کامل تحقیق یا مقاله می توانید فایل ارجینال آن را از پایین صفحه   کنید. سایت ما حاوی تعداد بسیار زیادی مقاله و تحقیق دانشگاهی در رشته های مختلف است که می توانید آن ها را به رایگان   کنید
از جامعه فوق می توان تعداد بی شماری نمونه های مثلاً 35 تائی انتخاب کرد. یکی از این نمونه ها به همراه خط رگرسیون آن در شکل 11.8 نشان داده شده است. این خط، یعنی ، تقریبی از خط رگرسیون جامعه اصلی، یعنی است.

مقدار ثابت برآوردی است از مقدار ثابت خط رگرسیون جامعه اصلی (a) و شیب نیز برآوردی از شیب خط جامعه اصلی است.
و پارامترهای رگرسیون جامعه اصلی هستند. در شکل زیر خط رگرسیون جامعه و یکی از خطوط رگرسیون متعددی که می تواند بر اساس نمونه به دست آورده شود نشان داده شده است.

توجه داشته باشید که خط رگرسیون مبتنی بر نمونه، الزاماً منطبق بر خط رگرسیون جامعه اصلی نخواهد بود، همچنانکه خط رگرسیون فوق بر خط رگرسیون جامعه اصلی منطبق نمی باشد. ولی از آنجا که به دلایل آشکار نمی توانیم کل مشاهدات موجود در یک جامعه آماری را جمع آوری کنیم و مورد توجه قرار دهیم، مجبوریم که به خطر رگرسیون به دست آمده از نمونه بسنده کنیم.

فرض نرمال در مورد مدل رگرسیون
وقتی خط رگرسیون مبتنی بر نمونه ای تصادفی به عنوان برآوردی از خط رگرسیون جامعه اصلی به کار گرفته شود، ضرورت استنباط آماری نیز حس می شود. برای مثال ممکن است بخواهیم فاصله اطمینانی برای شیب خطر رگرسیون بسازیم و یا آزمون فرضیه ای در خصوص انجام دهیم. بدیهی است استنباط آماری ممکن نخواهد بود مگر اینکه فرض کنیم مسائل خاصی در ارتباط با جامعه ای که از آن و نمونه گیری شده است صادق است. فرض نرمال بودن جامعه اصلی یکی از فرض هایی بود که مجبور بودیم بارها در ساختن فاصله اطمینان و آزمون فرضیه در نظر بگیریم. در رگرسیون نیز، به طریق مشابه، فرض نرمال بودن و چند فرض دیگر اغلب جهت انجام استنباط های آماری ضروری است.
قبلاً بدین نکته اشاره شد که برای هر مقدار تعداد زیادی مقادیر متفاوت وجود دارد. بنابراین می توان چنین تصور کرد که متغیری است تصادفی با میانگین که بر روی خط رگرسیون قرار دارد. در این صورت ارتباط بین و می تواند به صورت زیر نوشته شود:

که در آن متغیری تصادفی با میانگین صفر و واریانس است.
فرض نرمال بودن در رگرسیون بدین مفهوم است که برای هر مقدار خاص X مقادیر Y به صورت نرمال توزیع شده اند و یا به عبارت دیگر توزیع متغیر تصادفی نرمال است. برای مثال تصور کنید که به ازاء مقدار در شکل 11.10 عمودی در نقطه بر محور X ها رسم کنیم و سپس بر روی آن هیستوگرام مربوط به کلیه مقادیر را به گونه ای که در شکل دیده می شود بسازیم. این نمودار در فضای سه بعدی سرم شده است و هیستوگرام می باید به صورت عمود بر صفحه کاغذ تجسم شود.
فرض نرمال بودن بدین مفهوم است که این هیستوگرام می تواند توسط یک منحنی نرمال که دارای میانگین است نمایش داده شود. این منحنی در شکل رسم شده است.
اکنون مقدار دیگری از X مثلاً را در نظر بگیرید. در این صورت است. فرض نرمال بودن بدین مفهوم است که این هیستوگرام می تواند توسط یک منحنی نرمال که دارای میانگین است نمایش داده شود. این منحنی درشکل زیر رسم شده است.
اکنون مقدار دیگری از مثلاً را در نظر بگیرید. در این صورت است. فرض نرمال مدل رگرسیون بیان می کند که مقادیر به ازاء نیز نرمال است، با میانگینی معادل و انحراف معیاری برابر ، همانند توزیع به ازاء ، به طریق مشابه می توان چنین عنوان کرد که برای هر مقدار توزیع مقادیر ها نرمال است و میانگین آن بر روی خط رگرسیون قرار دارد؛ همچنین تمامی این توزیعها دارای انحراف معیار یکسان ، همانند توزیع به ازاء ، به طریق مشابه می توان چنین عنوان کرد که برای هر مقدار توزیع مقادیر ها نرمال است و میانگین آن بر روی خط رگرسیون قرار دارد؛ همچنین تمامی این توزیعها دارای انحراف معیار یکسان می باشند. در نتیجه فرض نرمال مدل رگرسیون می تواند در یک فضای سه بعدی به صورت شکل نمایش داده شود.

فرمول انحراف معیار خطا که در استنباط آماری مورد استفاده قرار خواهد گرفت بر این فرض استوار است که هر مقدار از سایر مقادیر مستقل است.
به طور خلاصه فرض نرمال مدل رگرسیون عبارت از این است که مقادیر ها به ازاء هر مقدار به صورت نرمال مدل رگرسیون عبارت از این است که مقادیر ها به ازاء هر مقدار به صورت نرمال و مستقل از یکدیگر توزیع شده اند و هر توزیع دارای انحراف معیار یکسان است. پس به طور کلی در ارتباط با معادله رگرسیون فرض ها از این قرارند:
1. میانگین هر یک از ها برابر صفر است.

2. مقادیر ها از یکدیگر مستقل اند. در نتیجه برای داریم:

3. کلیه ها دارای واریانس یکسان هستند:
4.
4.مقدار برای کلیه مقادیر ها ثابت است. به عبارت دیگر متغیر یک متغیر غیر تصادفی است.
5. توزیع هر یک از ها نرمال و مستقل از یکدیگر است.
برای معادله رگرسیون جامعه، یعنی:

معادله رگرسیون مبتنی بر نمونه معمولاً به صورت زیر نوشته می شود.

که در آن، همانگونه که قبلاً اشاره شد ، و به ترتیب برآوردی از عرض از مبدأ و شیب خط رگرسیون جامعه می باشند و بر طبق روش حداقل مربعات برابرند با:

و مقدار خطا است که منطقی به نظر می رسد آنرا به منزله برآوردی از تلقی کنیم. توجه داشته باشید که برآورد دو پارامتر و از نمونه، یعنی به دست آوردن و ، بدین معنی خواهد بود که دو درجه آزادی از دست می رود. بنابراین اگر حجم نمونه برابر n باشد تعداد درجات آزادی برابر خواهد بود با:

انحراف معیار خطای تخمین
به منظور انجام استنباط های آماری در مورد خط رگرسیون نیاز است مقدار معمولاً نامشخص است می باید مقدار آن را توسط انحراف معیاری است که پراکندگی نقاط نمونه را در بالا و پائین خط رگرسیون نمونه اندازه گیری می کند. به عبارت دقیق تر انحراف معیار خطاها یعنی e است که قبلاً به شرح آن پرداختیم. فرمول محاسبه به قرار زیر است:

بدین لحاظ ارتباط فوق بر تقسیم شده است که در ارتباط با برآورد و از نمونه دو درجه آزادی از دست رفته است.
از آنجا که هر خطا ''e'' اختلاف بین مشاهده شده و به دست آمده از خط رگرسیون نمونه است. و است ( چون است) می توان نوشت:

بنابراین می توانیم را از ارتباط فوق محاسبه کنیم. ابتدا مجبوریم ها را از خط رگرسیونو نمونه برای کلیه مقادیر X به دست آوریم. این امر می تواند بسیار وقت گیر باشد. از این رو بهتر است فرمول ساده زیر را برای محاسبه مورد استفاده قرار دهیم.

به عنوان یک مثال، جدول زیر را در نظر بگیرید که شامل مشاهدات بر روی X و Y و کلیه محاسباتی است که برای به دست آوردن و و لازم است.

00/9 16 12 0/3 4
25/30 36 33 5/5 6
25/42 100 65 5/6 10
00/81 144 108 0/9 12

برای بدست آوردن خط رگرسیون و همچنین انحراف معیار خطای تخمین ابتدا مقدار را محاسبه می کنیم.

انحراف معیار خطای تخمین در نمونه " " پراکندگی نقاط نمونه را در بالا و پائین خط رگرسیون نمونه اندازه گیری می کند. اگر معادل صفر باشد کلیه نقاط نمونه بر روی خط رگرسیون نمونه قرار دارند. ولی اغلب صفر نیست و هر چه که بزرگتر باشد میزان برآورد که از خط به ازاء مقادیر X به دستد می آید کمتر دقیقاست. به زودی خواهید دید که نقش عمده ای در انجام استنباط های آماری خط رگرسیون ایفا می کند.
قبل از آنکه به مبحث بعد بپردازیم فرمولهای دیگری را که برای محاسبه مورد استفاده قرار می گیرد ذکر می کنیم. لازم به توجه است که بسط هر یک از فرمولهای زیر نهایتاً به فرمولی که قبلاً برای عنوان کردیم منجر خواهد شد و در واقع فرمولهای زیر گونه های مختلف یک فرمول هستند.

به عنوان تمرین، هر یک از روابط فوق را بسط دهید تا فرمول نتیجه شود.

برای دیدن قسمت های دیگر این تحقیق لطفا" از منوی جستجوی سایت که در قسمت بالا قرار دارد استفاده کنید. یا از منوی سایت، فایل های دسته بندی رشته مورد نظر خود را ببینید.

لینک متن کامل با فرمت ورد

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *