اصطلاح خط از بهترین محل اشاره به خطی دارد که از میان نقاط دادههای پخش شده رسم گردد و بتواند به بهترین شکل ارتباط این نقاط را توضیح دهد. آمارشناسان به طور معمول از روش حداقل مربعات برای دستیابی به پاسخ در معادله هندسی خط استفاده میکنند،حال چه با محاسبات دستی و چه با نرمافزارهای تحلیل رگرسیون. یک خط مستقیم از نتایج تحلیل رگرسیون ساده دو یا چند متغیر مستقل بدست میآید. یک رگرسیون از چند متغیر مرتبط تشکیل شده که در بعضی موارد تشکیل یک خط منحنی میدهند.
اصول خط از بهترین محل
خط از بهترین محل یکی از مهمترین خروجیهای تحلیل رگرسیون است. رگرسیون به یک اندازه گیری کمی از ارتباط میان یک یا چند متغیر مستقل و یک متغیر وابسته اشاره دارد. رگرسیون در طیف گستردهای، از علوم تا خدمات عمومی و تحلیل مالی مورد استفاده افراد حرفهای قرار میگیرد.
برای انجام یک تحلیل رگرسیون ، متخصص آمار مجموعهای از نقاط داده را که هر کدام شامل مجموعه کامل متغیرهای مستقل و متغیر وابسته است را، جمعآوری میکند. به عنوان مثال، متغیر وابسته می تواند قیمت سهام یک شرکت و متغیرهای مستقل می تواند شاخص استاندارد اند پورز 500 و نرخ بیکاری در کشور باشد، فرض کنید که سهم در S & P 500 ذکر نشده باشد. مجموعه نمونه میتواند هرکدام از این سه مجموعه داده برای 20 سال گذشته باشد.
بر روی یک نمودار، این نقاط داده میتوانند به صورت پراکنده ظاهر گردند، یک مجموعه نقاط داده ممکن است بر روی یک خط قرار بگیرند و یا قرار نگیرند. اگر یک الگوی خطی آشکار است، ممکن است بتوانیم خطی رسم کنیم که کمترین فاصله را از این نقاط داشته باشد. اگر هیچ الگوی خطی قابل تشخیصی وجود نداشت، تحلیل رگرسیون میتواند خطی بر اساس روش حداقل مربعات به ما بدهد. این روش خطی را ایجاد میکند که مجذور فاصله هر نقطه از این خط حداقل باشد.
برای تعیین فرمول برای این خط، متخصصین آمار این سه نتیجه برای 20 سال گذشته را داخل نرمافزار رگرسیون وارد میکنند. نرم افزار یک رابطه خطی که بیانگر رابطه علی بین S&P 500، نرخ بیکاری و قیمت سهم شرکت مورد بررسی است را به ما میدهد. این معادله، رابطه متناسبترین خط است. این مکانیزم یک ابزار پیش بینی است که قیمت آینده سهام شرکت را برای تحلیلگران بر پایه این دو متغیر مستقل پیشبینی میکند.
فرمول و اجزای تشکیلدهنده بهترین خط
یک رگرسیون با دو متغیر مستقل مانند مثال بالا فرمولی با اساس ساختاری زیر تولید میکند:
[فرمول اضافه شود]
y= c + b1(x1) + b2(x2)
در این رابطه، y یک متغیر وابسته ، c یک عدد ثابت ، b1 ضریب اول رگرسیون و X1 اولین متغیر مستقل است. b2 و x2 نیز ضریب دوم و متغیر مستقل دوم هستند. در مثال بالا، Y قیمت سهم، x1 شاخص S & P 500 و x2 نرخ بیکاری است. ضریب هر متغیر مستقل نشان دهنده درجه تغییر در Y به ازای هر واحد اضافی در آن متغیر است. اگر S & P 500 یک واحد افزایش یابد، y یا قیمت سهم به اندازه ضریب رشد خواهد کرد. این قضیه برای متغیر مستقل دوم یا همان نرخ بیکاری نیز صدق میکند. در رگرسیون ساده با یک متغیر مستقل، ضریب همان شیب خط از بهترین محل است. در این مثال و یا هر رگرسیون با دو متغیر مستقل شیب ترکیبی از این دو ضریب است. ثابت c عرض از مبدا این خط است.
نکات کلیدی
- این مناسبترین خط برای بیان رابطه میان نقاط داده پراکنده استفاده میگردد.
- خروجی این تحلیل رگرسیون میتواند به عنوان ابزاری برای پیشبینی تحرکات قیمتی استفاده گردد.