- در صاف کردن داده ها از یک الگوریتم برای حذف نویز از مجموعه داده استفاده می کند و به الگوهای مهم اجازه می دهد برجسته شوند.
- صاف کردن داده ها را می توان برای پیش بینی روندها، مانند آنچه در قیمت اوراق بهادار یافت می شود، استفاده کرد.
- مدل های مختلف صاف کردن داده ها شامل روش تصادفی استفاده از میانگین متحرک است.
- گرچه صاف کردن دادهها میتواند به پیشبینی برخی روندها کمک کند، اما ذاتاً منجر به بروز اطلاعات کمتری در سمپل یا نمونه می شود که ممکن است منجر به نادیده گرفتن برخی از نقاط داده شود.
درباره صاف کردن داده ها
هنگامی که داده ها روی هم جمع می شوند، می توان آنها را دستکاری کرد و هر گونه نوسان یا هر نوع نویز دیگری را حذف کرد یا اثر آن را کمتر کرد. به این کار هموارسازی داده یا صاف کردن داده می گویند. ایده پشت صاف کردن داده ها این است که می تواند تغییرات ساده شده را شناسایی کند تا به پیش بینی روندها و الگوهای مختلف کمک کند. این ایده به عنوان کمکی برای آماردانان یا معامله گرانی عمل می کند که باید به داده های زیادی نگاه کنند (که اغلب هضم آنها می تواند پیچیده باشد) تا الگوهایی را بیابند که در غیر این صورت نمی دیدند. برای توضیح با یک رسم تصویری، نمودار یک ساله را برای سهام شرکت X تصور کنید. هر نقطه سقف در نمودار برای سهام را می توان پایین تر آورد و در عین حال تمام نقاط کف را بالاتر آورد. با این کار منحنی صاف تری ایجاد می شود، بنابراین این کار به سرمایهگذار کمک میکند تا پیش بینی کند که این سهام در آینده چگونه ممکن است عمل کند. نکته مهم: اقتصاددانان به طور کلی داده های صاف را ترجیح می دهند زیرا تغییرات روندها را در مقایسه با داده های ناهموار (ناصاف) بهتر شناسایی می کند. داده های ناهموار ممکن است شکل نامنظم تری داشته و سیگنال های اشتباه دهند.روش های صاف کردن داده ها
روش های مختلفی وجود دارد که با استفاده از آنها می توان صاف کردن داده ها را انجام داد. برخی از این موارد عبارتند از روش گام تصادفی (یکی از مصادیق فرضیه ی بازار کارا می باشد. یعنی، قیمت اوراق بهادار بر اساسِ داده های تاریخی (گذشته) قابلِ پیش بینی نیست. به بیان بهتر، قیمت از یک روند معیّن پیروی نمی کند-مترجم)، محاسبه میانگین متحرک، یا انجام یکی از تکنیک های صاف کردن بصورت نمایی. فکت: یک میانگین متحرک ساده SMA وزن یکسانی را بر روی قیمت های اخیر و پیشینه قیمتها قرار میدهد، در حالی که میانگین متحرک نمایی EMA وزن بیشتری را به دادههای قیمتی اخیر می دهد. مدل گام تصادفی معمولاً برای توصیف رفتار ابزارهای مالی مانند سهام استفاده می شود. برخی از سرمایه گذاران بر این باورند که هیچ رابطه ای بین حرکت گذشته در قیمت اوراق بهادار و حرکت آتی آن وجود ندارد. در صاف کردن به روش گام تصادفی فرض بر اینست که نقاط داده آینده با آخرین نقطه داده موجود به اضافه یک متغیر تصادفی برابر است. تحلیل گران تکنیکال و بنیادی با این ایده مخالفند. آنها بر این باورند که سمت و سوی حرکت های آینده را می توان با بررسی روندهای گذشته بدست آورد. میانگین متحرک (که اغلب از آن در تحلیل تکنیکال استفاده می شود)، نوسانات قیمت یا همان پرایس اکشن را صاف و هموار می کند. بعبارتی نوسانات تصادفی قیمت را فیلتر می کند. این فرآیند بر اساس قیمت های گذشته است و که باعث می شود میانگین متحرک به یک اندیکاتور پیرو روند یا تاخیری بدل شود. همانطور که در نمودار قیمت زیر مشاهده می شود، میانگین متحرک EMA شکل کلی داده های قیمت روزانه را دارد که توسط کندل ها نشان داده شده است. هر چه روزهای بیشتری در میانگین متحرک گنجانده شود، خط صاف تر می شود.مزایا و معایب صاف کردن داده ها
از هموارسازی داده ها می توان برای کمک به شناسایی روندها در اقتصاد، در اوراق بهادار، مانند سهام، و تمایلات مصرف کننده استفاده کرد. صاف سازی داده ها را می توان برای اهداف تجاری دیگر نیز مورد استفاده قرار داد. برای مثال، یک اقتصاددان میتواند با پایین آوردن میزان متغیرهایی که ممکن است هر ماه رخ دهد، (مانند روزهای تعطیل یا قیمت بنزین)، دادهها را تعدیل فصلی کرده و یا صاف کند تا مناسب استفاده در برخی شاخص ها، (مانند شاخص خردهفروشی)، شود. با این حال، استفاده از این ابزار ایراداتی دارد. صاف کردن داده ها همیشه مواقع توضیحی درباره روندها یا الگوهایی که به شناسایی آنها کمک می کند ارائه نمی دهد. همچنین ممکن است منجر به نادیده گرفتن برخی از نقاط داده با تأکید بر داده های دیگر شود. نقاط قوت- با حذف نویز از داده ها به شناسایی روندهای واقعی کمک می کند.
- امکان تعدیل فصلی داده های اقتصادی را فراهم می کند.
- به راحتی از طریق چند تکنیک از جمله میانگین متحرک محاسبه می شود.
- حذف داده ها همیشه منجر به کاهش اطلاعات خواهد شد که خود ریسک خطا در تجزیه و تحلیل را افزایش می دهد.
- صاف کردن داده ها ممکن است بر سوگیری های تحلیل گران تاکید کند و موارد پرتی که ممکن است معنی دار باشند را نادیده بگیرد.