نمودار هیستوگرام چیست


متعادل سازی هیستوگرام

آشنایی با histogram

هیستوگرام یک گراف یا یک طرح است که نشان دهنده توزیع شدت (پراکندگی رنگ) پیکسل در یک تصویر است. در این بخش ما قصد داریم روی فضای رنگ RGB تمرکز کنیم (در اینجا اگر توضیحات در مورد تفاوت میان برخی از فضاهای رنگی مانند RGB و Lab را بخواهید، به این ترتیب شدت یک پیکسل در محدوده [0، 255 ] هنگام ترسیم هیستوگرام، شدت پیکسل در محور X و فرکانس در محور Y است. هیستوگرام را می توان برای هر دو تصویر سیاه و سفید و برای تصویر رنگی محاسبه کرد. در مورد اول ما یک کانال تک رنگ با بازه رنگ grayscale را داریم، از این رو یک هیستوگرام تنها خواهد بود. در مورد دوم ما سه کانال داریم، از این رو سه هیستوگرام تولید خواهد شد. محاسبه هیستوگرام یک تصویر بسیار مفید است زیرا به برخی از خواص (feature) تصویر مانند محدوده تونال، کنتراست و روشنایی می توان پی برد.

محاسبه هیستوگرام

حالا ببینید چگونه می توان هیستوگرام هر تصویر داده شده را با استفاده از OpenCV محاسبه کرد و آنها را با استفاده از matplotlib نمایش داد.OpenCV تابع cv2.calcHist را برای محاسبه هیستوگرام یک تصویر فراهم می کند. که به شکل زیر است:

  • images - تصویری است که میخواهیم هیستوگرام پیچیده شده را به عنوان یک لیست محاسبه کنیم، بنابراین اگر تصویر ما در تصویر متغیر باشد، تصویر [تصویر] منتقل خواهد شد
  • channels - فهرست کانال هایی است که در نظر گرفته شده اند (0) برای تصاویر سیاه و سفید مانند یک کانال و [0]، [1] و یا [2] برای تصاویر رنگی اگر ما می خواهیم در نظر بگیریم کانال سبز، آبی یا قرمز به ترتیب)،
  • mask - یک ماسک است که در تصویر می شود اگر ما بخواهیم فقط یک منطقه خاص را در نظر بگیریم (ما این را در این پست نادیده می گیریم)
  • bins نمودار هیستوگرام چیست - لیستی است که حاوی تعداد سطل های استفاده شده برای هر کانال است
  • ranges - محدوده مقادیر احتمال پیکسل است که [0، 256] در مورد فضای رنگی RGB (جایی که 256 شامل نیست) است.

ما می توانیم این رابط را ساده تر کنیم با قرار دادن آن در یک تابع که علاوه بر محاسبه هیستوگرام که آن را نیز ترسیم می کند و مقدار پیش فرض bins را بر روی 256 تنظیم می کنیم.

نمایش هیستوگرام

دو نمودار هیستوگرام چیست راه برای این وجود دارد

  1. روش کوتاه: استفاده از توابع نقشه برداری Matplotlib
  2. راه طولانی: از توابع طراحی OpenCV استفاده کنید

تصویر نمونه مورد استفاده

1. با استفاده از Matplotlib

Matplotlib با یک تابع ترسیم هیستوگرام همراه است: matplotlib.pyplot.hist () این مستقیما هیستوگرام را پیدا می کند و آن را طرح کرده و نمایش می دهد. برای پیدا کردن هیستوگرام لازم نیست از تابع calcHist () یا np.histogram () استفاده کنید. کد زیر را ببینید:

که خروجی آن به شکل زیر خواهد بود:

یا می توانید از نمودار طبیعی matplotlib استفاده کنید ، که برای طرح BGR خوب است. برای این منظور ، ابتدا باید داده های هیستوگرام را پیدا کنید. کد زیر را امتحان کنید:

که خروجی زیر را به شما نمایش خواهد داد:

می توانید از نمودار بالا دریابید که ، رنگ قرمز دارای برخی مناطق با ارزش بالا در تصویر است.

2. با استفاده از opencv

خوب ، در اینجا شما می توانید مقادیر هیستوگرام را به همراه مقادیر bin آن تنظیم کنید تا مانند x ، y مختصات باشد تا بتوانید آن را با استفاده از تابع cv.line () یا cv.polyline () ترسیم کنید تا همان تصویر بالا را تولید کند.نمودار هیستوگرام چیست

کاربرد ماسک

ما از cv.calcHist () برای یافتن هیستوگرام تصویر کامل استفاده کردیم. اگر می خواهید هیستوگرام برخی از مناطق یک تصویر را پیدا کنید ، چه می کنید؟ فقط کافی است یک تصویر ماسک با رنگ سفید بر روی منطقه ای که می خواهید هیستوگرام و سیاه پیدا کنید ایجاد کنید. سپس این را به عنوان ماسک عبور دهید.

نتیجه را ببینید در نمودار هیستوگرام ، خط آبی هیستوگرام تصویر کامل را نشان می دهد در حالی که خط نارنجی هیستوگرام ناحیه پوشیده شده را نشان می دهد.

وبلاگ

You are currently viewing هیستوگرام در پردازش تصویر

سلام. قبل از پرداخت به نمودار هیستوگرام، ببینیم این نمودار به چه دردی میخوره.
حتما با این عبارت آشنایی دارید که میگن تصویر کیفیت نداره . به وسیله هیستوگرام اطلاعات بیشتری از عکس بدست میاوریم تا بتوانیم یک تصویری با بهترین نور دهی داشه باشیم.

باید گفت که شفافیت یک عکس، کار کنتراست است که یکی از کاربردهای هیستگرام است. از طرفی کنتراست، بر تفاوت بین سیاهترین(تعداد پیکسل ها به سمت ۰) و روشنترین( تعداد پیکسل ها به سمت ۲۵۵) قسمت های یک عکس تاثیر میگذارد. بالا بودن کنتراست نشان از کیفیت تصویر است. یعنی ما هم روشنایی ها را داریم و هم تاریکی ها را داریم. یک جورایی نمودار ما پهن میباشد . ولی در کنتراست پایین که وضوح عکس پایین میاد، نمودار باریک است. در اینجا جزئیات کمتری داریم.

و درک این مسئله با نمودار هیستوگرام بسیار آسانتر خواهد بود.

نمودار هیستوگرام چیست؟

هیستوگرام یا بافت‌نگار، به زبان خیلی ساده به نموداری گفته می‌شود که به ما بگوید به عنوان مثال چند تا عدد ۹ داریم . عدد ۹ که روی محور x قرار میگیرد و اگر تعداد آن ۱۸ باشد با محور y مشخص میشود.

تصویر زیر یک ماتریس دو بعدی از یک تصویر است که که حاوی اطلاعات از شدت روشنایی است .اگر فرض کنیم، تعداد پیکسلهایی که شدت روشنایی مثلا ۰ دارند ۱۰ تا است، ۱۰ را در محور y و محدوده شدت روشنایی(۰ یا سیاه) را درمحور x نشان میدهد.
یک هیستوگرام مجموعه ای از مناطق مستطیل شکل یا استوانه ای به نام سطل(bin) است. (تعریف دیگر)

هیستوگرام

https://docs.opencv.org

اگر بخواهیم این داده ها را به صورت سازمان یافته ببینیم باید چه کنیم؟ با توجه به اینکه محدوده ارزش اطلاعات برای این مورد ۲۵۶ مقدار است، میتوانیم محدوده را به بخشهایی مثل سطل(bins) تقسیم کنیم:

\begin</p>
<p> [0, 255] = < [0, 15] \cup [16, 31] \cup . \cup [240,255] >\\ نمودار هیستوگرام چیست range = < bin_\cup bin_ \cup . \cup bin_ > \end

بنابراین می توانیم تعداد پیکسل هایی را که در محدوده هر سطل قرار می گیرند، نگهداریم. برای تصویر بالا، تصویر زیر آماده شده است. محور x همان سطل ها و محور y تعداد پیکسل.

Histogram

Histogram

این یک مثال ساده از نحوه عملکرد هیستوگرام و دلیل مفید بودن آن است. هیستوگرام می تواند نه تنها از شدت های رنگ، بلکه از ویژگی های تصویری که می خواهیم اندازه گیری کنیم (مانند شیب، جهت ها و غیره) باشد.

بیایید برخی ورودی های تابع هیستوگرام را شناسایی کنیم:

  • dims: تعداد پارامترهایی که می خواهید اطلاعات را جمع آوری کنید. در مثال ما مقدار این پارامتر ۱ است. چون فقط مقدار شدت روشنایی را در نظر گرفتیم.
  • bins : تعداد هر مستطیل یا سطل را مشخص میکند. در این مثال bins = 16
  • range: بازه ای از مقادیر [range = [0,255

اگر می خواهید دو ویژگی را حساب کنید چه؟ در این حالت نتیجه شما یک قطعه ۳D است. همین کار را برای ویژگی های بیشتر اعمال می کند (مطمئنا پیچیده تر می شود).

در تمام قسمت ها از تصویر زیر به عنوان ورودی استفاده شده است:

Histogram

تصویر اصلی

hisgray

image_histogram

image_histogram

نکته: نحوه کارکرد تابع ()ravel, همانند (reshape(-1.

()calcHist

OpenCV از تابع ()cv2.calcHist برای هیستوگرام استفاده میکند. بنابراین، زمان آن است که به پارامترهای خاص مربوط به تابع () cv2.calcHist نگاه کنیم:

ما به صورت زیر استفاده کردیم:

  1. images: تصویر منبع از نوع uint8 یا float32، باید به عنوان یک لیست ارائه شود. [gray_img]
  2. channels: این مورد نیز به عنوان یک لیست [] داده شده است. این شاخص کانال است که ما با آن هیستوگرام را محاسبه می کنیم. برای مثال، اگر ورودی تصویر سیاه و سفید است، مقدار آن [۰] است. برای تصویر رنگی، می توانید [۰]، [۱] یا [۲] را به ترتیب برای هیستوگرام کانال آبی، سبز یا قرمز محاسبه کنید.
  3. mask: برای پیدا کردن هیستوگرام تصویرکامل ، آن را به عنوان None تنظیم شده است. با این حال، اگر ما می خواهیم هیستوگرام منطقه خاص تصویر را دریافت کنیم، باید یک تصویر ماسک برای آن ایجاد کنیم و آن را ماسک کنیم.
  4. histSize: نشان دهنده شمارش BIN است. باید در [] داده شود. برای مقیاس کامل، ما [۲۵۶]را قرار دادیم .
  5. ranges : به طور معمول، [۰،۲۵۶] است.

()NumPy – np.histogram

همچنین NumPy یک تابع برای هیستوگرام، که ()np.histogram است را فراهم می کند. بنابراین، ما می توانیم به جای تابع OpenCV از NumPy استفاده کنیم:

هیستوگرام برای تصاویر رنگی

his-color-image

هیستوگرام برای تصاویر رنگی

متعادل سازی هیستوگرام

یکی از مشکلاتی که در آستانه گذاری ساده داشتیم، تصاویر ورودی با روشنایی متفاوت، خروجی مناسبی نداشت. برای یکنواختی تصویر میتوانیم قبل از آستانه گیری از متعادل سازی استفاده کنیم. متعادل سازی هیستوگرام برای بهبود کنتراست و افزایش کیفیت تصویر، استفاده می شود.

یک تصویر را که مقادیر پیکسل(شدت روشنایی) آن، به رنج کمی از مقادیر، محدود است را در نظر بگیرید. برای مثال، تصویر روشن تر تمام پیکسل ها را به مقادیر بالا(نزدیک به ۲۵۵) محدود خواهد کرد. اما یک تصویر خوب، پیکسل ها را از تمام نقاط تصویر انتخاب میکند.

بنابراین باید این هیستوگرام را به هر دو انتها ببرید ( تصویر زیر از ویکیپدیا داده شده است) و این همان کاری است که متعادل سازی هیستوگرام می کند (به صورت ساده).

این عمل، کنتراست تصویر را بهبود می بخشد.

histogram_equalization

متعادل سازی هیستوگرام

در تصویر، مقدار میانگین مقدار متوسط شدت روشنایی تصویر را نشان می دهد و مقدار واریانس، مقدار متوسط کنتراست تصویر را نمایش می دهد.

آموزش تصویری و گام به گام رسم نمودار هیستوگرام در spss

آموزش تصویری و گام به گام رسم نمودار هیستوگرام در spss …

هیستوگرام برای خلاصه کردن داده های گسسته یا پیوسته استفاده می شود. به عبارت دیگر، نمایش داده ای از داده های عددی را با نشان دادن تعداد نقاط داده ای …

آموزش کامل نحوه ایجاد یک نمودار ستونی با نرم افزار SPSS (گام …

(نکته: برای رسم نمودار ستونی خوشه ای ما میتوانیم به شما کمک کنیم). هدف از این … آموزش گام به گام نحوه کاربرد Spss در آمار توصیفی (تصویری) …

آموزش رسم نمودار هیستوگرام در spss – ایران پژوهش

آموزش رسم نمودار هیستوگرام در spss : در کادر ارتباطی Frequency تنها امکان … به منظور ترسیم خط منحنی نرمال بر روی توزیع نمره های متغیر، گزینه ی Display normal curve را علامت دار نمایید. … آموزش به زبان ساده ، موضوعی و گام به گام همراه با تصویر.

نحوه ترسيم هيستوگرام در SPSS- کاربرد آن در شناسايي …

در فیلم آموزشی زیر نحوه ترسیم نمودار هیستوگرام، که به آن بافت نگار نیز گفته می شود، در نرم افزار SPSS آموزش داده می شود. همچنین بیان می شود که …

آموزش نرم افزار Minitab (جدید) | قدم به قدم و تصویری – صنایع …

آموزش نرم افزار Minitab برای مهندسان صنایع در این مقاله آموزشی به بررسی هیستوگرام آزمون اندرسون دارلینگ … طریقه ی رسم نمودار هیستوگرام برای یک متغیر در Minitab: …. آمار توصیفی در Spss را به زبان ساده بیاموزید | گام به گام.

نمایش و رسم نمودار برای داده‌ها – معرفی و کاربردها – مجله فرادرس

روش‌های نمایش داده‌ها بیشتر به صورت ترسیم نمودار یا جداول اطلاعاتی است. … با توجه به اهمیت نوع داده‌ها و نمایش تصویری آن‌ها ابتدا انواع داده‌ها را معرفی خواهیم …. به منظور نمایش توزیع آماری داده‌ها از نمودار «بافت‌نگار» (Histogram) ….. آموزش گرافیک و ترسیم نمودار در متلب · صدک ها – مفاهیم ریاضی به … آموزش‌‌ نرم افزار SPSS.

دسته بندی تصویری (Visual Binning) در SPSS – راهنمای …

در این نوشتار به کمک مجموعه داده‌ نمونه‌ای SPSS به نام DEMO. …. با انتخاب دکمه Chart نیز رسم نمودار هیستوگرام به همراه منحنی نرمال را درخواست …

رسم نمودار – آپارات

بررسی توزیع داده ها | تحلیل آماری داده – تحليل آماري با SPSS …

در واقع محقق بعد از رسم نمودار هیستوگرام اگر مشاهده نمود که شکل … برای داده های یک متغیر نرمال و یک متغیر غیرنرمال را به تصویر کشیده است.

دانلود کتاب آشنایی با محیط نرم افزار SPSS و محاسبه آمار …

در این کتاب ابتدا با محیط نرم افزار SPSS آشنا می شویم و سپس به روش استفاده از این نرم افزار برای محاسبه آمار توصیفی … رسم نمودار هیستوگرام در نرم افزار SPSS.

آمار – پرستار

رسم نمودار هیستوگرام یک متغیر کمی بر اساس یک متغیر …

پیش از این در کلاس های spss آکادمی تحلیل آماری ایران در بخش آمار توصیفی … به طور کلی اگر متغیر ها در سطح سنجش اسمی باشند نمودار مناسب برای …

آموزش کنترل کیفیت آماری با SPSS – بخش 2 – YouTube

برای کسب اطلاعات بیشتر، به این لینک مراجعه نمایید: … مواردی است که نرم افزار SPSS قادر به انجام محاسبات آماری و رسم نمودارهای مربوطه به آن است.

ﺗﺤﻠﻴﻞ آﻣﺎري ﺑﺎ اﺳﺘﻔﺎده از ﻧﺮم اﻓﺰار SPSS ( ﻣﻘﺪﻣﺎﺗﻲ )

ﻣﺪل آﻣﺎري. راه ﺣﻞ آﻣﺎري. ﻣﺴﺌﻠﻪ ﻣﻮﻛﻞ. ﭘﺎﺳﺦ ﻣﻮﻛﻞ. ﭼﺮا ﻧﺮم اﻓﺰار؟ ✍. ﻧ م. اﻓﺰا. ﺑﻪ. ﺷ ﺎ. ﻛ ﻚ. ﻣ. ﻛﻨﺪ …. آﻣﻮزش. ﻣﻔﺎﻫﻴﻢ،. در. اﻳﻦ. دوره. ﻣﻌﺮﻓﻲ. ﻣﻲ. ﺷﻮد . ﭼﺮا. SPSS ؟ ﻫﻤﺎﻧﮕﻮﻧﻪ. ﻛﻪ. از. ﻧﺎم. اﺻﻠﻲ. اﻳﻦ …. ﻧﻤﻮدارﻫﺎ ﺑﺎ وﺿﻮح ﻧﻤﺎﻳﺶ ﺑﺎﻻ رﺳﻢ ﻛﺮد …. ﻛﻤﻲ. (. ﻋﺪدي. ) ﭼﮕﻮﻧﮕﻲ ورود داده ﻫﺎ در. SPSS. اوﻟﻴﻦ. ﮔﺎم. در. اﺟﺮاي. ﻫﺮﮔﻮﻧﻪ. ﭘﺮدازش ….. آﺷﻔﺘﮕﻲ ﻫﺎ را ﺑﻪ ﺗﺼﻮﻳﺮ ﻣﻲ ﻛﺸﺪ …. Graphs Histogram.

ویدئو آمار توصیفی Descriptive Analysis ، پرسشنامه | تحلیل …

آموزش ویدئویی آمار توصیفی میانگین انحراف معیار واریانس نمودار جدول فراوانی SPSS … شناسه مجموعه: Descriptive Analysis دسته: SPSS, ویدئوهای آموزشی … کار با نرم‌افزار به صورت گام به گام و در 24 صفحه که مربوط به کارگاه آموزش آمار توصیفی … رسم هیستوگرام و نمودار فراوانی نرمال Histogram; رسم نمودارهای خطی میانگین مشاهدات …

آموزش مقدماتی نرم افزار SPSS – فرازدرس

فرازدرس دوره مقدماتی آموزش SPSS را برای دانشجویان و پژوهشگران، قرار داده است. … spss 22, آموزش تصویری نرم افزار spss pdf, آموزش تصویری نرم افزار اس پی اس اس spss, … آموزش کامل نرم افزار spss (با زیرنویس فارسی), آموزش گام به گام نرم افزار spss, …. به نرم افزار; آموزش ذخیره اطلاعات; آموزش تغریف و حذف متغییر; آموزش رسم نمودارها …

ویدئو آموزش آمار توصیفی Descriptive Analysis | تحلیل آماری …

این آموزش به صورت یک مجموعه کامل مهم‌ترین بخش‌های یک تحلیل توصیفی را معرفی کرده و … و نحوه کار با نرم‌افزار به صورت گام به گام و در ۲۴ صفحه که مربوط به کارگاه آموزش آمار … رسم هیستوگرام و نمودار فراوانی نرمال Histogram; رسم نمودارهای خطی میانگین مشاهدات … spss: تحلیل آماری با SPSS. GraphPad Prism: آمار توصیفی در Prism.

کاربرد انواع نمودار و گراف در اکسل | ویدیو چک

آموزش رسم نمودار در اکسل؛ چگونه در انجام این کار حرفه ای شویم؟ … کنیم هیستوگرام ها کاربردهای متنوعی دارند و در اکثر تحلیل های آماری نیز به کار می روند نمودار …. کمک کنیم) هدف از این آموزش گام به گام نحوه کاربرد Spss در آمار توصیفی (تصویری)آموزش …

(جلد اول) SPSS 19 راهنمای آموزش – SlideShare

(جلد اول) SPSS 19 راهنمای آموزش. 1. ﺭﺍﻫﻨﻤﺎی ﺁﻣﻮﺯﺷﯽ SPSSSPSSSPSSSPSS 19191919 ﺗﻬﯿﻪ ﺗﻬﯿﻪ ﺗﻬﯿﻪ ﺗﻬﯿﻪ و و و و ﺗﻨﻈﯿﻢ ﺗﻨﻈﯿﻢ ﺗﻨﻈﯿﻢ ﺗﻨﻈﯿﻢ . …

تحلیل داده با نر م افزار SPSS – 9807 – پردیس نیکان

تصویر امنیتی … آشنايي با تب Graph در SPSS و ترسیم انواع نمودارها به کمک روش های سنتی و نوین; آشنايي با نمودار ميله‌اي، دايره‌اي، خطي، سطحي و هيستوگرام در SPSS و كشيدن آن‌ها; شكل‌هاي Boxplot، Error chart و … آن با گزينه Correlate; رگرسيون خطي و تحليل خروجي‌ها; رگرسيون خطي با استفاده از روش‌هاي گام به گام، پیشرو، پسرو و …

نمودارهای آماری مختلف و کاربرد آنها – مطالعات جمعیتی – blogfa

در آموزش به کودکان نیز می توان از نمودارهای خاص و قابل فهم برای گروه سنی مرتبط … نمودار تصویری است که دگرگونی های یک متغیر را نسبت به یک متغیر دیگر با خط و یا …. همچنین با استفاده از نموار هیستوگرام و رسم منحنی توزیع نرمال، می توانیم از ….. گام چهارم: رسم يك خط افقي و مدرج کردن آن بطوری كه بتوان همه داده ها را روي آن نشان داد.

آموزشی نرم افزار آماری SPSS – دانشگاه صدا و سیما

آزمون نمودار هیستوگرام چیست نرمال بودن، با ایجاد یك نمودار. احتمال نرمال بودن، به آزمون این فرض می. پردازد که آیا مشاهدات تحقیق از توزیع نرمال تبعیت می. کنن. د یا خیر. برخی از روش. های آماری …

نمودار ها در R

نمودار ها در R : تجسم داده ها تکنیکی است که برای ارائه بینش در داده ها با استفاده از نشانه های بصری مانند نمودارها، نمودارها، نقشه ها و بسیاری موارد دیگر استفاده می شود. این مفید است زیرا به درک شهودی و آسان مقادیر زیاد داده و در نتیجه تصمیم گیری بهتر در مورد آن کمک می کند.

ابزارهای محبوب تجسم داده ها که در دسترس هستند Tableau، Plotly، R، Google Charts، Infogram و Kibana هستند. پلتفرم های مختلف تجسم داده ها قابلیت ها، عملکردها و موارد استفاده متفاوتی دارند. آنها همچنین به یک مجموعه مهارت متفاوت نیاز دارند.

R زبانی است که برای محاسبات آماری، تجزیه و تحلیل داده های گرافیکی و تحقیقات علمی طراحی شده است. معمولاً برای تجسم داده ها ترجیح داده می شود زیرا انعطاف پذیری و حداقل کدگذاری مورد نیاز را از طریق بسته های خود ارائه می دهد.

صدها نمودار در R وجود دارد. به عنوان مثال، نمودار میله ای، نمودار نمودار هیستوگرام چیست جعبه، نمودار موزاییک، نمودار نقطه ای، کوپلات، هیستوگرام، نمودار دایره ای، نمودار پراکندگی و غیره.

انواع چارت های R

  • Bar Plot or Bar Chart
  • Pie Diagram or Pie Chart
  • Histogram
  • Scatter Plot
  • Box Plot

نمودار میله ای یا نمودار میله ای در R برای نمایش مقادیر در بردار داده ها به عنوان ارتفاع میله ها استفاده می شود. بردار داده ارسال شده به تابع بر روی محور y نمودار نشان داده می شود. نمودار میله ای می تواند با استفاده از تابع ()table به جای بردار داده مانند هیستوگرام رفتار کند.

نمودار ها در R

Pie diagram در R

نمودار دایره ای یک نمودار دایره ای است که با توجه به نسبت داده های ارائه شده به بخش های مختلف تقسیم می شود. اندازه کل پای 100 است و بخش ها کسری از کل پای را نشان می دهند. این روش دیگری برای نمایش داده های آماری به صورت گرافیکی است و از تابع ()pie برای انجام همان استفاده می شود.

نمودار ها در R

Histogram در R

هیستوگرام یک نمایش گرافیکی است که برای ایجاد یک نمودار با میله هایی که فراوانی داده های گروه بندی شده را در بردار نشان می دهد، استفاده می شود. هیستوگرام مانند نمودار میله ای است، اما تنها تفاوت بین آنها این است که هیستوگرام به جای خود داده، فراوانی داده های گروه بندی شده را نشان می دهد.

 نمودار ها در R

Scatter Plot در R

نمودار پراکندگی نوع دیگری از نمایش گرافیکی است که برای رسم نقاط برای نشان دادن رابطه بین دو بردار داده استفاده می شود. یکی از بردارهای داده در محور x و دیگری در محور y نشان داده شده است.

نمودار ها در R

Box plot در R

نمودار جعبه نشان می دهد که چگونه داده ها در بردار داده توزیع می شوند. پنج مقدار را در نمودار نشان می دهد، یعنی حداقل، چارک اول، چارک دوم (میانگین)، چارک سوم، حداکثر مقدار بردار داده.

نمودار ها در R

Dot plot در R

اگر بخواهیم چندین دسته را با یک معیار خاص مقایسه کنیم، این ابزار تجسم مفید است.

نمودار ها در R

Heat map در R

Heatmap به عنوان یک نمایش گرافیکی از داده ها با استفاده از رنگ ها برای تجسم مقدار ماتریس تعریف می شود. تابع ()heatmap برای ترسیم آن استفاده می شود.

نمودار ها در R

مزایای نمایش داده در R

R نسبت به سایر ابزارها برای تجسم داده ها دارای مزایای زیر است:

R مجموعه گسترده ای از کتابخانه های تجسم را همراه با راهنمایی آنلاین گسترده در مورد استفاده از آنها ارائه می دهد.

R همچنین تجسم داده ها را در قالب مدل های سه بعدی و نمودارهای چند پانل ارائه می دهد.

از طریق R، ما به راحتی می توانیم تجسم داده های خود را با تغییر محورها، فونت ها، افسانه نمودار هیستوگرام چیست ها، حاشیه نویسی ها و برچسب ها اختصاصی کنیم.

چولگی (Skewness) در داده‌ها

احتمالاً با توزیع نرمال آشنایی دارید. در مورد این توزیع و توزیع‌های دیگر در این دوره صحبت کرده‌ایم. اگر توزیع داده‌ها به سمت راست یا چپ کشیده شده باشد، می‌گوییم داده‌ها چولگی یا همان skewness دارند.

فرض کنید توزیعِ درآمد ماهیانه برای راننده‌های مختلف یک تاکسی اینترنتی به صورت شکل زیر باشد:

نمودار بالا یک نمودار هیستوگرام (فراوانی) است. اگر نمی‌دانید این نمودار و توزیع چگونه ساخته شده است این درس را بخوانید. در شکل بالا مشاهده می‌کنید که توزیع داده‌ها به صورت نرمال (یا همان گوسین) پراکنده شده است. برای مثال تعداد ۶۰۰ راننده‌ی تاکسی، درآمدی بین ۴ تا ۶ میلیون تومان دارند. تعداد ۳۵۰ راننده‌ی تاکسی درآمدی بین ۶ تا ۸ میلیون دارند و تعداد ۳۴۰ راننده هستند که درآمدی بین ۲ تا ۴ میلیون تومان دارند و همین‌طور برای بقیه‌ی داده‌ها…

نمودار بالا یک نمودار هیستوگرام برای نمایش توزیع داده‌هاست. این نمودار به صورت متقارن است. یعنی سمت چپ و راستِ داده‌ها، یکسان هستند. ولی فرض کنید هیستوگرام داده‌ها به جای اینکه به صورت بالا باشد، به صورت شکل زیر توزیع شده باشند:

همان‌طور که مشاهده می‌کنید، توزیع داده به سمت راست کشیده شده است. تفسیر شکل این صورت است که تعدادی از راننده‌ها بوده‌اند که درآمدهای بالایی نسبت به عرف راننده‌ها (که همان بین ۴ تا ۶ میلیون است) داشته‌اند. اگر داده‌ها به این صورت پراکنده شده باشند، می‌گوییم توزیع داده به سمت راست (مثبت) چولگی دارد.

به صورت کلی می‌توان چولگی داده‌ها را نسبت به یک توزیع نرمالِ ایده‌آل به صورت زیر نمایش داد:

همان‌طور که می‌بینید در حالتی که داده‌های ما به سمت راست چولگی داشته باشند، میانگین (mean) از مُد (mode) بیشتر است و در حالتی که داده‌های ما به سمت چپ چولگی داشته باشند، میانگین از مُد کمتر است. میانه (median) هم که در هر دو حالت بین میانگین و نمودار هیستوگرام چیست مُد قرار می‌گیرد.

با استفاده از چارک‌ها (quartiles) نیز می‌توان چولگی داده‌ها را تشخیص داد. شکل زیر را در نظر بگیرید:

در قسمت اول از شکل بالا، داده‌ها نرمال هستند، چون چارک‌ها در حالت متوازن قرار دارند، ولی در نمودار هیستوگرام چیست قسمت دوم، مشخص می‌شود که داده‌ها به سمت راست چولگی دارد. در واقع اگر اختلاف Q3 و Q2 از اختلاف Q2 و Q1 بیشتر باشد، به این نتیجه می‌رسیم که داده‌ها به سمت راست (مثبت) چولگی دارند و اگر مانند قسمت سوم، برعکسِ این اتفاق بیوفتد به این نتیجه می‌رسیم که داده ها به سمت چپ (منفی) چولگی دارند.

البته اگر بخواهیم به صورت دقیق‌تر چولگی داده‌ها را بررسی کنیم، می‌توانیم از فرمول زیر استفاده کنیم:

در این فرمول هر کدام از اعداد را منهای میانگین کرده، به توان ۳ می‌رسانیم و همه‌ی نتایج را با هم جمع می‌کنیم. سپس این داده‌ها را تقسیم بر تعداد کل داده‌ها منهای یک ضرب در انحراف استاندارد داده‌ها می‌کنیم. عددی که به دست می‌آید و اگر مثبت باشد، یعنی چولگی به سمت راست داریم و اگر منفی باشد یعنی چولگی به سمت چپ داریم. اگر صفر باشد به این این معنی است که داده‌ها چولگی ندارند.

چولگی در داده‌ها (skewness) را به عنوان گشتاور سوم نیز می‌شناسند. وجود توان ۳ در فرمول همین موضوع را می‌رساند. همان‌طور که در فرمول واریانس توان ۲ وجود داشت و واریانس را به عنوان گشتاور دوم می‌شناسند. همچنین گشتاور اول همان میانگین است که توان ۱ در فرمول خود دارد.

چولگی داده‌ها به ما می‌گوید که داده‌های پرت در کدام سمت (راست یا چپ) نسبت به میانگین قرار دارند. همچنین در فرآیند‌های یادیگری ماشین نیز، داده‌هایی (ویژگی‌هایی) که چولگی داشته باشند، می‌توانند منجر به افزایش خطا شوند. برای همین می‌توان این داده‌ها با استفاده از تبدیل‌هایی مانند تبدیل توان (power transformation) به داده‌های نرمال ایده‌آل تبدیل کرد که در دوره‌ها و دروس آینده به این موضوع خواهیم پرداخت.



اشتراک گذاری

دیدگاه شما

اولین دیدگاه را شما ارسال نمایید.