التوزيع الاعتدالي للبيانات واختبارات التحقق منها

 

التوزيع الاعتدالي للبيانات واختبارات التحقق منها

Data Distribution


بين الإحصائيون أن توزيع العينات تميل إلى أن تكون طبيعية مع حجم العينة المنخفض (N = 30).

خصائص التوزيع الطبيعي Normal Distribution

1- وحيد الموال

2- متناظر: أي أن التوزيع له نصفان متساويان (أيمن وأيسر)

3- توزيع البيانات على شكل جرس

4- قيم المتوسط الحسابي والوسيط والمنوال متساوية

أحيانا توزيع البيانات يكون ذو التواء، إما التواء موجب أو التواء سالب

ما هو الالتواء Skewness؟

- الالتواء يعبر عن درجة ابتعاد توزيع البيانات عن التوزيع المتماثل (التوزيع المتماثل يظهر على شكل جرس، إذا رسمنا خط في منتصفه فإن البيانات على اليمين تتماثل مع البيانات على اليسار).

- إذا كان الذيل الأيمن لتوزيع البيانات أكبر وأكثر وضوحا من الذيل الأيمن لها، نستطيع أن نقول إن الالتواء موجبا. أما إذا كان الذيل الأيسر للبيانات أكبر وأكثر وضوحا من الذيل الأيمن لها، نستطيع أن نقول إن الالتواء سالبا. وسوف نركز هنا على الالتواء الموجب.

- أيضا يعني الالتواء الشديد أن منحنى التوزيع له ذيل أقصر في أحد طرفيه ومنحنى توزيع وذيل طويل في الطرف الآخر. والبيانات المنحرفة أو الملتوية تعني أن البيانات ليست موزعة بالتساوي؛ حيث تفضل الدرجات التي تم الحصول عليها من جمع البيانات جانبًا واحدًا من التوزيع.

- ومن الناحية المالية يشير فهم الالتواء في مجموعة البيانات إلى ما إذا كانت الانحرافات المحتملة عن المتوسط ستكون إيجابية أم سلبية (سيتم توضيح هذه النقطة في نهاية الموضوع)

الالتواء الموجب Positive Skewness


 

الالتواء الموجب

- يشير الانحراف الإيجابي إلى ذيل أطول ناحية اليمين (كما في الرسم المرفق)، وفيه يكون المتوسط أعلى من الوسيط حيث يكون الالتواء ناحية اليمين.

- والسبب في أن المتوسط يكون أكبر من الوسيط في الالتواء الموجب هو أن المتوسط يتأثر بالقيم المتطرفة بدرجة أكبر من الوسيط (حيث لا يتأثر بهذه القيم).

مثال:

===

درجات طلاب الصف الأول هي: 50 و 51 و 52 و 53 و 59

المتوسط = مجموع درجات الطلاب / عدد الدرجات

المتوسط = 50 + 51 + 52 + 53 + 59 / 5

المتوسط = 53

الوسيط = الدرجة التي تقسم البيانات إلى نصفين بعد إجراء عملية ترتيب الدرجات ترتيبا تصاعديا

الوسيط هنا سيكون عند الدرجة الثالثة والذي سيكون قبلها درجتين وبعدها درجتين

الوسيط = 52

إذن المتوسط > الوسيط

       53    > 52

- الالتواء الموجب> 0 يعني أن توزيع البيانات ينحرف ناحية اليمين؛ حيث تتركز معظم القيم على يسار الوسط، مع وجود القيم العليا المتطرفة ناحية اليمين.

على ماذا يخبرنا الالتواء الموجب؟

- الالتواء عموما يعطينا معلومات عن اتجاه القيم المتطرفة في البيانات. ففي الانحراف الموجب يكون الذيل أطول في الجانب الأيمن، وهذا يعني أن اتجاه القيم المتطرفة يكون ناحية اليمين. والالتواء يخبرنا فقط عن اتجاه القيم المتطرفة وليس عدد هذه القيم.

- انحراف البيانات والتوائها الشديد قد يؤدي إلى نتائج مضللة عند إجراء التحليل الإحصائي لها، ولذلك فإن الالتواء الموجب الشديد غير مرغوب فيه؛ مما يضطر ذلك الباحث إلى أن يقوم بإجراء تحويل للبيانات من خلال log transformation من أجل جعلها أقرب إلى التوزيع الطبيعي.

الالتواء السالب Negative Skewness


الالتواء السالب


- يكون الذيل الأيسر أطول من الذيل الأيمن للتوزيع

- المتوسط الحسابي يكون أصغر من الوسيط، والوسيط أصغر من المنوال

- تقع معظم الحالات ناحية اليمين

- لمعرفة إذا كان الالتواء سالبا نقوم بطرح الوسيط من المتوسط الحسابي

Mean – median = negative

حساب معامل الالتواء:

يتم حساب الالتواء بطريقتين:

(أ) مقاييس الالتواء:

1- معامل التواء بيرسون

2- معامل التواء فيشر

(2) المدرج التكراري والرسوم البيانية الاحتمالية

ما هي معاملات الالتواء؟ Skewness Coefficients ؟

هي قياسات لتماثل أو عدم تماثل شكل التوزيع.

معامل التواء التوزيع الطبيعي = صفر

معامل التواء بيرسون ومعامل التواء فيشر


(1) معامل التواء بيرسون Pearson’s Skewness Coefficient

 

الالتواء = المتوسط – الوسيط / الانحراف المعياري

وتتراوح قيمته بين (-1, +1)

- وفقا لهيلمدبراند؛ فإن معاملات الالتواء التي تزيد عن +.20 أو تقل عن -.20 تعتبر شديدة الانحراف (Hair et al., 2010; Hildebrand, 1976; Munro, 2005)

مثال: إذا كان متوسط درجات عينة يساوي 35 والوسيط يساوي 36 والانحراف المعياري يساوي 9

ما قيمة معامل الالتواء، وما نوعه (موجب أو سالب) وهل التوزيع طبيعي أو غير طبيعي.

الحل

الالتواء = المتوسط – الوسيط / الانحراف المعياري

الالتواء = 35 – 36 /9

الالتواء = -0.11

إذن الالتواء سالب، والتوزيع يقع في المدى الطبيعي حيث يمكن قبوله وفقا لهيلمدبراند لأن الانحراف أقل من -0.20

(2) معامل التواء فيشر Fisher’s Skewness Coefficient

 

الالتواء = قيمة الالتواء / الخطأ المعياري للالتواء

- إذا كان معامل الالتواء يزيد على +1.96 أو يقل عن -1.96 فإن الانحراف يكون شديدا (في حال Alpha = 0.05)

- أيضا إذا كان معامل الالتزاء يزيد على +2.58 أو يقل عن -2.58 فإن الانحراف يكون شدياا  (في حال Alpha = 0.01)

 

مثال لحساب درجة الالتواء

المتوسط = 48

الوسيط = 40

الانحراف المعياري = 30

الالتواء = 3 × (المتوسط – الوسيط )/ الانحراف المعياري

الالتواء = 3 × (48 – 40) / 30

الالتواء = 3 × (8)/30

الالتواء = 0.8

متى نقول إن الالتواء مقبول أو غير مقبول؟

تعددت الأراء بشأن حساب درجة القطع الخاصة بالالتواء (سواء كان موجبا أم سالبا)، وسنعرض بعضها هنا:

- إذا كان الالتواء أقل من -1 أو أكبر من 1 ، فإن التوزيع شديد الانحراف.

- إذا كان الالتواء بين -1 و -0.5 أو بين 0.5 و 1 ، فإن التوزيع منحرف بشكل معتدل.

- إذا كان الالتواء بين -0.5 و 0.5 ، يكون التوزيع متماثلًا تقريبًا.

- أشار Hair وآخرون (2010) وكذلك Bryne (2010) بأن البيانات تعتبر طبيعية إذا كان الانحراف بين 2 إلى +2

- أيضا اقترح Curran وآخرون. (1996) أن درجات القطع المقبولة والمعتدلة هي 2.0 للالتواء خصوصا عند إجراء تحليل MANOVA للبيانات.

الالتواء الموجب من الناحية المالية (قطاع المال والأعمال):

- الالتواء الموجب من الناحية المالية (خصوصا لدى المستثمرين) هو أمر مرغوب فيه

- والالتواء الموجب هنا يشير إلى احتمالية تحقيق أرباح أكثر من الخسائر، أو أن الأرباح المحتملة تفوق الخسائر الصغيرة المتكررة.

- وهناك وجهة نظر تقول أن الالتواء الموجب وحده لا يعني أن العوائد المستقبلية ستكون إيجابية، بل يعني أن الجزء الأكبر من العوائد سيكون على يسار المتوسط مع وجود قيم متطرفة على يمين المتوسط.

- ويتم قياس الالتواء كمعامل، مع إمكانية أن يكون المعامل موجبًا أو سالبًا أو صفرًا.

- ومعامل الالتواء هو مقياس لدرجة التماثل في توزيع البيانات (مثلا: العائد الشهري). فهو يتيح للمستثمرين القدرة على تحديد المكان الذي ستنخفض فيه غالبية العوائد الشهرية وأيضًا الإشارة إلى أي أحداث متطرفة (قيم متطرفة outliers).

اختبارات التحقق من اعتدالية البيانات


Kolmogorov & Shapiro Test

 

(1) اختبار The Kolmogorov-Smirnov

هذا الاختبار يقارن بين توزيع البيانات التي حصل عليها الباحث بتوزيع احتمالي افتراضي معروف (التوزيع الطبيعي المثالي)

هذا الاختبار يستخدم للتحقق من افتراض التوزيع الطبيعي للبيانات

 

من مميزات هذا الاختبار:

- لا توجد قيود على حجم العينة؛ حيث يمكن استخدامه مع العينات الصغيرة.

من عيوب هذا الاختبار:

- يستخدم فقط للتوزيعات المتصلة، ولا يمكن استخدامه للبيانات ذات التوزيع المنفصل.

- حساس جدا تجاه القيم المتطرفة.

(2) اختبار Shapiro-Wilk

هو طريقة لمعرفة ما إذا كانت العينة العشوائية التي حصل عليها الباحث تأتي من التوزيع الطبيعي.

من عيوب هذا الاختبار

أنه حساس تجاه العينات الكبيرة، فكلما زاد حجم العينة، زادت احتمالية الحصول على نتيجة ذات دلالة إحصائية وبالتالي نستنتج أن التوزيع غير طبيعي.

كيف أعرف من خلال الاختبارين السابقين أن التوزيع طبيعي أو غير طبيعي؟

إذا كانت نتيجة الاختبار غير دالة إحصائيا؛ فهذا يدل على أن توزيع البيانات التي حصل عليها الباحث هو توزيعا اعتداليا

أما إذا كانت نتيجة الاختبار دالة إحصائيا؛ فهذا يدل على أن توزيع البيانات التي حصل عليها الباحث هو توزيعا غير اعتداليا

 

Comments

Popular posts from this blog

مخطط الأعمدة والمدرج التكراري