ما هو التحليل الإحصائي؟
التحليل الإحصائي statistical analysis هو علم جمع البيانات وتنظيمها واستكشافها وتفسيرها وتقديمها وكشف الأنماط والاتجاهات، ويتم التحليل الإحصائي بعدة طرق منها: معادلات الانحدار وتحليل النسبة وتحليل المسار وغيرها. والغرض الأساسي من هذه الطرق هو تحديد الارتباط بين متغيرين أو أكثر والتنبؤ بالأحداث، ومدى إمكانية تحقيقها مرة أخرى في أحداث مستقبلية.
يتعامل علم الإحصاء مع حجم هائل من البيانات، والتحليل الإحصائي هو تجميع وتصنيف وتحليل وتفسير هذه البيانات وعرضها في شكلها الرقمي من أجل اتخاذ القرارات المناسبة حيث تشمل أهداف التحليل الإحصائي ما يلي:
- تلخيص البيانات وتقديمها في شكل يُسهل فهمها.
- البحث عن المقاييس الرئيسية بما في ذلك المتوسط الخاص بمجموعة من البيانات.
- حساب مقاييس الانتشار وذلك لتحديد إذا ما كانت البيانات التي يتم جمعها مُحكمة أم منتشرة بشكل أكبر، ولعل الانحراف المعياري هو المثال الأبرز والأكثر انتشارًا لمقاييس الانتشار.
- بناء التنبؤات المستقبلية حيث يساهم التحليل الإحصائي في عمليات صنع القرار المتعلقة بالتصنيع والخدمات الرياضية والمصرفية والبيع بالتجزئة وغيرها.
- اختبار الفرضيات حيث يُستخدم الإحصاء من أجل اختبار فرضية معينة حيث يتم دحض أو إثبات فرضية صفرية.
وإجمالًا فإن الهدف من التحليل الإحصائي هو تحديد الاتجاهات الخاصة بالبيانات الخاضعة للتحليل، لذلك من فوائد التحليل الإحصائي أنه يجعل البيانات أكثر فهو ليس هدفًا في حد ذاته إنما وسيلة علمية.
للتوضيح أكثر سنطرح مثالًا سريعًا للتحليل الإحصائي وهو عملية التعداد السكاني، بداية دعونا نتفق أن البيانات في شكلها الخام عديمة الفائدة ولا تساعدنا في فهم الواقع أو التخطيط للمستقبل، ففي التعداد السكاني على سبيل المثال عادةً ما نرغب في معرفة عدد السكان بشكلٍ عام، ثم عد الإناث والذكور والفئات العمرية وغيرها، وهو ما نطلق عليه المتغيرات الديموغرافية والحالة الاقتصادية والاجتماعية والتوزيع الجغرافي… إلخ. بالتالي فإن عدد السكان بشكل مُجمل غير مفيد، لكن حينما يكون لدينا تصنيف دقيق للفئات السابقة والعلاقة بين الزيادة السكانية وبعض المتغيرات وغير ذلك، نكون بصدد التحليل الإحصائي الذي يجعل البيانات أكثر قيمة.
استخدامات التحليل الإحصائي
نحن لا نبالغ حينما نقول أن علم الإحصاء يُستخدم في كل شيء في حياتنا، كوننا نعتمد عليه في البحث العلمي وفي الصناعة والتجارة والمؤسسات الحكومية، حيث يستخدم المصنعون التحليل الإحصائي لتحسين الجودة وزيادة الإنتاجية في مجالات متنوعة، بما في ذلك صناعة الطيران وتحسين جودة الأقمشة.
أولًا: البحث العلمي
يستخدم الباحثون في مختلف المجالات العلمية الإحصاء للوصول إلى النتائج والتحقق من الفرضيات المختلفة فعلى سبيل المثال: يستخدم الباحثون الإحصاء لتحليل البيانات المتعلقة بإنتاج اللقاحات الفيروسية بما يضمن الاتساق والسلامة، كما يعتمد على الإحصاء في العلوم الاجتماعية والبحوث التطبيقية بنسب متفاوتة، ما يؤكد أهمية التحليل الإحصائي لمجال البحث العلمي.
ثانيًا: المجال التجاري
وفي المجال التجاري وإدارة الأعمال يستخدم المسئولين بالشركات الإحصاء لتحسين فهم السوق واحتياجات العملاء فعلى سبيل المثال: تستخدم شركات الاتصالات الإحصائيات لتحسين خدماتها وموارد الشبكة، والوصول لفهم واضح لاحتياجات عملائها.
ثالثًا: المؤسسات الحكومية
تعتمد الحكومات المختلفة على الإحصائيات، سواء في عملية التعداد السكاني أو الاقتصاد والإجراءات الإدارية المتنوعة.
رابعًا: المجال التجاري
يمر سوق الأسهم بتقلبات كبيرة، لذا عادةً ما تستخدم الشركات الإحصائات لتقييم عدد من قراراتها التجارية بما في ذلك شراء الأسهم وبيعها، بالإضافة إلى اعتمادها على التحليل الإحصائي في عملية إدارة المخاطر التي قد تتعرض لها الشركة وتقييم مدى جسامة هذه المخاطر، وأخيرًا تستخدم الشركات معادلات الانحدار لاختبار الفرضيات العامة المتعلقة بتأثير عدد من العوامل على أصول الشركة وسعرها أسهمها في البورصة، كما تستخدم الإحصاء في مجالات أخرى ومنها:
1. أبحاث السوق
حيث يستخدم التحليل الإحصائي في أبحاث السوق فيقدم أرقام محددة حول العرض والطلب الخاص بالمنتجات، وتوزيع العملاء وتوجهاتهم المستقبلية وغيرها.
2. ذكاء الأعمال وتحليل البيانات
يستخدم التحليل الإحصائي في مجال ذكاء الأعمال، حيث يقدم مجموعة من التنبؤات التي تساهم في وضع الخطط المستقبلية.
3. تحسين محركات البحث
يعتمد تحسين محركات البحث على الإحصاء كمؤشر أساسي، حيث يقدم لنا عدد الكلمات المفتاحية التي يبحث عنها الجمهور عبر الإنترنت، ما يجعلنا نستهدفها.
4. التحليل المالي
لقد أدى التطور التكنولوجي إلى زيادة القدرة على الاحتفاظ بالبيانات المتنوعة واستعادتها وهو يزيد من أهمية الإحصاء، حيث أصبحت الحوسبة الإحصائية أكثر أهمية، بما في ذلك البرمجة الإحصائية والاقتصاد القياسي.
أهمية التحليل الإحصائي
لعل المثال السابق وضح لنا أهمية التحليل الإحصائي، فهو يساعد على تصنيف البيانات وتحليلها وتفسيرها، بالتالي فهو يُقدم لنا مؤشرات هامة تكون لبنة أساسية في عملية صنع القرار الخاص بالمؤسسات أو الحكومات، علاوةً على أهميته الخاصة في مجال البحث العلمي وفي مختلف المجالات الطبية والهندسية والتجارية والصناعات المختلفة، مثل الدواء أو الشركات البرمجية والتقنية وغيرها.
خطوات التحليل الإحصائي
ينقسم التحليل الإحصائي إلى خمس خطوات كالتالي:
- الوصف: الخطوة الأولى تتمثل في وصف البيانات التي نريد تحليلها.
- الاستكشاف: الخطوة الثانية تتمثل في اكتشاف علاقة البيانات بالمحتوى الأساسي.
- إنشاء نموذج: الخطوة الثالثة هي إنشاء نموذج لتوضيح وفهم ارتباط البيانات بالمجموعة الأساسية.
- اختبار النموذج: الخطوة الرابعة ترتكز على اختبار النموذج بهدف إثباته أو دحضه.
- التحليلات التنبؤيه: الخطوة الخامسة تتمثل في استخدام التحليلات التنبؤيه من أجل تفعيل السيناريوهات، التي ستساعد في فهم الإجراءات المستقبلية.
فيما يلي تبسيط خطوات التحليل الإحصائي بطريقة أخرى:
يبدأ التحليل الإحصائي بجمع البيانات سواء من مصادرها الأولية أو الثانوية فعلى سبيل المثال: يمكننا جمع البيانات من خلال الاستطلاعات أو برامج إدارة علاقات العملاء والتقارير المالية والاختبارات على الإنترنت وغيرها، من خلال اختيار عينة مُمثلة للمجتمع الأصلي.
الآن لدينا بيانات خام ونريد تنظيمها أو كما يطلق عليها خبراء الإحصاء تنظيفها، بمعنى إزالة البيانات المكررة والتناقضات التي قد تمنعنا من الحصول على تحليل دقيق، وهذه الخطوة غاية في الأهمية لأنها تساعدنا في التحقق من صحة البيانات، بالتالي صحة الاستنتاجات التي نستخلصها من التحليل.
بعد تنظيم البيانات تأتي مرحلة عرض البيانات لنستطيع تحليلها بسهولة، في هذه الخطوة نستخدم أدوات التحليل الوصفي لعرض البيانات بشكل صحيح. سنتعرف لاحقًا إلى التحليل الإحصائي الوصفي وأدواته.
الخطوة الرابعة من خطوات التحليل الإحصائي هي تحليل البيانات، في هذه الخطوة نستخدم التقنيات الإحصائية للاستكشاف العلاقات والاتجاهات، وهنا نستخدم التحليل الإحصائي الاستنتاجي والترابطي.
الآن أجرينا التحليل واستخرجنا الارتباطات والاتجاهات المتنوعة بداخل البيانات الخاضعة للتحليل، وهنا تأتي مرحلة التفسير بعد تقديم النتائج في شكل مخططات وتقارير وغيرها.
أنواع التحليل الإحصائي
ينقسم التحليل الإحصائي لسبع أنواع وفقًا لنوع البيانات التي يتم تحليلها كالتالي:
1. التحليل الإحصائي الوصفي
عندما نُنظم البيانات ونُلخصها باستخدام الأرقام والرسوم البيانية، فنحن في هذه الحالة نستخدم الإحصاء الوصفي الذي يهدف بشكل أساسي لتسهيل البيانات الضخمة وجعلها قابلة للتفسير، فهو يمكّننا من تمثيل البيانات وتفسيرها بكفاءة من خلال الرسوم البيانية والجداول، حيث يتضمن مجموعة من العمليات بما في ذلك الجدولة وقياس الاتجاه المركزي (الوسط، الوسيط) ومقاييس التشتت والتباين (الانحراف المعياري، التباين، المدى) وتحليل السلاسل الزمنية.
بحيث نلخص البيانات ونعرضها في شكل جداول ومخططات ورسوم بيانية، ما يساهم في استخراج الخصائص المميزة للبيانات وشرح سماتها الأساسية، لكننا لا نقوم في هذا النوع باستخلاص رؤى بشأن المجموعات التي لم تتم ملاحظتها في بيانات العينة الخاضعة للتحليل. لذا يُعد التحليل الإحصائي الوصفي أبسط أنواع التحليل الإحصائي، فهو يساعد في تقليل البيانات الكبيرة وتقديمها في أشكال بسيطة تُسهل من عملية التفسير.
الإحصائيات المستخدمة في التحليل الوصفي:
- مقياس الانتشار
- مقاييس الاتجاه المركزي
لكن ثمة مجموعة من العيوب للإحصاء الوصفي أبرزها أنه لا يقدم أكثر من نتائج كمية للظاهرة، مثلًا حينما نقوم بوصف مجموعة كبيرة من البيانات باستخدام قيمة واحدة كالمتوسط، في هذه الحالة نكون بين خيارين إما تشويه البيانات الأصلية أو فقدان معلومات هامة، فعلى سبيل المثال يمكننا الإحصاء الوصفي في الأعمال التجارية من حساب متوسط الإيرادات، لكنه لا يقدم لنا تفاصيل أكثر حول المنتجات الأكثر مبيعًا أو المنافذ الأكثر توزيعًا وهكذا.
2. التحليل الإحصائي الاستنتاجي
يتيح التحليل الإحصائي الاستنتاجي اختبار فرضية معينة اعتمادًا على عينة من البيانات التي يمكن من خلالها استخلاص الاستنتاجات، من خلال تطبيق الاحتمالات والتعميمات حول البيانات بأكملها، بالإضافة إلى إمكانية التنبؤ بالنتائج المستقبلية التي تتجاوز البيانات المتاحة.
التحليل الإحصائي الاستنتاجي أو الاستدلالي يساهم في العثور على الفروق بين المجموعات المتنوعة داخل العينة، ويمكّننا من اختبار الفرضيات.
3. التحليل الإحصائي التنبؤي
حينما نريد التنبؤ بأحداث مستقبلية معينة بناء على مجموعة من الحقائق والأرقام سواء كانت حالية أو مستقبلية، فإننا نستخدم التحليل الإحصائي التنبؤي، من خلال استخدام التقنيات المستقبلية وخوارزميات التعلم الآلية لوصف إمكانية النتائج المستقبلية انطلاقًا من بيانات آنية أو من الماضي، وتعد نمذجة البيانات والذكاء الاصطناعي والتعلم الآلي أبرز التقنيات المستخدمة في هذا النوع من التحليل الإحصائي.
وعادةً ما تعتمد شركات التأمين والتسويق على التحليل الإحصائي التنبؤي، وذلك للتخطيط لمستقبل والتنبؤ بالنتائج المستقبلية مثل تضييق نطاق المخاطر المرتبطة بحدث مستقبلي أو تحقيق مكاسب الميزة التنافسية وغيرها، ويمكن للأعمال الأخرى الاستفادة من مميزات التحليل الإحصائي التنبؤي للتخطيط المستقبلي والتنبؤ، باختصار يستخدم هذا النوع من التحليل الإحصائي للاجابة على سؤال ماذا يمكن أن يحدث؟
4. التحليل الوصفي
نستخدم التحليل الوصفي حينما يكون لدينا كمية كبيرة من البيانات، ونرغب في معرفة ما هو أفضل إجراء يمكن أن يحدث، فهو يستخدم بكثرة في تحليل الأعمال لتحديد أفضل إجراء ممكن في موقف معين، فهو يركز بشكل أساسي على اكتشاف الاقتراح الأمثل في عملية صنع القرار.
ومن التقنيات الإحصائية المستخدمة في هذا النوع: المحاكاة والخوارزميات والرسم البياني والتعلم الآلي وغيرها. باختصار، يُستخدم التحليل الإحصائي الوصفي للإجابة عن سؤال ماذا حدث، فهو يقدم توصيفًا لواقع الظاهرة، بالتالي يساعدنا في اتخاذ القرارات بشأنها.
5. تحليل البيانات الاستكشافية
تعد تحليل البيانات الاستكشافية الخطوة الأولى في عملية تحليل البيانات، كونها تساعد في الحصول على الأفكار الرئيسية المتضمنة داخل البيانات، فهي تهدف إلى التعرف على العلاقات المحتملة، والحصول على البيانات المفقودة من البيانات الخاضعة للتحليل وفحص الفرضيات المختلفة.
6. التحليل السببي
يهتم التحليل السببي بتقديم إجابة واضحة على سؤال لماذا؟ فهو يساعدنا في فهم الأسباب الكامنة وراء الظاهرة ومعرفة الأشياء التي جعلت الظاهرة تبدو على هذا النحو، مثلًا يستخدم هذا النوع لمعرفة سبب فشل مشروع معين أو برنامج معين لتحصين الشركة من الانتكاسات المستقبلية، بالتالي فهو يستخدم في:
- فحص الأسباب الجذرية لمشكلة ما.
- فهم ما الذي سيحدث للمتغير في حالة تغير أحد المتغيرات الأخرى الخاصة بالظاهرة محل الدراسة.
7. التحليل الآلي
يعد التحليل الآلي هو النوع الأقل شيوعًا بين أنواع التحليل الإحصائي الأخرى، وهو يُستخدم لفهم كيفية حدوث الأشياء عند تحليل بيانات ضخمة، حيث يهتم بدراسة تأثير متغيرات الظاهرة على بعضها، مع استبعاد المتغيرات الوسيطة أو الأحداث الخارجية التي يمكن أن تؤثر عليها، فهو يقدم شرح وافي لحدث سابق في سياق البيانات المقدمة.
مثال: إذا رغبنا في معرفة سبب فشل الشركات الناشئة خلال السنوات الأولى، وكان لدينا مجموعة من البيانات المتعلقة بالشركات الناشئة في مجال ما أو في بلد ما فإننا:
- عندما نستخدم أساليب إحصائية معينة لمعرفة أسباب الفشل، فإننا نستخدم الإحصاء السببي.
- إذا استخدمنا تقنيات إحصائية لتوصيف الظاهرة في وضعها الحالي وماضيها، فإننا نستخدم الإحصاء الوصفي.
- إذا استخدمنا التقنيات الإحصائية لتقديم تنبؤات مستقبلية وخطط، فإننا نستخدم التحليل الإحصائي التنبؤي.
- ربما يكون لدينا مجموعة من البيانات المتعلقة بالشركات الناشئة، فإذا رغبنا في اكتشاف العلاقات بين المتغيرات مثلًا الشركات الناشئة وعملية التسويق أو الإدارة أو رأس المال، واستخلصنا العلاقات بين البيانات المقدم حينها نستخدم الإحصاء الاستكشافي.
لا يوجد تضارب بين أنواع التحليل الإحصائي السابقة، وعادةً ما يستخدم نوع أو أكثر من التحليل الإحصائي عند القيام ببحث معين فعلى سبيل المثال: تستخدم أبحاث السوق التحليل الإحصائي الوصفي والاستنتاجي، وذلك لتحليل النتائج والتوصل لاستنتاجات.
طرق التحليل الإحصائي
هناك خمس طرق شائعة للتحليل الإحصائي كالتالي:
أولًا: المتوسط
يعدّ المتوسط أبسط أشكال التحليل الإحصائي وهو يهدف إلى تحديد النقطة المركزية لمجموعة البيانات، ويتم حسابه كالتالي:
المتوسط = مجموعة الأرقام ÷ عدد العناصر
مثال: إذا أردنا استخراج المتوسط من الأرقام التالية 1,2,3,4,5,6 فإننا سنقوم بجمع هذه الأرقام معًا، ثم نقوم بقسمته على عدد وهو 6 أرقام ليكون المتوسط هو 3.5
ويتميز المتوسط بكونه سهل الحساب ويساعد في تحديد الاتجاه العام للبيانات، أما عيوبه تظهر حينما تكون البيانات الخاضعة للتحليل تحتوي على عدد كبير من القيم المتطرفة أو التوزيع المنحرف لا يوفر المتوسط في هذه الحالة الدقة، التي نحتاجها لاتخاذ القرار.
ثانيًا: الانحراف المعياري
يقيس الانحراف المعياري كيفية انتشار البيانات حول المتوسط، وعندما يكون الانحراف المعياري عالي هذا يعني أن البيانات تتشتت على نطاق واسع عن المتوسط، بينما يكون الانحراف المعياري منخفض عندما تكون معظم البيانات أقرب إلى المتوسط. من عيوبه أنه مثل المتوسط تمامًا يمكن أن يعطينا بيانات غير دقيقة.
مثال للانحراف المعياري: عند القيام باستطلاع رأي أو استمارة استبيان تجاه خدمة معينة أو منتج، يمكنك تحليل النتائج الخاصة بإجابات المبحوثين، ومن ثم قياس مدى تشابه أو اختلاف الإجابات، فإذا كان التشابه كبير هذا يعني أن الانحراف المعياري منخفض والعكس صحيح.
ثالثًا: الانحدار
يستخدم الانحدار لإيجاد العلاقة التي تربط بين متغير مستقل وآخر تابع، حيث يساعد في تتبع كيفية تأثير المتغيرات على بعضها، ويوضح الانحدار مدى قوة أو ضعف العلاقة بين متغيرين وكيفية اختلافها من فترة لأخرى.
رابعًا: اختبار الفرضيات
نستخدم اختبار الفرضيات حينما نريد التأكد من أن استنتاج ما صالحًا لمجموعة بيانات محددة خلال مقارنة البيانات مع افتراض معين، من الممكن أن تكون هناك علاقة بين المتغيرات أو لا تكون على الإطلاق وهو ما يعرف بالفرضية الصفرية. مثال: يمكن أن نستخدم اختبار الفرضيات لمعرفة العلاقة بين نوع الغذاء والحالة الصحية أو بين التحصيل الدراسي والتقدم في العمر، ويمكن أن تكون الفرضية الصفرية لا توجد علاقة بين التقدم في العمر والتحصيل الدراسي وهكذا.
خامسًا: تحديد حجم العينة
عادةً ما يكون المجتمع الأصلي الذي نجري عليه البحث كبير جدًا وهو ما يشكل صعوبة في إجراء البحث على جميع مفرداته. لذا نلجأ إلى اختيار عينة ممثلة عن المجتمع الأصلي ثم نعمم النتائج عليه، وهذا ما نطلق عليه تحديد حجم العينة، ولكي يتم ذلك بشكل صحيح نحتاج لتحديد الحجم المناسب للعينة لتكون معبرة عن المجتمع الأصلي ودقيقة، ولتحقيق ذلك نقوم بأخذ عينات لأن العينات الصغيرة قد لا تكون معبرة، أما العينات الكبيرة قد تكون إهدار للوقت والجهد والمال، من هنا تنبع أهمية العينات في التحليل الإحصائي، فهي الفيصل في صدق وصحة النتائج من عدمه.
يلعب الحاسب الآلى دورًا كبير في تطور التحليل الإحصائي، حيث أتاحت برامج التحليل الإحصائي إمكانات هائلة للتعامل مع البيانات الضخمة وإجراء العمليات الحسابية المعقدة بسهولة ويسر ودقة وسرعة كبيرة، وعادةً ما يتعامل المحلل الإحصائي مع بيانات ضخمة، لذا يستعين المحللون ببرامج التحليل الإحصائي مثل IBM SPSS وRMP التي تساعدهم في إجراء التحليلات المعقدة من خلال الأدوات الإضافية التي توفرها تلك البرامج لتنظيم مجموعات البيانات وتفسيرها وعرضها. فيما يلي شرح موجز لإمكانات عدد من برامج التحليل الإحصائي:
يُعد برنامج IBM SPSS هو البرنامج الأكثر شهرة بين برامج التحليل الإحصائي لا سيما في الأوساط العلمية والأكاديمية، حيث يغطي البرنامج الكثير من العمليات التحليلية من إعداد البيانات وتحليلها وإعداد التقارير، علاوةً على واجهة البرنامج القابلة للتخصيص، ويستخدم برنامج SPSS بكثرة في مجال العلوم الاجتماعية.
- برنامج R Foundation for Statistical Computing
وهو برنامج مجاني ويستخدم بكثرة في أبحاث السلوك البشري، ورغم أهمية البرنامج إلى أنه يتطلب درجة عالية من الخبرة، كونه يتطلب درجة معينة من الترميز، ما يعني أنه مناسب للخبراء لا المبتدئين.
- برنامج MATLAB (the Mathwirks)
يعد MATLAB منصة تحليلية ولغة برمجة في نفس الوقت، عادةً ما يستخدمها المهندسون والعلماء على نطاق واسع.
يقدم برنامج الإكسل مجموعة متنوعة من الأدوات للتعامل مع البيانات والإحصائيات، ومن السهل إنشاء الرسومات والتصاميم وغيرها. لذا، فبرنامج الأكسل أداة مناسبة للأشخاص الذين يريدون في رؤية أساسية لبياناتهم، وهو سهل الاستخدام.
هو نظام أساسي للتحليل الإحصائي تم تطويره في جامعة ولاية كارولينا الشمالية، عن طريق معهد ساس لإدارة البيانات والتحليلات المتقدمة، حيث يمكّن البرنامج مستخدميه من التنقيب على البيانات وإدارتها واستعادتها، ويكثر استخدام SAS في الأعمال التجارية والرعاية الصحية وأبحاث السلوك البشري.
يمكن أن يستخدم برنامج Graphpad Prism في مختلف المجالات، لكن يكثر الاعتماد عليه في مجال الأبحاث البيولوجية، حيث يستطيع إجراء حسابات إحصائية أكثر تعقيدًا.
وهو عبارة عن مجموعة من الأدوات الإحصائية والمتقدمة التي تستخدم في تحليل البيانات، ويمكنه تنفيذ المطلوب من خلال الأوامر النصية أو واجهة المستخدم الرسومية، بالتالي فهو مفيد للمبتدئين والخبراء على حد سواء.
يعتمد اختيار أيًا من هذه البرامج على:
- الخبرة التي يملكها المستخدم في الترميز.
- نوع البحث ومعرفة الإحصائيات.
ويتوقف نجاح البرنامج في إتاحة نتائج صحيحة يمكن تعميمها على المجتمع الأصلي على صحة البيانات الخاضعة للتحليل، فمهما كان البرنامج الإحصائي متقدم، بدون بيانات صحيحة لن تكون نتائجه مجدية مهما بلغت دقتها. يمكنك الاستعانة بمحلل إحصائي على منصة خمسات لخدمات التحليل إحصائي احترافية لشركتك.
هل نتائج التحليل الإحصائي صادقة دائمًا؟
على الرغم من أن الجميع يراهن على نتائج عملية التحليل الإحصائي إلا هناك عيوب لهذه العملية، لذا يجب أن يكون لدينا بعض الحظر من النتائج، فأحيانًا تكون الإحصائيات خاطئة تمامًا. لعل المثال الأشهر في ذلك مفارقة سيمبسون، التي توضح أن أفضل الإحصائيات يمكن أن تكون غير مفيدة، حيث أظهرت معدلات القبول بجامعة بيركلي أن متوسط قبول النساء كان أعلى من الرجال بينما كان العكس صحيح تمامًا في الواقع، ما يعني أن نتائج التحليل الإحصائي قد تكون مضللة في بعض الأحيان.
ما هو التحليل الإحصائي؟
التحليل الإحصائي statistical analysis هو علم جمع البيانات وتنظيمها واستكشافها وتفسيرها وتقديمها وكشف الأنماط والاتجاهات، ويتم التحليل الإحصائي بعدة طرق منها: معادلات الانحدار وتحليل النسبة وتحليل المسار وغيرها. والغرض الأساسي من هذه الطرق هو تحديد الارتباط بين متغيرين أو أكثر والتنبؤ بالأحداث، ومدى إمكانية تحقيقها مرة أخرى في أحداث مستقبلية.
يتعامل علم الإحصاء مع حجم هائل من البيانات، والتحليل الإحصائي هو تجميع وتصنيف وتحليل وتفسير هذه البيانات وعرضها في شكلها الرقمي من أجل اتخاذ القرارات المناسبة حيث تشمل أهداف التحليل الإحصائي ما يلي:
وإجمالًا فإن الهدف من التحليل الإحصائي هو تحديد الاتجاهات الخاصة بالبيانات الخاضعة للتحليل، لذلك من فوائد التحليل الإحصائي أنه يجعل البيانات أكثر فهو ليس هدفًا في حد ذاته إنما وسيلة علمية.
للتوضيح أكثر سنطرح مثالًا سريعًا للتحليل الإحصائي وهو عملية التعداد السكاني، بداية دعونا نتفق أن البيانات في شكلها الخام عديمة الفائدة ولا تساعدنا في فهم الواقع أو التخطيط للمستقبل، ففي التعداد السكاني على سبيل المثال عادةً ما نرغب في معرفة عدد السكان بشكلٍ عام، ثم عد الإناث والذكور والفئات العمرية وغيرها، وهو ما نطلق عليه المتغيرات الديموغرافية والحالة الاقتصادية والاجتماعية والتوزيع الجغرافي… إلخ. بالتالي فإن عدد السكان بشكل مُجمل غير مفيد، لكن حينما يكون لدينا تصنيف دقيق للفئات السابقة والعلاقة بين الزيادة السكانية وبعض المتغيرات وغير ذلك، نكون بصدد التحليل الإحصائي الذي يجعل البيانات أكثر قيمة.
استخدامات التحليل الإحصائي
نحن لا نبالغ حينما نقول أن علم الإحصاء يُستخدم في كل شيء في حياتنا، كوننا نعتمد عليه في البحث العلمي وفي الصناعة والتجارة والمؤسسات الحكومية، حيث يستخدم المصنعون التحليل الإحصائي لتحسين الجودة وزيادة الإنتاجية في مجالات متنوعة، بما في ذلك صناعة الطيران وتحسين جودة الأقمشة.
أولًا: البحث العلمي
يستخدم الباحثون في مختلف المجالات العلمية الإحصاء للوصول إلى النتائج والتحقق من الفرضيات المختلفة فعلى سبيل المثال: يستخدم الباحثون الإحصاء لتحليل البيانات المتعلقة بإنتاج اللقاحات الفيروسية بما يضمن الاتساق والسلامة، كما يعتمد على الإحصاء في العلوم الاجتماعية والبحوث التطبيقية بنسب متفاوتة، ما يؤكد أهمية التحليل الإحصائي لمجال البحث العلمي.
ثانيًا: المجال التجاري
وفي المجال التجاري وإدارة الأعمال يستخدم المسئولين بالشركات الإحصاء لتحسين فهم السوق واحتياجات العملاء فعلى سبيل المثال: تستخدم شركات الاتصالات الإحصائيات لتحسين خدماتها وموارد الشبكة، والوصول لفهم واضح لاحتياجات عملائها.
ثالثًا: المؤسسات الحكومية
تعتمد الحكومات المختلفة على الإحصائيات، سواء في عملية التعداد السكاني أو الاقتصاد والإجراءات الإدارية المتنوعة.
رابعًا: المجال التجاري
يمر سوق الأسهم بتقلبات كبيرة، لذا عادةً ما تستخدم الشركات الإحصائات لتقييم عدد من قراراتها التجارية بما في ذلك شراء الأسهم وبيعها، بالإضافة إلى اعتمادها على التحليل الإحصائي في عملية إدارة المخاطر التي قد تتعرض لها الشركة وتقييم مدى جسامة هذه المخاطر، وأخيرًا تستخدم الشركات معادلات الانحدار لاختبار الفرضيات العامة المتعلقة بتأثير عدد من العوامل على أصول الشركة وسعرها أسهمها في البورصة، كما تستخدم الإحصاء في مجالات أخرى ومنها:
1. أبحاث السوق
حيث يستخدم التحليل الإحصائي في أبحاث السوق فيقدم أرقام محددة حول العرض والطلب الخاص بالمنتجات، وتوزيع العملاء وتوجهاتهم المستقبلية وغيرها.
2. ذكاء الأعمال وتحليل البيانات
يستخدم التحليل الإحصائي في مجال ذكاء الأعمال، حيث يقدم مجموعة من التنبؤات التي تساهم في وضع الخطط المستقبلية.
3. تحسين محركات البحث
يعتمد تحسين محركات البحث على الإحصاء كمؤشر أساسي، حيث يقدم لنا عدد الكلمات المفتاحية التي يبحث عنها الجمهور عبر الإنترنت، ما يجعلنا نستهدفها.
4. التحليل المالي
لقد أدى التطور التكنولوجي إلى زيادة القدرة على الاحتفاظ بالبيانات المتنوعة واستعادتها وهو يزيد من أهمية الإحصاء، حيث أصبحت الحوسبة الإحصائية أكثر أهمية، بما في ذلك البرمجة الإحصائية والاقتصاد القياسي.
أهمية التحليل الإحصائي
لعل المثال السابق وضح لنا أهمية التحليل الإحصائي، فهو يساعد على تصنيف البيانات وتحليلها وتفسيرها، بالتالي فهو يُقدم لنا مؤشرات هامة تكون لبنة أساسية في عملية صنع القرار الخاص بالمؤسسات أو الحكومات، علاوةً على أهميته الخاصة في مجال البحث العلمي وفي مختلف المجالات الطبية والهندسية والتجارية والصناعات المختلفة، مثل الدواء أو الشركات البرمجية والتقنية وغيرها.
خطوات التحليل الإحصائي
ينقسم التحليل الإحصائي إلى خمس خطوات كالتالي:
فيما يلي تبسيط خطوات التحليل الإحصائي بطريقة أخرى:
يبدأ التحليل الإحصائي بجمع البيانات سواء من مصادرها الأولية أو الثانوية فعلى سبيل المثال: يمكننا جمع البيانات من خلال الاستطلاعات أو برامج إدارة علاقات العملاء والتقارير المالية والاختبارات على الإنترنت وغيرها، من خلال اختيار عينة مُمثلة للمجتمع الأصلي.
الآن لدينا بيانات خام ونريد تنظيمها أو كما يطلق عليها خبراء الإحصاء تنظيفها، بمعنى إزالة البيانات المكررة والتناقضات التي قد تمنعنا من الحصول على تحليل دقيق، وهذه الخطوة غاية في الأهمية لأنها تساعدنا في التحقق من صحة البيانات، بالتالي صحة الاستنتاجات التي نستخلصها من التحليل.
بعد تنظيم البيانات تأتي مرحلة عرض البيانات لنستطيع تحليلها بسهولة، في هذه الخطوة نستخدم أدوات التحليل الوصفي لعرض البيانات بشكل صحيح. سنتعرف لاحقًا إلى التحليل الإحصائي الوصفي وأدواته.
الخطوة الرابعة من خطوات التحليل الإحصائي هي تحليل البيانات، في هذه الخطوة نستخدم التقنيات الإحصائية للاستكشاف العلاقات والاتجاهات، وهنا نستخدم التحليل الإحصائي الاستنتاجي والترابطي.
الآن أجرينا التحليل واستخرجنا الارتباطات والاتجاهات المتنوعة بداخل البيانات الخاضعة للتحليل، وهنا تأتي مرحلة التفسير بعد تقديم النتائج في شكل مخططات وتقارير وغيرها.
أنواع التحليل الإحصائي
ينقسم التحليل الإحصائي لسبع أنواع وفقًا لنوع البيانات التي يتم تحليلها كالتالي:
1. التحليل الإحصائي الوصفي
عندما نُنظم البيانات ونُلخصها باستخدام الأرقام والرسوم البيانية، فنحن في هذه الحالة نستخدم الإحصاء الوصفي الذي يهدف بشكل أساسي لتسهيل البيانات الضخمة وجعلها قابلة للتفسير، فهو يمكّننا من تمثيل البيانات وتفسيرها بكفاءة من خلال الرسوم البيانية والجداول، حيث يتضمن مجموعة من العمليات بما في ذلك الجدولة وقياس الاتجاه المركزي (الوسط، الوسيط) ومقاييس التشتت والتباين (الانحراف المعياري، التباين، المدى) وتحليل السلاسل الزمنية.
بحيث نلخص البيانات ونعرضها في شكل جداول ومخططات ورسوم بيانية، ما يساهم في استخراج الخصائص المميزة للبيانات وشرح سماتها الأساسية، لكننا لا نقوم في هذا النوع باستخلاص رؤى بشأن المجموعات التي لم تتم ملاحظتها في بيانات العينة الخاضعة للتحليل. لذا يُعد التحليل الإحصائي الوصفي أبسط أنواع التحليل الإحصائي، فهو يساعد في تقليل البيانات الكبيرة وتقديمها في أشكال بسيطة تُسهل من عملية التفسير.
الإحصائيات المستخدمة في التحليل الوصفي:
لكن ثمة مجموعة من العيوب للإحصاء الوصفي أبرزها أنه لا يقدم أكثر من نتائج كمية للظاهرة، مثلًا حينما نقوم بوصف مجموعة كبيرة من البيانات باستخدام قيمة واحدة كالمتوسط، في هذه الحالة نكون بين خيارين إما تشويه البيانات الأصلية أو فقدان معلومات هامة، فعلى سبيل المثال يمكننا الإحصاء الوصفي في الأعمال التجارية من حساب متوسط الإيرادات، لكنه لا يقدم لنا تفاصيل أكثر حول المنتجات الأكثر مبيعًا أو المنافذ الأكثر توزيعًا وهكذا.
2. التحليل الإحصائي الاستنتاجي
يتيح التحليل الإحصائي الاستنتاجي اختبار فرضية معينة اعتمادًا على عينة من البيانات التي يمكن من خلالها استخلاص الاستنتاجات، من خلال تطبيق الاحتمالات والتعميمات حول البيانات بأكملها، بالإضافة إلى إمكانية التنبؤ بالنتائج المستقبلية التي تتجاوز البيانات المتاحة.
التحليل الإحصائي الاستنتاجي أو الاستدلالي يساهم في العثور على الفروق بين المجموعات المتنوعة داخل العينة، ويمكّننا من اختبار الفرضيات.
3. التحليل الإحصائي التنبؤي
حينما نريد التنبؤ بأحداث مستقبلية معينة بناء على مجموعة من الحقائق والأرقام سواء كانت حالية أو مستقبلية، فإننا نستخدم التحليل الإحصائي التنبؤي، من خلال استخدام التقنيات المستقبلية وخوارزميات التعلم الآلية لوصف إمكانية النتائج المستقبلية انطلاقًا من بيانات آنية أو من الماضي، وتعد نمذجة البيانات والذكاء الاصطناعي والتعلم الآلي أبرز التقنيات المستخدمة في هذا النوع من التحليل الإحصائي.
وعادةً ما تعتمد شركات التأمين والتسويق على التحليل الإحصائي التنبؤي، وذلك للتخطيط لمستقبل والتنبؤ بالنتائج المستقبلية مثل تضييق نطاق المخاطر المرتبطة بحدث مستقبلي أو تحقيق مكاسب الميزة التنافسية وغيرها، ويمكن للأعمال الأخرى الاستفادة من مميزات التحليل الإحصائي التنبؤي للتخطيط المستقبلي والتنبؤ، باختصار يستخدم هذا النوع من التحليل الإحصائي للاجابة على سؤال ماذا يمكن أن يحدث؟
4. التحليل الوصفي
نستخدم التحليل الوصفي حينما يكون لدينا كمية كبيرة من البيانات، ونرغب في معرفة ما هو أفضل إجراء يمكن أن يحدث، فهو يستخدم بكثرة في تحليل الأعمال لتحديد أفضل إجراء ممكن في موقف معين، فهو يركز بشكل أساسي على اكتشاف الاقتراح الأمثل في عملية صنع القرار.
ومن التقنيات الإحصائية المستخدمة في هذا النوع: المحاكاة والخوارزميات والرسم البياني والتعلم الآلي وغيرها. باختصار، يُستخدم التحليل الإحصائي الوصفي للإجابة عن سؤال ماذا حدث، فهو يقدم توصيفًا لواقع الظاهرة، بالتالي يساعدنا في اتخاذ القرارات بشأنها.
5. تحليل البيانات الاستكشافية
تعد تحليل البيانات الاستكشافية الخطوة الأولى في عملية تحليل البيانات، كونها تساعد في الحصول على الأفكار الرئيسية المتضمنة داخل البيانات، فهي تهدف إلى التعرف على العلاقات المحتملة، والحصول على البيانات المفقودة من البيانات الخاضعة للتحليل وفحص الفرضيات المختلفة.
6. التحليل السببي
يهتم التحليل السببي بتقديم إجابة واضحة على سؤال لماذا؟ فهو يساعدنا في فهم الأسباب الكامنة وراء الظاهرة ومعرفة الأشياء التي جعلت الظاهرة تبدو على هذا النحو، مثلًا يستخدم هذا النوع لمعرفة سبب فشل مشروع معين أو برنامج معين لتحصين الشركة من الانتكاسات المستقبلية، بالتالي فهو يستخدم في:
7. التحليل الآلي
يعد التحليل الآلي هو النوع الأقل شيوعًا بين أنواع التحليل الإحصائي الأخرى، وهو يُستخدم لفهم كيفية حدوث الأشياء عند تحليل بيانات ضخمة، حيث يهتم بدراسة تأثير متغيرات الظاهرة على بعضها، مع استبعاد المتغيرات الوسيطة أو الأحداث الخارجية التي يمكن أن تؤثر عليها، فهو يقدم شرح وافي لحدث سابق في سياق البيانات المقدمة.
مثال: إذا رغبنا في معرفة سبب فشل الشركات الناشئة خلال السنوات الأولى، وكان لدينا مجموعة من البيانات المتعلقة بالشركات الناشئة في مجال ما أو في بلد ما فإننا:
لا يوجد تضارب بين أنواع التحليل الإحصائي السابقة، وعادةً ما يستخدم نوع أو أكثر من التحليل الإحصائي عند القيام ببحث معين فعلى سبيل المثال: تستخدم أبحاث السوق التحليل الإحصائي الوصفي والاستنتاجي، وذلك لتحليل النتائج والتوصل لاستنتاجات.
طرق التحليل الإحصائي
هناك خمس طرق شائعة للتحليل الإحصائي كالتالي:
أولًا: المتوسط
يعدّ المتوسط أبسط أشكال التحليل الإحصائي وهو يهدف إلى تحديد النقطة المركزية لمجموعة البيانات، ويتم حسابه كالتالي:
المتوسط = مجموعة الأرقام ÷ عدد العناصر
مثال: إذا أردنا استخراج المتوسط من الأرقام التالية 1,2,3,4,5,6 فإننا سنقوم بجمع هذه الأرقام معًا، ثم نقوم بقسمته على عدد وهو 6 أرقام ليكون المتوسط هو 3.5
ويتميز المتوسط بكونه سهل الحساب ويساعد في تحديد الاتجاه العام للبيانات، أما عيوبه تظهر حينما تكون البيانات الخاضعة للتحليل تحتوي على عدد كبير من القيم المتطرفة أو التوزيع المنحرف لا يوفر المتوسط في هذه الحالة الدقة، التي نحتاجها لاتخاذ القرار.
ثانيًا: الانحراف المعياري
يقيس الانحراف المعياري كيفية انتشار البيانات حول المتوسط، وعندما يكون الانحراف المعياري عالي هذا يعني أن البيانات تتشتت على نطاق واسع عن المتوسط، بينما يكون الانحراف المعياري منخفض عندما تكون معظم البيانات أقرب إلى المتوسط. من عيوبه أنه مثل المتوسط تمامًا يمكن أن يعطينا بيانات غير دقيقة.
مثال للانحراف المعياري: عند القيام باستطلاع رأي أو استمارة استبيان تجاه خدمة معينة أو منتج، يمكنك تحليل النتائج الخاصة بإجابات المبحوثين، ومن ثم قياس مدى تشابه أو اختلاف الإجابات، فإذا كان التشابه كبير هذا يعني أن الانحراف المعياري منخفض والعكس صحيح.
ثالثًا: الانحدار
يستخدم الانحدار لإيجاد العلاقة التي تربط بين متغير مستقل وآخر تابع، حيث يساعد في تتبع كيفية تأثير المتغيرات على بعضها، ويوضح الانحدار مدى قوة أو ضعف العلاقة بين متغيرين وكيفية اختلافها من فترة لأخرى.
رابعًا: اختبار الفرضيات
نستخدم اختبار الفرضيات حينما نريد التأكد من أن استنتاج ما صالحًا لمجموعة بيانات محددة خلال مقارنة البيانات مع افتراض معين، من الممكن أن تكون هناك علاقة بين المتغيرات أو لا تكون على الإطلاق وهو ما يعرف بالفرضية الصفرية. مثال: يمكن أن نستخدم اختبار الفرضيات لمعرفة العلاقة بين نوع الغذاء والحالة الصحية أو بين التحصيل الدراسي والتقدم في العمر، ويمكن أن تكون الفرضية الصفرية لا توجد علاقة بين التقدم في العمر والتحصيل الدراسي وهكذا.
خامسًا: تحديد حجم العينة
عادةً ما يكون المجتمع الأصلي الذي نجري عليه البحث كبير جدًا وهو ما يشكل صعوبة في إجراء البحث على جميع مفرداته. لذا نلجأ إلى اختيار عينة ممثلة عن المجتمع الأصلي ثم نعمم النتائج عليه، وهذا ما نطلق عليه تحديد حجم العينة، ولكي يتم ذلك بشكل صحيح نحتاج لتحديد الحجم المناسب للعينة لتكون معبرة عن المجتمع الأصلي ودقيقة، ولتحقيق ذلك نقوم بأخذ عينات لأن العينات الصغيرة قد لا تكون معبرة، أما العينات الكبيرة قد تكون إهدار للوقت والجهد والمال، من هنا تنبع أهمية العينات في التحليل الإحصائي، فهي الفيصل في صدق وصحة النتائج من عدمه.
أدوات التحليل الإحصائي “برامج التحليل الإحصائي”
يلعب الحاسب الآلى دورًا كبير في تطور التحليل الإحصائي، حيث أتاحت برامج التحليل الإحصائي إمكانات هائلة للتعامل مع البيانات الضخمة وإجراء العمليات الحسابية المعقدة بسهولة ويسر ودقة وسرعة كبيرة، وعادةً ما يتعامل المحلل الإحصائي مع بيانات ضخمة، لذا يستعين المحللون ببرامج التحليل الإحصائي مثل IBM SPSS وRMP التي تساعدهم في إجراء التحليلات المعقدة من خلال الأدوات الإضافية التي توفرها تلك البرامج لتنظيم مجموعات البيانات وتفسيرها وعرضها. فيما يلي شرح موجز لإمكانات عدد من برامج التحليل الإحصائي:
يُعد برنامج IBM SPSS هو البرنامج الأكثر شهرة بين برامج التحليل الإحصائي لا سيما في الأوساط العلمية والأكاديمية، حيث يغطي البرنامج الكثير من العمليات التحليلية من إعداد البيانات وتحليلها وإعداد التقارير، علاوةً على واجهة البرنامج القابلة للتخصيص، ويستخدم برنامج SPSS بكثرة في مجال العلوم الاجتماعية.
وهو برنامج مجاني ويستخدم بكثرة في أبحاث السلوك البشري، ورغم أهمية البرنامج إلى أنه يتطلب درجة عالية من الخبرة، كونه يتطلب درجة معينة من الترميز، ما يعني أنه مناسب للخبراء لا المبتدئين.
يعد MATLAB منصة تحليلية ولغة برمجة في نفس الوقت، عادةً ما يستخدمها المهندسون والعلماء على نطاق واسع.
يقدم برنامج الإكسل مجموعة متنوعة من الأدوات للتعامل مع البيانات والإحصائيات، ومن السهل إنشاء الرسومات والتصاميم وغيرها. لذا، فبرنامج الأكسل أداة مناسبة للأشخاص الذين يريدون في رؤية أساسية لبياناتهم، وهو سهل الاستخدام.
هو نظام أساسي للتحليل الإحصائي تم تطويره في جامعة ولاية كارولينا الشمالية، عن طريق معهد ساس لإدارة البيانات والتحليلات المتقدمة، حيث يمكّن البرنامج مستخدميه من التنقيب على البيانات وإدارتها واستعادتها، ويكثر استخدام SAS في الأعمال التجارية والرعاية الصحية وأبحاث السلوك البشري.
يمكن أن يستخدم برنامج Graphpad Prism في مختلف المجالات، لكن يكثر الاعتماد عليه في مجال الأبحاث البيولوجية، حيث يستطيع إجراء حسابات إحصائية أكثر تعقيدًا.
وهو عبارة عن مجموعة من الأدوات الإحصائية والمتقدمة التي تستخدم في تحليل البيانات، ويمكنه تنفيذ المطلوب من خلال الأوامر النصية أو واجهة المستخدم الرسومية، بالتالي فهو مفيد للمبتدئين والخبراء على حد سواء.
يعتمد اختيار أيًا من هذه البرامج على:
ويتوقف نجاح البرنامج في إتاحة نتائج صحيحة يمكن تعميمها على المجتمع الأصلي على صحة البيانات الخاضعة للتحليل، فمهما كان البرنامج الإحصائي متقدم، بدون بيانات صحيحة لن تكون نتائجه مجدية مهما بلغت دقتها. يمكنك الاستعانة بمحلل إحصائي على منصة خمسات لخدمات التحليل إحصائي احترافية لشركتك.
هل نتائج التحليل الإحصائي صادقة دائمًا؟
على الرغم من أن الجميع يراهن على نتائج عملية التحليل الإحصائي إلا هناك عيوب لهذه العملية، لذا يجب أن يكون لدينا بعض الحظر من النتائج، فأحيانًا تكون الإحصائيات خاطئة تمامًا. لعل المثال الأشهر في ذلك مفارقة سيمبسون، التي توضح أن أفضل الإحصائيات يمكن أن تكون غير مفيدة، حيث أظهرت معدلات القبول بجامعة بيركلي أن متوسط قبول النساء كان أعلى من الرجال بينما كان العكس صحيح تمامًا في الواقع، ما يعني أن نتائج التحليل الإحصائي قد تكون مضللة في بعض الأحيان.
ذات صلة:
No related posts.
admin