محتوى البرنامج
مقدمة في علوم البيانات
تعرف في هذه الوحدة على مفهوم علوم البيانات وأهميتها. ستتعلم ما هي علوم البيانات، المجالات الرئيسية لها مثل التحليل الإحصائي والتعلم الآلي، وكيفية تطبيق علوم البيانات في مختلف الصناعات. كما سنتعرف على خطوات عملية علوم البيانات من جمع البيانات إلى تقديم النتائج.
0/5
فهم البيانات
في هذه الوحدة، ستتعلم أنواع البيانات المختلفة مثل البيانات الكمية والنوعية والبيانات المنظمة وغير المنظمة. سنتعرف على كيفية جمع البيانات من مصادر متعددة مثل الاستطلاعات وAPIs، وكيفية تحليل البيانات الأولية لفهم طبيعتها واستخدامها في تحليل دقيق.
0/4
تنظيف وتحضير البيانات
تركز هذه الوحدة على أهمية تنظيف البيانات وتحضيرها قبل البدء في التحليل. ستتعرف على كيفية التعامل مع القيم المفقودة والتكرارات والقيم الشاذة. ستتعلم أيضًا أدوات وتقنيات لتنظيف البيانات باستخدام Google Sheets وExcel.
0/4
التحليل الاستكشافي للبيانات
ستتعرف في هذه الوحدة على مفهوم التحليل الاستكشافي للبيانات (EDA) واستخدامه لاكتشاف الأنماط والاتجاهات في البيانات. سنتعلم كيفية استخدام التقنيات الإحصائية مثل المتوسط والانحراف المعياري والمخططات البيانية لفهم أفضل للبيانات.
0/3
التحليل الإحصائي الأساسي
تتناول هذه الوحدة أساسيات التحليل الإحصائي لعلوم البيانات، مثل المتوسط الحسابي والوسيط والانحراف المعياري. ستتعلم كيفية تطبيق هذه المفاهيم باستخدام أدوات بسيطة مثل Google Sheets وExcel لتحليل البيانات وإيجاد النتائج المفيدة.
0/5
مقدمة لأدوات البيانات
تركز هذه الوحدة على الأدوات الأساسية التي يستخدمها علماء البيانات لتحليل البيانات. سنتعلم كيفية استخدام Excel وGoogle Sheets لأداء العمليات الحسابية والإحصائية الأساسية، بالإضافة إلى مقدمة لاستخدام أدوات تصور البيانات مثل Tableau.
0/2
تطبيقات علوم البيانات في العالم الحقيقي
تستعرض هذه الوحدة تطبيقات علوم البيانات في مختلف المجالات مثل الطب، والمالية، والتسويق. سنتعرف على كيفية استخدام التحليل البياني في تحسين القرارات والعروض التجارية .
0/2
علوم البيانات 101: مقدمة في تحليل البيانات للمبتدئين
عن الرحلة

مقدمة في الإحصاء

الإحصاء هو علم يهتم بتجميع، تحليل، تفسير، وعرض البيانات بهدف استخلاص معلومات مفيدة واتخاذ القرارات بناءً عليها. يستخدم الإحصاء في مختلف المجالات مثل الاقتصاد، الطب، الهندسة، والعلوم الاجتماعية لفهم الظواهر واتجاهاتها.

من أهم المفاهيم الأساسية في الإحصاء هي مقاييس النزعة المركزية، والتي تساعد في وصف البيانات بطريقة مختصرة. وتشمل هذه المقاييس:


 مقاييس الإحصاء الأساسية

المتوسط الحسابي (Mean)

التعريف:
المتوسط الحسابي هو مقياس لمركز البيانات ويحسب بجمع جميع القيم ثم قسمتها على عددها..

الاستخدامات:

  • تقدير القيمة المتوقعة لمجموعة من البيانات.
  • قياس متوسط درجات الطلاب في اختبار معين.
  • حساب متوسط الأرباح الشهرية لشركة.

ملاحظات:

  • حساس للقيم المتطرفة، فإذا كانت هناك قيمة كبيرة جدًا أو صغيرة جدًا، فقد تؤثر بشكل كبير على المتوسط.
  • يُستخدم عندما تكون البيانات موزعة بشكل متقارب بدون قيم شاذة كبيرة.

الوسيط (Median)

التعريف:
الوسيط هو القيمة التي تقع في منتصف البيانات المرتبة. إذا كان عدد القيم فرديًا، فهو القيمة التي تتوسط القائمة. وإذا كان العدد زوجيًا، فهو متوسط القيمتين في المنتصف.

طريقة الحساب:

  1. رتب القيم تصاعديًا (من الأصغر إلى الأكبر).
  2. حدد موقع الوسيط:
    • إذا كان عدد القيم فرديًا: الوسيط هو القيمة في المنتصف.
    • إذا كان عدد القيم زوجيًا: نحسب متوسط القيمتين في المنتصف.

الاستخدامات:

  • يستخدم في الحالات التي تحتوي على قيم متطرفة، مثل قياس متوسط الرواتب في شركة حيث قد تكون بعض الرواتب مرتفعة جدًا مقارنة بالبقية.
  • يُفضَّل في تحليل الدخل، العقارات، والبيانات المالية حيث يكون التوزيع غير متماثل.

ملاحظات:

  • لا يتأثر بالقيم المتطرفة، مما يجعله أكثر تمثيلًا للبيانات غير المتجانسة.
  • يُستخدم عند التعامل مع بيانات تحتوي على تفاوت كبير بين القيم.

الوضع (Mode)

التعريف:
الوضع هو القيمة الأكثر تكرارًا في مجموعة البيانات. يمكن أن يكون هناك أكثر من وضع واحد إذا كانت هناك عدة قيم متكررة بنفس العدد.

أنواع الوضع:

  1. وحيد النمط (Unimodal): إذا كانت هناك قيمة واحدة فقط متكررة أكثر من غيرها.
  2. ثنائي النمط (Bimodal): إذا كانت هناك قيمتان متكررتان بنفس التكرار.
  3. متعدد الأنماط (Multimodal): إذا كانت هناك أكثر من قيمتين متكررتين بنفس العدد.

الاستخدامات:

  • تحليل المنتجات الأكثر مبيعًا في سوق معين.
  • معرفة أكثر درجات الطلاب تكرارًا في اختبار معين.
  • تحديد الفئة العمرية الأكثر انتشارًا في دراسة إحصائية.

ملاحظات:

  • يمكن أن يكون هناك أكثر من وضع أو لا يوجد وضع إذا لم تتكرر أي قيمة.
  • يُستخدم في البيانات الفئوية، مثل معرفة الفئة اللونية الأكثر شيوعًا في منتج معين.

مقارنة بين المتوسط الحسابي، الوسيط، والوضع

المقياس التعريف الاستخدام الرئيسي التأثر بالقيم المتطرفة
المتوسط الحسابي مجموع القيم مقسوم على عددها تحليل البيانات ذات التوزيع المتقارب نعم، يتأثر بالقيم المتطرفة
الوسيط القيمة الوسطى عند ترتيب البيانات تحليل البيانات ذات القيم المتطرفة لا يتأثر بالقيم المتطرفة
الوضع القيمة الأكثر تكرارًا تحديد أكثر القيم شيوعًا لا يتأثر بالقيم المتطرفة

خلاصة

  • المتوسط الحسابي مفيد عند تحليل البيانات المتجانسة، لكنه يتأثر بالقيم المتطرفة.
  • الوسيط أكثر ملاءمة عندما تحتوي البيانات على قيم شاذة، مثل الدخل والأسعار.
  • الوضع يُستخدم عند البحث عن القيمة الأكثر تكرارًا، خاصة في البيانات الفئوية.

اختيار المقياس المناسب يعتمد على طبيعة البيانات والغرض من التحليل.

انضم إلى المحادثة