عن الرحلة
-
جمع البيانات:
- المصادر: يتم جمع البيانات من عدة مصادر مثل:
- قواعد البيانات: مثل MySQL، MongoDB، وغيرها.
- APIs: APIs تسمح لك بالوصول إلى بيانات من تطبيقات أو خدمات خارجية.
- ويب Scraping: جمع البيانات مباشرة من صفحات الويب باستخدام أدوات مثل BeautifulSoup أو Scrapy.
- استطلاعات البيانات: جمع البيانات من استبيانات أو استطلاعات عبر الإنترنت.
- المصادر: يتم جمع البيانات من عدة مصادر مثل:
-
تحضير البيانات:
- تنظيف البيانات: يتضمن إزالة القيم المفقودة، تصحيح الأخطاء، استبدال القيم غير المتوقعة، وتوحيد تنسيق البيانات.
- التعامل مع القيم المفقودة: يمكن التعامل مع القيم المفقودة من خلال:
- استبدال القيم المفقودة بمتوسط أو قيمة متوقعة.
- حذف الصفوف أو الأعمدة التي تحتوي على قيم مفقودة إذا كانت غير هامة.
- تحويل البيانات: مثل تحويل التواريخ أو النصوص إلى أنواع بيانات يمكن معالجتها.
-
تحليل البيانات:
- التحليل الوصفي: يشمل تلخيص البيانات باستخدام مقاييس مثل المتوسط الحسابي، الوسيط، والانحراف المعياري.
- التحليل الاستكشافي للبيانات (EDA): هو عملية فحص البيانات للحصول على نظرة أولية حول الأنماط أو العلاقات بين المتغيرات.
-
التصور البياني للبيانات:
- الرسوم البيانية: استخدام الرسوم البيانية مثل الرسوم البيانية الخطية، المخططات الشريطية، والصندوق لتصور البيانات بطريقة مرئية.
- المكتبات المستخدمة: في Python، يمكن استخدام مكتبات مثل
Matplotlib
وSeaborn
لإنشاء هذه التصورات.
انضم إلى المحادثة