مقدمة إلى علم البيانات

contents

  • what is data
  • what is the importance of data
  • the evolution of terminology in data science

ما هي البيانات

البيانات هي قطع متميزة من المعلومات، عادةً ما تكون مُنسقة بطريقة خاصة. يمكن قياس البيانات وجمعها وتقريرها وتحليلها، وغالبًا ما يتم تصورها باستخدام الرسوم البيانية أو الصور أو أدوات التحليل الأخرى. البيانات الخام (“البيانات غير المعالجة”) قد تكون مجموعة من الأرقام أو الأحرف قبل أن يتم “تنظيفها” وتصحيحها بواسطة الباحثين. يجب تصحيحها حتى نتمكن من إزالة القيم الشاذة أو الأخطاء الناتجة عن الأجهزة أو إدخال البيانات. عادةً ما تحدث معالجة البيانات على مراحل، وبالتالي يمكن اعتبار “البيانات المعالجة” من مرحلة ما أيضًا “البيانات الخام” للمرحلة التالية. البيانات التجريبية هي البيانات التي يتم توليدها ضمن مراقبة التحقيقات العلمية. يمكن أن تُنتج البيانات بواسطة البشر أو  الآلات أو كليهما معا.

ما أهمية البيانات

في عصرنا الحالي، يعتبر الحفاظ على نشاط تجاري ناجح أمرًا مرتبطًا بشكل وثيق بالتعامل مع البيانات. سواء كنت تدرك ذلك أم لا، لا يمكن إنكار أن البيانات تشكل أساس أي شركة ناجحة، ورواد الأعمال الذين يقودون السوق يدركون أن التعمق في البيانات هو ما سيميزهم عن المنافسين.

تطور المصطلحات في علم البيانات

بسبب التطور المستمر في مجال علم البيانات، أثر ذلك على معاني المصطلحات الشائعة. وهذا يجعل الأمور أكثر تعقيدًا. على سبيل المثال:
شخص كان يحمل لقب إحصائي قبل 25 عامًا، كان مسؤولًا عن جمع وتنظيف مجموعات البيانات وتطبيق الأساليب الإحصائية عليها. لكن مع مرور الوقت، ونتيجة لنمو البيانات والتطور الهائل في التكنولوجيا، أصبح هذا الإحصائي مطالبًا بإيجاد الأنماط داخل البيانات. وهكذا ظهر مصطلح جديد، وهو تنقيب البيانات . بعد بضع سنوات أخرى، وبفضل النماذج الرياضية والإحصائية المتقدمة، أصبح هذا الإحصائي قادرًا على تقديم تنبؤات أكثر دقة. وهنا نضيف مصطلح جديد إلى القاموس التجاري المتضخم، وهو التحليلات التنبؤية. هل تغيرت وظيفة الإحصائي في هذه المرحلة؟ لا لم تتغير. وهل أهدافه أصبحت مختلفة؟ ليس حقًا. لكن الآن أصبح أكثر تأهيلًا ليكون جزءًا من قسم الإحصاء، أو فريق التحليلات التنبؤية، أو حتى ليحمل لقب عالم بيانات .