حساب IBM الخاص بي تسجيل الدخول اشترك

ما المقصود بالبيانات؟

1 أكتوبر 2024

 

 

المؤلفين

Matthew Kosinski

Enterprise Technology Writer

ما المقصود بالبيانات؟

البيانات هي مجموعة من الحقائق أو الأرقام أو الكلمات أو الملاحظات أو غيرها من المعلومات المفيدة. من خلال معالجة البيانات وتحليلها، تُحوّل المؤسسات نقاط البيانات غير المنسقة إلى معارف قيمة من شأنها تحسين عملية اتخاذ القرارات وتحقيق نتائج أعمال أفضل.

تُجمّع المؤسسات البيانات من مصادر مختلفة وبأشكال مختلفة، بما في ذلك البيانات النوعية غير الرقمية (مثل آراء العملاء) والبيانات الكمية الرقمية (مثل أرقام المبيعات). ومن أمثلة البيانات أيضًا البيانات العامة، مثل الإحصاءات الحكومية وسجلات التعداد السكاني، والبيانات الخاصة، مثل سجلات مشتريات العملاء أو سجلات الرعاية الصحية.

على مدى العقد الماضي، كانت البيانات الضخمة - مجموعات البيانات الكبيرة والمعقدة المستمدة من مصادر مثل وسائل التواصل الاجتماعي والتجارة الإلكترونية والمعاملات المالية - هي وقود عملية التحول الرقمي عبر المجالات. ففي الواقع، أُطلق على البيانات الضخمة لقب "الزيت الجديد" نظرًا إلى قيمتها كمحرك لنمو الأعمال والابتكار.

في السنوات الأخيرة، أدى ظهور الذكاء الاصطناعي (AI) إلى زيادة الاهتمام بالبيانات. حيث تحتاج المؤسسات إلى البيانات لتدريب نماذج التعلم الآلي (ML) وتحسين الخوارزميات التنبئية. وكلما ازدادت البيانات فائقة الجودة التي تحللها أنظمة الذكاء الاصطناعي هذه، أصبحت أكثر دقة وفعالية.

في ظل تزايد حجم البيانات ومدى تعقيدها وأهميتها، تحتاج المؤسسات إلى وجود عمليات فعالة لإدارة البيانات من أجل الحفاظ على المعلومات منظمة ومتاحة لإجراء تحليلات البيانات.

وفي الوقت نفسه، أدت المخاوف المتزايدة بشأن أمن البيانات والخصوصية - من كل من المستخدمين والمنظمين – إلى زيادة التركيز على حماية البيانات والامتثال لقوانين مثل اللائحة العامة لحماية البيانات (GDPR) وقانون خصوصية المستهلك في كاليفورنيا (CCPA).

أنواع البيانات

للبيانات أشكال مختلفة، ولكل منها خصائص ومصادر وتنسيقات فريدة. يمكن أن تسهم معرفة أوجه الاختلاف هذه في تنظيم البيانات وتحليلها بشكل أكثر فعالية، حيث إن لكل نوع من أنواع البيانات حالات استخدام مختلفة.

علاوة على ذلك، يمكن أن تندرج نقطة بيانات واحدة أو مجموعة بيانات واحدة ضمن فئات متعددة. على سبيل المثال، البيانات المنظمة والكمية وغير المنظمة والنوعية وما إلى ذلك.

ومن أنواع البيانات الأكثر شيوعًا ما يلي:

  • البيانات الكمية
  • البيانات النوعية

  • البيانات المنظمة

  • البيانات غير المنظمة

  • البيانات شبه المنظمة

  • البيانات الوصفية

  • البيانات الكبيرة

البيانات الكمية

تتكون البيانات الكمية من قيم يمكن قياسها رقميًا. تتضمن أمثلة البيانات الكمية نقاط البيانات المنفصلة (مثل عدد المنتجات المبيعة) أو نقاط البيانات المتصلة (مثل درجات الحرارة أو أرقام الإيرادات).

غالبًا ما تكون البيانات الكمية منظمة، ما يسهل تحليلها باستخدام الأدوات والخوارزميات الرياضية.

تشمل حالات الاستخدام الشائعة للبيانات الكمية توقع الاتجاهات وإجراء التحليلات الإحصائية ووضع الميزانيات وتحديد الأنماط وتقييم الأداء.

البيانات النوعية

البيانات النوعية هي بيانات وصفية وغير رقمية، حيث ترصد الخصائص أو المفاهيم أو التجارب التي لا يمكن قياسها بالأرقام. ومن أمثلة البيانات النوعية آراء العملاء وتقييمات المنتجات والتعليقات على وسائل التواصل الاجتماعي.

يمكن أن تكون البيانات النوعية منظمة (مثل ردود الاستطلاعات المشفرة) أو غير منظمة (مثل ردود الكتابات الحرة أو سجلات المقابلات).

تشمل حالات الاستخدام الشائعة للبيانات النوعية معرفة سلوك العملاء واتجاهات السوق وتجارب المستخدمين.

البيانات المنظمة

البيانات المنظمة تكون منظمة بتنسيق واضح ومحدد، وغالبًا ما تُخزن في قواعد بيانات علائقية أو جداول بيانات. ويمكن أن تتألف من بيانات كمية (مثل أرقام المبيعات) وبيانات نوعية (مثل تسميات الفئات مثل "نعم أم لا").

ومن أمثلة البيانات المنظمة سجلات العملاء والتقارير المالية، حيث تُوضع البيانات بدقة في الصفوف والأعمدة في أماكن محددة مسبقًا.

تساعد الطبيعة فائقة التنظيم للبيانات المنظمة على تسريع الاستعلامات وعمليات تحليل البيانات، ما يجعلها مفيدة لأنظمة ذكاء الأعمال وعمليات إعداد التقارير.

البيانات غير المنظمة

تفتقر البيانات غير المنظمة إلى التنسيق المحدد بعناية. وغالبًا ما تظهر في أشكال معقدة مثل المستندات النصية والصور ومقاطع الفيديو. يمكن أن تتضمن البيانات غير المنظمة كلاً من المعلومات النوعية (مثل تعليقات العملاء) والعناصر الكمية (مثل القيم العددية المضمنة في النصوص).

ومن أمثلة البيانات غير المنظمة رسائل البريد الإلكتروني ومحتوى وسائل التواصل الاجتماعي وملفات الوسائط المتعددة.

ليس من السهل وضع البيانات غير المنظمة في قواعد البيانات العلائقية التقليدية، وغالبًا ما تستخدم المؤسسات تقنيات مثل معالجة اللغة الطبيعية (NLP) والتعلم الآلي لتبسيط عمليات تحليل البيانات غير المنظمة.

غالبًا ما تؤدي البيانات غير منظمة دورًا رئيسيًا في تحليل المشاعر، والتعرف على الأنماط المعقدة وغير ذلك من مشاريع التحليلات المتقدمة.

البيانات شبه المنظمة

تتكون البيانات شبه المنظمة من مزيج من عناصر البيانات المنظمة والبيانات غير المنظمة. ولا تتبع تنسيقًا محددًا، لكن يمكن أن تتضمن وسومًا أو علامات تُسهل عملية تنظيمها وتحليلها. ومن أمثلة البيانات شبه المنظمة ملفات XML وكائنات JSON.

تُستخدم البيانات شبه المنظمة على نطاق واسع في سيناريوهات مثل مشاريع تجريف الويب (استخراج البيانات من الويب) وتكامل البيانات نظرًا إلى أنها توفر المرونة مع الاحتفاظ ببعض التنظيم من أجل إجراء عمليات البحث والتحليل.

البيانات الوصفية

البيانات الوصفية هي بيانات عن البيانات. بعبارة أخرى، هي معلومات حول سمات نقاط البيانات أو مجموعات البيانات، مثل أسماء الملفات أو أسماء المؤلفين أو تواريخ الإنشاء أو أنواع البيانات.

تعمل البيانات الوصفية على تعزيز عمليات تنظيم البيانات وتسهيل البحث عنها وإدارتها. وهي مهمة للأنظمة مثل قواعد البيانات والمكتبات الرقمية ومنصات إدارة المحتوى لأنها تساعد المستخدمين على فرز البيانات التي يحتاجون إليها والعثور عليها بسهولة أكبر.

البيانات الكبيرة

تشير البيانات الضخمة إلى مجموعات بيانات كبيرة ومعقدة لا تستطيع النظم التقليدية معالجتها. وتشمل كلاً من البيانات المنظمة والبيانات غير المنظمة المستمدة من مصادر مثل أجهزة الاستشعار ووسائل التواصل الاجتماعي والمعاملات.

تساعد تحليلات البيانات الضخمة المؤسسات على معالجة مجموعات البيانات الكبيرة هذه وتحليلها لاستخراج معارف قيمة بشكل ممنهج. وغالبًا ما تتطلب وجود أدوات متطورة مثل التعلم الآلي.

تشمل حالات الاستخدام الشائعة للبيانات الضخمة تحليل سلوك العملاء والكشف عن حوادث الاحتيال وإجراء الصيانة التنبئية.

أهمية البيانات

تُمكّن البيانات المؤسسات من تحويل المعلومات غير المنسقة إلى معارف عملية تساعد على التنبؤ بسلوك العملاء وتحسين سلاسل التوريد وتعزيز الابتكار.

يأتي مصطلح "Data (البيانات)" من صيغة الجمع "Datum (المعطيات)"، وهي كلمة لاتينية تعني "شيء معطى": وهو تعريف لا يزال يعكس المعنى حتى يومنا هذا. في كل يوم، يقدم ملايين الأشخاص البيانات للشركات من خلال التفاعلات مثل مرات الظهور أو النقرات أو المعاملات أو قراءات أجهزة الاستشعار أو حتى مجرد التصفح عبر الإنترنت. 

ومن ثَم يمكن للمؤسسات في مختلف المجالات الاستفادة من هذا التدفق المستمر للمعلومات في تعزيز النمو والابتكار.على سبيل المثال، تستخدم متاجر التجزئة الإلكترونية مجموعات بيانات ضخمة وتحليلات البيانات للتنبؤ بمعدل الطلب، ما يساعد على ضمان توفير المنتجات المناسبة في الوقت المناسب.

وبالمثل، تستخدم منصات البث القائمة على البيانات خوارزميات التعلم الآلي ليس فقط للتوصية بالمحتوى ولكن أيضًا لتحسينه، وتحليل المشاهد التي تلقى صدى أكبر لدى المشاهدين للمساعدة على اتخاذ قرارات الإنتاج المستقبلية.

كما تزداد أهمية البيانات في عصر الذكاء الاصطناعي (AI)، حيث تُعد مجموعات البيانات الكبيرة فائقة الجودة ضرورية لتدريب نماذج التعلم الآلي (راجع "دور البيانات في مجال الذكاء الاصطناعي (AI)" لمعرفة المزيد من المعلومات).

بالإضافة إلى ذلك، تُعد إمكانات الذكاء الاصطناعي التي من شأنها معالجة البيانات في الوقت الفعلي أمرًا بالغ الأهمية في مجالات مثل الأمن الإلكتروني، حيث تساعد عمليات تحليل البيانات السريعة التهديدات قبل تفاقمها، ومثل التداول المالي، حيث تؤثر القرارات السريعة في الأرباح، ومثل الحوسبة الطرفية، حيث تؤدي معالجة البيانات الأقرب إلى مصدرها إلى اكتساب معارف أسرع واتخاذ قرارات أسرع وتحسين عرض النطاق الترددي.

امرأة سوداء تعمل على كمبيوتر محمول

كن مطلعًا على آخر أخبار التكنولوجيا

تعرض Think Newsletter رؤى أسبوعية وأبحاثًا وآراء من الخبراء حول الذكاء الاصطناعي والأمان والسحابة وغير ذلك المزيد.

كيف تُستخدم البيانات؟

تستخدم المؤسسات في مختلف المجالات البيانات لأغراض مختلفة، بما في ذلك تحسين عملية اتخاذ القرارات وتبسيط العمليات وتعزيز الابتكار.

تتضمن الطرق الشائعة التي تستخدم بها المؤسسات البيانات في العمليات ما يلي:

  • التحليلات التنبئية

  • الذكاء الاصطناعي التوليدي

  • الابتكارات في مجال الرعاية الصحية

  • أبحاث العلوم الاجتماعية

  • الأمن الإلكتروني وإدارة المخاطر

  • الكفاءة التشغيلية

  • تجربة العملاء

  • المبادرات الحكومة

  • ذكاء الأعمال (BI)

التحليلات التنبئية

التحليلات التنبئية هي فرع من التحليلات المتقدمة التي تتنبأ بالاتجاهات والنتائج المستقبلية باستخدام البيانات القديمة جنبًا إلى جنب مع النمذجة الإحصائية واستخراج البيانات والتعلم الآلي.

كثيرًا ما تستخدم شركات التجارة الإلكترونية التحليلات التنبئية لتوقع سلوكيات الشراء لدى العملاء بناءً على المعاملات السابقة. في مجال التصنيع والنقل، تتيح التحليلات التنبئية إمكانية إجراء الصيانة التنبئية من خلال تحليل بيانات الآلات في الوقت الفعلي للتنبؤ بالوقت المحتمل لتعطل المعدات والتوصية بالصيانة الاستباقية.

الذكاء الاصطناعي التوليدي

الذكاء الاصطناعي التوليدي، والذي يطلق عليه أحيانًا gen AI، هو الذكاء الاصطناعي الذي يمكنه إنشاء محتوى أصلي —مثل النصوص، أو الصور، أو مقاطع الفيديو، أو المقاطع الصوتية، أو التعليمات البرمجية— استجابةً لتعليمات المستخدمين.

يعتمد الذكاء الاصطناعي التوليدي على نماذج التعلم الآلي المتطورة والتي تسمى نماذج التعلم العميق. تتدرب هذه النماذج على مجموعات بيانات ضخمة، ما يسمح لها بأداء المهام مثل فهم طلبات المستخدمين وإنشاء محتوى تسويقي مخصص وكتابة التعليمات البرمجية.

الابتكارات في مجال الرعاية الصحية

يمكن أن تساعد تحليلات البيانات مقدمي خدمات الرعاية الصحية على تحسين جودة الرعاية المقدمة للمرضى والتنبؤ بتفشي الأمراض وتحسين بروتوكولات العلاج.

على سبيل المثال، توفر مراقبة المرضى من خلال بيانات السلاسل الزمنية، مثل تتبع المؤشرات الحياتية للمرضى على مدار الوقت، معارف في الوقت الفعلي بشأن حالات المرضى. وهذا بدوره يساعد على تسريع التدخلات وتقديم علاجات أكثر تخصيصًا.

أبحاث العلوم الاجتماعية

كثيرًا ما يحلل باحثو العلوم الاجتماعية البيانات الكمية والنوعية المستمدة من الاستطلاعات وتقارير التعداد السكاني ووسائل التواصل الاجتماعي. ويساعدهم فحص مجموعات البيانات هذه على دراسة السلوكيات والاتجاهات وتأثيرات السياسات.

على سبيل المثال، يمكن للباحثين استخدام بيانات التعداد السكاني لتتبع التغيرات السكانية وردود الاستطلاعات لمعرفة الرأي العام، واستخدام بيانات وسائل التواصل الاجتماعي من أجل تحليل الاتجاهات الناشئة.

الأمن الإلكتروني وإدارة المخاطر

مع تزايد وتيرة الهجمات الإلكترونية وحوادث اختراق أمن البيانات، تلجأ المؤسسات شيئًا فشيئًا إلى تحليل البيانات لتحديد التهديدات والاستجابة لها بشكل أسرع، ما يقلل من الأضرار ويقلل من فترات التعطل.

على سبيل المثال، يمكن أن تساعد أنظمة إدارة المعلومات الأمنية والأحداث (SIEM) على الكشف عن الحالات الشاذة والاستجابة له في الوقت الفعلي من خلال تجميع التنبيهات الأمنية من جميع أنحاء الشبكة وتحليلها.

الكفاءة التشغيلية

يمكن أن تساعد خوارزميات التعلم الآلي، المدربة على مجموعات البيانات الضخمة، المؤسسات على تعزيز الكفاءة التشغيلية من خلال تحسين الخدمات اللوجستية والتنبؤ بمعدل الطلب وتحسين الجدولة وأتمتة مهام سير العمل.

على سبيل المثال، تجمع شركات التجارة الإلكترونية في كثير من الأحيان بيانات المبيعات في الوقت الفعلي وتُحللها من أجل توجيه عملية إدارة المخزون، ما يقلل من احتمالية نفاد المخزون أو تكدسه.

تجربة العملاء

تُمثل البيانات العمود الفقري لتجارب العملاء المخصصة، لا سيما في مجال التسويق، حيث يمكن للمؤسسات استخدام تحليلات البيانات من أجل تخصيص المحتوى والإعلانات لمختلف المستخدمين.

على سبيل المثال، تعتمد خدمات البث على خوارزميات التعلم الآلي من أجل تحليل عادات المشاهدة والتوصية بالمحتوى.

المبادرات الحكومة

كثيرًا ما تستخدم الحكومات في جميع أنحاء العالم سياسات البيانات المفتوحة لجعل مجموعات البيانات القيمة متاحة للجمهور، ما يشجع الشركات والمؤسسات على استخدام هذه الموارد في البحث والابتكار.

على سبيل المثال، موقع Data.gov التابع للحكومة الأمريكيةوهي منصة تتيح إمكانية الوصول إلى مجموعات البيانات المختلفة عبر مجالات الرعاية الصحية والتعليم والنقل. وتساعد إمكانية الوصول هذه على تعزيز الشفافية وتسمح للشركات عبر المجالات بتطوير حلول قائمة على البيانات استنادًا إلى المعلومات المتاحة للجمهور.

ذكاء الأعمال (BI)

ذكاء الأعمال (BI) هو مجموعة من العمليات التقنية التي تعمل على جمع البيانات وإدارتها وتحليلها، وتحويل البيانات غير المنسقة إلى معارف يمكن أن توجه قرارات الأعمال.

وتُكمل تحليلات الأعمال ذكاء الأعمال من خلال مساعدة المؤسسات على تفسير البيانات وتصورها من خلال الرسوم البيانية ولوحات المعلومات والتقارير، ما يُسهل اكتشاف الاتجاهات واتخاذ القرارات المستنيرة.

جمع البيانات  

جمع البيانات هي عملية منظمة لجمع البيانات من مصادر مختلفة مع المساعدة على ضمان جودتها وسلامتها. ويُنفذ هذه العملية عادةً علماء البيانات والمحللون، وهي تمثل الأساس لتحليل البيانات بدقة وموثوقية.

تبدأ عملية جمع البيانات بتحديد أهداف واضحة وتحديد المصادر ذات الصلة. ثم تُجمع البيانات وتُنظم وتُدمج في مجموعة بيانات موحدة. تساعد أنظمة تخزين البيانات وفحوصات الجودة المستمرة على ضمان دقة البيانات المجمعة وموثوقيتها.

فمن دون جمع البيانات بشكل صحيح، تخاطر المؤسسات ببناء تحليلاتها على بيانات ناقصة أو غير دقيقة أو مضللة، ما يؤدي إلى اكتساب معارف واتخاذ قرارات هشة.

تتضمن بعض مصادر البيانات الشائعة ما يلي:

  • التفاعلات على وسائل التواصل الاجتماعي: يمكن استخدام البيانات المستمدة من منصات مثل Twitter وFacebook في الوقت الفعلي لتتبع مدى التفاعل مع العلامات التجارية ومعرفة الرأي العام واكتشاف مشاعر المستهلكين.
  • البيانات العامة: يمكن أن تساعد مجموعات البيانات التي تُتيحها الحكومات والمؤسسات مجانًا، مثل بيانات التعداد السكاني والمؤشرات الاقتصادية، على توفير سياق للتحولات الديموغرافية وتجزئة الأسواق والتحليل المالي.
  • مجموعات البيانات المفتوحة: غالبًا ما تُستخدم مجموعات البيانات التي تُتيحها المؤسسات الأكاديمية والحكومات حول مواضيع مثل تغير المناخ والبيانات الجغرافية المكانية في الأبحاث ووضع السياسات.
  • بيانات المعاملات: يمكن أن تساعد البيانات المستمدة من المعاملات التجارية، مثل سجلات المبيعات والفواتير ومعلومات الدفع، الشركات على تتبع الأداء وتحسين الأسعار وتجارب العملاء.
  • الاستطلاعات والاستبيانات: يمكن أن توفر البيانات النوعية أو الكمية المجمعة من آراء العملاء أو الاستطلاعات البحثية معارف بشأن التفضيلات والآراء والاتجاهات.
  • تحليلات الويب: تساعد البيانات المستمدة من التفاعلات على المواقع الإلكترونية، مثل مشاهدات الصفحات ونسب النقر على الإعلانات، الشركات على معرفة سلوك المستخدمين وتحسين المحتوى وتجارب المستخدمين.
  • أجهزة إنترنت الأشياء: يمكن أن تدعم البيانات المستمدة من أجهزة إنترنت الأشياء (IOT) مثل أجهزة القياس الذكية وأجهزة التتبع القابلة للارتداء التحليلات الفورية والصيانة التنبئية وتجنب فترات تعطل المعدات.

إدارة البيانات

تتعامل المؤسسات مع كميات هائلة من البيانات بتنسيقات متعددة متناثرة عبر السحابة العامة والسحابة خاصة، ما يجعل تجزئة البيانات وسوء إدارتها تُشكل تحديات كبيرة.

وفقًا لتقرير IBM Data Differentiator، فإن نسبة 82% من المؤسسات تعاني من مشكلة صوامع البيانات التي تعطل سير العمل، و68% من البيانات لا تخضع للتحليل، ما يحد من إمكاناتها الفائقة.

إدارة البيانات هي عملية جمع البيانات ومعالجتها واستخدامها بشكل آمن وفعال لتحسين نتائج الأعمال. وهي تعالج التحديات الحساسة مثل إدارة مجموعات البيانات الكبيرة، وتفكيك الصوامع، والتعامل مع تنسيقات البيانات غير المتسقة.

عادةً ما تتكامل حلول إدارة البيانات مع البنية التحتية الموجودة من أجل المساعدة على ضمان إمكانية وصول علماء البيانات والمحللين والأطراف المعنية إلى بيانات فائقة الجودة وقابلة للاستخدام. غالبًا ما تتضمن هذه الحلول بحيرات البيانات أو مستودعات البيانات أو مستودعات بحيرات البيانات، والتي تُدمج في بنية بيانات موحدة.

  • بحيرات البيانات هي بيئات تخزين منخفضة التكلفة تضم بيانات غير منسقة وغير منظمة يمكن معالجتها وتحليلها لاحقًا.  
  • تُخزن مستودعات البيانات البيانات المنظمة المستمدة من مصادر مختلفة، وهي محسّنة لأداء مهام استخراج البيانات وتحليلها.  
  • تجمع مستودعات بحيرات البيانات بين أفضل مزايا مستودعات البيانات وبحيرات البيانات، ما يوفر حلاً موحدًا لإدارة البيانات المنظمة وغير المنظمة.

تساعد هذه الأنظمة على إنشاء أساس متين لإدارة البيانات، ودمج البيانات فائقة الجودة في أدوات ذكاء الأعمال ولوحات المعلومات ونماذج الذكاء الاصطناعي، بما في ذلك التعلم الآلي والذكاء الاصطناعي التوليدي.

بالإضافة إلى ذلك، يعمل الذكاء الاصطناعي على تحويل كيفية تعامل المؤسسات مع البيانات. إدارة البيانات باستخدام الذكاء الاصطناعي هي عملية تتضمن استخدام الذكاء الاصطناعي والتعلم الآلي طوال عملية إدارة البيانات. ومن الأمثلة على ذلك استخدام الذكاء الاصطناعي لأتمتة أو تبسيط عملية جمع البيانات، وتنظيم البيانات، وتحليل البيانات، والحفاظ على أمن البيانات، وغير ذلك من عمليات إدارة البيانات.

علماء البيانات ومحللو البيانات

مع تزايد اعتماد الشركات في مختلف المجالات على البيانات من أجل تعزيز عملية اتخاذ القرارات وتعزيز العمليات وتحسين تجارب العملاء، ارتفع الطلب على المتخصصين المهرة في مجال البيانات.

اثنان من أهم الأدوار في مجال علم البيانات هما دور علماء البيانات ومحللو البيانات.

  • عالم البيانات: يؤدي علماء البيانات مهام البيانات الأساسية والمعقدة. على سبيل المثال، يُنشئون نماذج وخوارزميات لاكتساب المعارف من مجموعات البيانات الكبيرة، وغالبًا ما يستخدمون أدوات متقدمة مثل التعلم الآلي والنمذجة التنبئية.
  • محلل البيانات: يركز محللو البيانات على المهام العملية الفورية. وهم يستخدمون الإحصائيات لتحليل البيانات والإجابة عن أسئلة محددة متعلقة بالأعمال. ويكون هدفهم الرئيسي هو العثور على معارف مفيدة تساعد على اتخاذ القرارات وتطوير الإستراتيجيات يوميًا.

ويهتم كلا الدورين بجمع البيانات، ونمذجة البيانات، وتحليل البيانات، وضمان جودة البيانات. قد يستخدم المحللون والعلماء على حد سواء منهجيات وأدوات مختلفة لجمع البيانات وإعدادها، بما في ذلك Microsoft Excel وPython ولغة الاستعلام المركبة (SQL).

وقد يستخدمون أيضًا تقنيات تصور البيانات، مثل لوحات المعلومات والرسوم البيانية، للمساعدة على اكتشاف الاتجاهات والارتباطات والمعارف الموجودة في البيانات، وإن كان ذلك بطرق مختلفة.

على سبيل المثال، قد يطور عالم البيانات نموذجًا تنبئيًا باستخدام التعلم الآلي للتنبؤ بسلوك العملاء في المستقبل. يمكن أن يساعد هذا النموذج الشركات على توقع الاتجاهات وتخصيص الحملات التسويقية واتخاذ قرارات إستراتيجية مستنيرة طويلة الأجل. 

في المقابل، قد يستخدم محلل البيانات في مشروع واحد أداة تصور لإنشاء لوحة معلومات تعرض أنماط سلوك العملاء بمرور الوقت. جدير بالملاحظة أن إمكانية رسم مخطط لاتجاهات المبيعات القديمة إلى جانب مقاييس التفاعل من شأنها أن تساعد الفرق على تحسين إستراتيجيات التسويق الحالية أو تعديل عروض المنتجات لزيادة الأرباح.

حماية البيانات

حماية البيانات هي عملية حماية المعلومات الحساسة من الفقدان والسرقة والتلف.تتزايد أهمية حماية البيانات في ظل تعامل المؤسسات مع كميات أكبر من البيانات الحساسة عبر بيئات معقدة وموزعة.

كما أن تزايد مخاطر التهديدات الإلكترونية وصرامة اللوائح التنظيمية المتعلقة بخصوصية البيانات جعلت حماية البيانات أولوية لدى الشركات والعملاء. وفقًا لإحدى الدراسات الحديثة، يواجه 81% من الأمريكيين مخاوف بشأن كيفية استخدام الشركات للبيانات المجمعة عنهم.1

وتوجد أيضًا مبررات تجارية قوية لإعطاء الأولوية لحماية البيانات. وفقًا لتقرير IBM حول تكلفة حوادث اختراق البيانات، تُكلِّف حوادث اختراق البيانات المؤسسات 4.88 ملايين دولار أمريكي في المتوسط، وتشمل هذه التكلفة خسائر في الأعمال، وتعطل الأنظمة، والأضرار التي تلحق بالسمعة، وإجراءات التعامل مع الحوادث.

أمن البيانات وخصوصية البيانات

تتضمن حماية البيانات مجالين فرعيين مهمين: أمن البيانات وخصوصية البيانات. يؤدي كلاهما أدوارًا مختلفة ولكنها متكاملة فيما يتعلق بحماية البيانات وإدارتها.

يتضمن أمن البيانات حماية المعلومات الرقمية من الوصول غير المصرح به أو التلف أو السرقة. ويشمل جوانب مختلفة من أمن المعلومات، بما في ذلك الأمن المادي والسياسات التنظيمية وضوابط الوصول.

تركز خصوصية البيانات على السياسات التي تدعم المبدأ العام القائم على أساس أن الشخص ينبغي أن يتحكم في بياناته الشخصية، بما في ذلك القدرة على تحديد كيفية جمع المؤسسات لبياناته وتخزينها واستخدامها.

الثغرات الأمنية للبيانات

تواجه البيانات العديد من الثغرات الأمنية والتهديدات الإلكترونية المحتملة، خاصةً مع تقدم إمكانات الذكاء الاصطناعي.

تتضمن بعض أكثر التهديدات شيوعًا ما يلي:

  • التهديدات الداخلية: يمكن أن يُشكل الموظفون أو المتعاقدون الذين لديهم حق الوصول مخاطر كبيرة. ووفقًا لتقرير تكلفة حوادث اختراق البيانات، فإن متوسط تكلفة حوادث اختراق البيانات التي نشأت من البرامج الخبيثة الداخلية يبلغ 4.99 ملايين دولار أمريكي.
  • الهندسة الاجتماعية: تستخدم جهات التهديدات في كثير من الأحيان هجمات الهندسة الاجتماعية مثل التصيد الاحتيالي لاستغلال نقاط الضعف البشرية لخداع الأشخاص من أجل الكشف عن المعلومات الحساسة. في الوقت الحالي، تتمكن أدوات الذكاء الاصطناعي التوليدي من صياغة رسائل بريد إلكتروني احتيالية مقنعة للغاية، ما يزيد من معدل نجاح مثل هذه الهجمات.
  • برامج طلب الفدية: يستخدم المجرمون الإلكترونيون برامج طلب الفدية لتشفير بيانات المؤسسات ثم يطلبون فدية مقابل الحصول على مفتاح فك التشفير. أنظمة الرعاية الصحية والمؤسسات المالية ووكالات البيانات الحكومية معرضة بشكل خاص لمثل هذه الهجمات.
  • أمن السحابة: في ظل تزايد تبني خدمات السحابة، يمكن أن تؤدي عمليات التكوين الخاطئة وواجهات برمجة التطبيقات غير الآمنة وضعف التحكم في الوصول إلى تسرب البيانات العامة. ووفقًا لتقرير تكلفة حوادث اختراق البيانات، فإن حوادث اختراق البيانات على السحابة العامة تُعد الأكثر تكلفة، حيث يبلغ متوسط تكلفتها 5.17 ملايين دولار أمريكي.

حلول حماية البيانات

تستخدم المؤسسات العديد من تقنيات حماية البيانات لمواجهة جهات التهديدات والمساعدة على ضمان سلامة البيانات وسريتها وتوافرها.

تتضمن بعض الحلول الأكثر شيوعًا ما يلي:

  • تعمل عمليات النسخ الاحتياطي للبيانات بانتظام على إنشاء نسخ من البيانات الحساسة وتخزينها، ما يسمح باستعادتها بسرعة في حال حدوث فقدان أو تلف مع تقليل فترة التعطل.
  • تراقب جدران الحماية حركة مرور البيانات عبر الشبكة وتتحكم فيها، وتعمل كخط الدفاع الأول لمنع الوصول غير المصرح به.
  • تتولى إدارة الهوية والوصول (IAM) إدارة كيفية وصول المستخدمين إلى الموارد الرقمية وما يمكنهم فعله بهذه الموارد لتقليل التهديدات الداخلية ومنع الوصول غير المصرح به.
  • تعمل أدوات مكافحة الفيروسات والبرمجيات الخبيثة على اكتشاف ومنع وإزالة البرمجيات الخبيثة مثل الفيروسات وبرامج التجسس وبرامج طلب الفدية التي قد تعرض البيانات للخطر.
  • تراقب أدوات منع فقدان البيانات (DLP) نشاط المستخدمين وترصد السلوكيات غير الاعتيادية لمنع الوصول غير المصرح به أو نقل المعلومات الحساسة أو تسريبها.

دور البيانات في مجال الذكاء الاصطناعي (AI)

أجمع 72% من المديرين التنفيذيين (CEO) الأفضل أداءً على أن اكتساب الميزة التنافسية يعتمد على امتلاك الذكاء الاصطناعي التوليدي الأكثر تقدمًا. بيد أن امتلاك الذكاء الاصطناعي المتطور لا يشكل سوى جزء واحد من المعادلة. فمن دون وجود بيانات مدارة بشكل صحيح ويسهل الوصول إليها، لا تتمكن حتى أدوات الذكاء الاصطناعي الأكثر تطورًا من الاستفادة من جميع إمكاناتها.

البيانات هي أساس تقدم الذكاء الاصطناعي ونجاحه. تعتمد أنظمة الذكاء الاصطناعي، وخاصة نماذج التعلم الآلي، على البيانات للتعلم والتكيف وتحقيق القيمة عبر المجالات.

جودة البيانات والتحيز

تتدرب نماذج التعلم الآلي على مجموعات بيانات ضخمة وتستخدم هذه البيانات لتحديد الأنماط واتخاذ القرارات.

ويؤثر تنوع وجودة بيانات تدريب نماذج الذكاء الاصطناعي بشكل مباشر في جودة أدائها. إذا كانت البيانات متحيزة أو ناقصة، فقد تصبح مخرجات الذكاء الاصطناعي غير دقيقة وغير موثوقة.

على سبيل المثال، في مجال الرعاية الصحية، قد لا تمثل نماذج الذكاء الاصطناعي المدربة على مجموعات البيانات المتحيزة بعض الفئات العرقية، ما يؤدي إلى ظهور نتائج تشخيصية سيئة. وبالمثل، في مجال التوظيف، يمكن أن يؤدي سوء جودة البيانات إلى ظهور توقعات مغلوطة، ما يعزز الصور النمطية المتعلقة بنوع الجنس أو العرق ويُنشئ نماذج ذكاء اصطناعي تفضل بعض الفئات الديموغرافية على حساب غيرها.

باختصار، تعتمد جودة إمكانات الذكاء الاصطناعي على جودة البيانات التي تعالجها.

يُعد ضمان إدخال بيانات فائقة الجودة من خلال التحقق الشامل من صحة البيانات وتنظيمها أمرًا ضروريًا لتطوير أنظمة ذكاء اصطناعي أخلاقية وموثوقة تتجنب استدامة التحيز.

الذكاء الاصطناعي التوليدي والثغرات الأمنية للبيانات

في حين أن الذكاء الاصطناعي التوليدي يمكنه إنشاء محتوى قيم، إلا أنه يُشكل أيضًا تحديات جديدة. يمكن أن تنتج نماذج الذكاء الاصطناعي بيانات خاطئة أو مضللة، والتي يمكن للمهاجمين استغلالها من أجل خداع الأنظمة أو الأشخاص.

تُثير صحة البيانات وأمنها مخاوف متزايدة. توصل أحد التقارير الحديثة إلى أن 75% من كبار المتخصصين في مجال الأمن الإلكتروني يشهدون زيادة في الهجمات الإلكترونية، ويُرجع 85% منهم سبب هذه الزيادة إلى استخدام الجهات الفاعلة الخبيثة للذكاء الاصطناعي التوليدي.2

ولمواجهة هذه التهديدات، تلجأ العديد من المؤسسات إلى تعزيز أمن الذكاء الاصطناعي، باستخدام الذكاء الاصطناعي نفسه في أتمتة عملية الرصد والحماية والاستجابة وتعزيز حماية البيانات.

الحواشي

تؤدي كل الروابط إلى صفحات خارج ibm.com.

1  كيف ينظر الأمريكيون إلى خصوصية البيانات، مركز Pew Research Center، 18 أكتوبر 2023. 

2 التقدم في مجال الذكاء الاصطناعي يزيد من خطر الجرائم الإلكترونية، كبار المسؤولين الأمريكيين، Reuters، 9 يناير 2024.