ما المُخيف حول البيانات الضخمة و كيف يُمكن مواجهة ذلك؟
مترجم من اللغة الإنجليزية
أي نقاش يدور حول الفوائد والمخاطر التي تمنحها البيانات الضخمة يركز في الغالب على المستقبل البعيد. إن عالم Minority Report – فيلم خيال علمي أنتج عام 2002 مقتبس عن قصة قصيرة للكاتب فيليب ك – يتم استحضاره بشكل مُتكرر، لكن في أعقاب “أسبوع البيانات الضخمة” المنعقد خلال شهر أبريل، فإنه قد حان الوقت للاعتراف بأن البيانات الضخمة موجودة بالفعل. عمِل فيكتور ماير شونبيرغر و كينيث كوكير كمبشرين بالبيانات الضخمة في كتابهما الحديث “البيانات الكبرى ثورة : ستغير الطريقة التى نعيش ، ونعمل ، ونفكر بها“، واقترحا أن الظاهرة الحقيقية هي ما أطلقا عليه Datafication وهو تحويل أي جانب من جوانب الحياة إلى بيانات محوسبة . وقد وصفا التحول الذي سيطال العالم بأكمله بأنه سيكون ” محيطات من البيانات التي يُمكن استكشافها” و الذي بدوره يمكنه أن يزودنا بمنظور جديد عن الواقع. لغة الكتاب وبلاغته تسلّطان الضوء على إمكانات البيانات الضخمة: فهما يقترحان أن حجم البيانات الضخمة يسمح لنا “باستخلاص رؤى جديدة” و “خلق أشكال جديدة للقيمة” بطرق من شأنها أن تغير بشكل أساسي كيف نتفاعل مع بعضنا البعض.
هذه الرؤى الجديدة يمكن استخدامها استخدامًا جيدًا أو سيئًا ، ولكن هذا يصحُ لأي جزء جديد من المعرفة. إذن، ما هو الأمر المقلق بالضبط الذي يجدهُ البعض حول البيانات الضخمة؟
لقد أدرك ماير شونبيرغر و كوكير أن البيانات الضخمة على مسار تصادمي مباشر مع نماذج الخصوصية التقليدية الخاصة بنا، وعلاوةً على ذلك، إنها تفتح الباب لخلق نوع من نماذج النزوع Propensity Models – أي نزوع البيانات لصالح أمر معين – التي شوهدت في Minority Report. إن الثنائي المذكور يتعلقان ويرتبطان بما يمكن تسميته “ديكتاتورية البيانات”. إنهما يخشيان من أن المؤسسات المعتبرة قد “تصب تركيزها على البيانات، مهووسة بالقوة التي توفرها البيانات ، الشئ الذي يعني أنها تفشل في تقدير أوجه قصور تلك البيانات”.
إن أوجه القصور وحدود البيانات هي حقيقية للغاية. يقول الخبير الإحصائي الشهير نيت سيلفر أن الوقت قد حان للاعتراف بأن “لدينا مشكلة في التنبؤ، نحن نحب أن نتنبأ بالأمور – لكننا لسنا جيدين في ذلك”. هذه هي الديناميكية التي تمثل أكبر المخاوف بشأن البيانات الضخمة. إن البيانات تعدنا بتحويل عالمنا بأكمله ، وتجاربنا بالكامل إلى مؤشرات من البيانات، ستكون الأرقام قادرة على التحدث عن نفسها، ولكن هذا وحده لن يعالج ميلنا أو نزوعنا التنبؤي Prediction Predilection. وكما أشارت كيت كروفورد من شركة مايكروسوفت للأبحاث ، فإن البيانات الضخمة مليئة بالتحيزات الخفية. وكما قالت أن “البيانات وأطقم البيانات ليست موضوعية”. وأضافت :” إنها تصميم من صنع الإنسان”.
يتوقف عمل خدمة Google Flu Trends – خدمة على الإنترنت تديرها غوغل توفر تقديرات رقمية حول نشاط الإنفلونزا في أكثر من 25 دولة – على النطاق الذي توفره البيانات الضخمة. يوضح استخدام عمليات البحث المجمعة عبر الإنترنت لرسم مخطط انتشار المرض كيف يمكن للتصفح العادي للويب أن يولّد رؤى جديدة ظاهريًّا، ولكن من المهم إدراك القصور الكامن خلف الخوارزميات المستخدمة في المشروع. لقد قدمت Google Flu Trends نتائج غير مُرضية هذا العام، لماذا؟ كما تعترف غوغل ، ليس كل من يبحث عن “الإنفلونزا” هو مريضٌ حقًا، فخلال هذا العام ، ونظرًا للتغطية الإعلامية المكثفة ، كان عدد الأشخاص الذين يستخدمون غوغل لمعرفة المزيد حول الموضوع أكثر من المتوقع، وكانت النتيجة أن الخوارزميات الموجودة خلف الكواليس بدأت تُظهر علامات انتشار الإنفلونزا في أماكن لم تكن موجودة فيها بالفعل. ويمكن تبرير خطأ Google Flu Trends لعدد من الأسباب: ليس فقط لأنها أداة لتجربة البيانات إلى حد كبير ، ولكن لأنها أيضًا تمتلك غرضًا جيدًا بشكل عام. فإذا كانت هناك خوارزمية مشابهة تلقت بلاغا من قِبل مراكز السيطرة على الأمراض والوقاية (CDC) لحجر مجموعة صحيا أو من ناحية أخرى أبلغت بوجود تأثير مباشر على الأفراد ، فسيكون الحديث مختلفا. لذا يجب على المؤسسات والأفراد أن يصبحوا أكثر إدراكًا للتحيزات والافتراضات التي تكمن وراء عوالم المراكز التي تعج بالبيانات.
هذا يتطلب تأسيس نقاش حول البيانات بين المستخدمين، من أجل تعزيز فهمنا للخصوصية الفردية دون قطع الابتكار التكنولوجي ، فالأفراد بحاجة إلى التثقيف بشأن كيف يتم استخدام بياناتهم، و لبدء هذه النقاش نحن بحاجة إلى المزيد من الشفافية. يقترح جولز بولونيتسكي وعمر تيني أن المنظمات أو الشركات يجب أن تكشف عن المنطق الذي تستخدمه لعمليات صنع القرار بأفضل طريقة ممكنة دون المساس “بالوصفة السرية” الخاصة بها. هذه المعلومات لها ميزتان رئيسيتان: فهي تسمح لنا بمراقبة كيفية استخدام البيانات، كما تسمح للأفراد بأن يصبحوا مشاركين أكثر في هذا النشاط.
واليوم ، يشجع التدفق الطوفاني للبيانات الضخمة على السلبية والجهود المضللة للوصول إلى الاستقلالية الكاملة. و مع تكنولوجيا “إنترنت الأشياء” التي تمتد من سياراتنا إلى أجهزتنا وحتى سجادنا ، فإن الانسحاب إلى منازلنا وإيقاف هواتفنا لن يفعل سوى القليل لوقف تدفق البيانات. الشفافية لغرض الشفافية لا معنى لها، فنحن بحاجة إلى آليات لتحقيق منافع الشفافية، و بحاجة إلى تشجيع المستخدمين على رؤية بياناتهم كميزة يمكن تشغيلها أو إيقاف تشغيلها حسب رغبتهم. إن السماح للمستخدمين بالتعبير عن تفضيلات البيانات الخاصة سيشجع الأفراد على الاهتمام بما تقوله بياناتهم عنهم وكيفية المشاركة الفعالة في الكيفية التي تعالج بها معلوماتهم.
سيكون التحدي هو جعل هذه العملية سهلة المنال وممتعة للمستخدمين. ويشير سجل شركة BlueKai إلى أحد السبل الممكنة من خلال السماح للمستخدمين بمعرفة ما تفكر به شركات البيانات حول أجهزة الكمبيوتر الخاصة بهم ، وتقدم غوغل و ياهو بالفعل وسيلة لإدارة إعدادات للمستخدمين لتحديد من يطلّع على البيانات، وما البيانات المسموح بها، كما يجب على المزيد من المؤسسات والشركات التفكير بعناية حول أفضل الطرق لتحقيق التوازن بين تقديم ضوابط سهلة الاستخدام و شاملة.
في الوقت نفسه ، تسمح الشفافية للخبراء أيضًا بتنظيم وضبط الشركات من أجل مراقبة وكشف ومنع الممارسات التي لا نريدها. ويدعو ماير شونبيرغر وكوكير إلى “الخوارزمي” ، وهو الشخص الذي من شأنه أن يقيّم اختيار مصادر البيانات ، واختيار الأدوات التحليلية ، والخوارزميات نفسها، و في الوقت الذي يقدم فيه للأفراد فرصًا لفهم وتحدي كيفية اتخاذ القرارات بشأن البيانات ، فإن الخوارزميات الداخلية إلى جانب عين الرقيب من المشرعين والمدافعين عن الخصوصية يمكن أن تساعدان في ضمان خضوع الشركات للمساءلة. بهذا يمكن أن نقطع شوطًا طويلاً نحو التخفيف من المخاوف بشأن البيانات الضخمة وتوفير بيئة حيث يمكن للمجتمع جني فوائد البيانات الضخمة بأمان.
بقلم : JOSEPH JEROME | المصدر