ارتفع عدد الأشخاص الذين تزيد أعمارهم عن 50 عاماً الذين يتلقون بدلات إعاقة بنسبة 36٪ في فرنسا بين عامي 2011 و2019. وأراد ديوان المحاسبة التحقق مما إذا كانت احتياجات السكان المعنيين تُلبى على نحو كافٍ.
وتحقيقاً لهذه الغاية، استخدم الديوان تقنية مطابقة مثلى. وتظهر تقنية علم البيانات هذه أوجه التشابه في تتابع الأحداث، وتالياً العلاقة السببية المحتملة بينها. ومن خلال تكييف خوارزمية مستمدة من علم الوراثة، يتحقق ديوان المحاسبة من فترات الانقطاع المحتملة في مسار الإقامة والمسار الإداري، حسب الحالات المختلفة التي تتم مواجهتها، مثل ما إذا كان الأشخاص يحصلون على رعاية متخصصة أو اعتراف بالإعاقة، وسواء كانوا يتلقون الرعاية في المنزل أم لا، إلخ.
واستلهم فريق علماء البيانات بشكل خاص من النهج الذي استخدمه مستشفى جامعة تولوز لإجراء مسح سابق. وتسلط هذه المنهجية الضوء على قيمة وجود ذاكرة للعمل السابق واستمرارية النشاط في الفريق، للاستفادة من الأساليب والممارسات والابتكارات. وتضمنت الجهود الرامية إلى تعديل الخوارزمية مع البيانات التي استخدمها الديوان في هذا التحقيق خيارات لطريقة الحساب تهدف إلى تقليص وقت الحساب.
وتمَّ استخراج البيانات من منصة الخدمة الرقمية ViaTrajectoire التي تربط الأشخاص بالمؤسسات وتساعدهم على إدارة قوائم الانتظار. وتشير المعلومات المتاحة إلى ما إذا كان الأشخاص يتمتعون بحقوق مفتوحة للرعاية الطبية أو الاجتماعية المخصصة أم لا. وأُطلِقَت على البيانات أسماء مستعارة، مع مفاتيح تشفير مختلفة لكل دائرة.وتجدر الإشارة إلى أنّه نتيجة لهذا العمل الأولي، ينظر الديوانفي مطابقة هذه البيانات مع بيانات إدارية أخرى لمسوح أخرى لا تزال مجهولة الهوية، مستفيداً بذلك من المعارف المكتسبة من قواعد البيانات هذه.
خوارزمية لتأكيد حدس فريق التدقيق وتوضيحه
تتألف تقنية المطابقة المثلى المطبقة على هذه البيانات من تحديد مقياس تشابه بين التسلسلات، أي احتساب عدد يعطي مؤشراً على المسافة بين تسلسلي بيانات. ففي حين أنَّ ثمّة حاجة إلى العديد من التغييرات لتحويل تسلسل معين إلى آخر، فهي تعتبر متباينة وبعيدة جداً. وإذا كانت تتطلب تغييرات قليلة أو معدومة، فهي قريبة جداً. ثم يتم استخدام هذا المقياس لتجميع التسلسلات في تجمعات متجاورة.
وأكد هذا الضمّ في تجمعات من أنماط المسارات الإدارية والسكنية حدس المحققين وصقل فهمهم للمسارات الإدارية ومسارات الرعاية والمسارات السكنية الفردية. فعلى سبيل المثال، جرى ضمّ 12٪ من الأفراد في العينة الذين تتراوح أعمارهم بين 45 و50 عاماً في التجمع 2. ويتمتع الأشخاص في هذا التجمع باعتراف إداري بالإعاقة ولكنهم لا يقدمون أي طلب معروف إلى مؤسسة لفترة طويلة من الزمن. وقد يكون من بينهم أشخاص يرفضون التوجيهات الموصى بها أو يتولون إجراء الاعتراف كتدبير وقائي لتلبية الاحتياجات المستقبلية من المساعدة الرسمية. ومن المفيد معرفة وجود مثل هذه النُهُج التحوطية وقياسها كميّاً لاحتساب مؤشرات توتر الحلول التيسيرية.
التعاون بين فريق التدقيق وعلماء البيانات أساسي لنجاح عملية التدقيق
جرت عمليات تبادل بين فريق المراقبة وعلماء البيانات في دائرة علوم البيانات وتحليلها في الديوان بمجرد إعداد مذكرة الجدوى، قبل الشّروع في التحقيق. وقد سهَّل هذا التعاون ويسَّر تشغيل القواعد أثناء التحقيق. وعلى وجه الخصوص، حدَّد فريق التدقيق بشكل جيد جداً قواعد البيانات المفيدة للتحقيق. وجرى تبادلها مع علماء البيانات أسبوعياً، وأمكن إعداد مؤشرات يطلبها المدققون، للإشارة إلى حالات غير متوقعة (مثل كثرة بعض المعوقات الأقل وضوحاً) وتسليط الضوء على أوجه القصور في قواعد البيانات الإدارية.
قراءة الرسوم البيانية: في المحور X، الأشهر والسنوات (تسلسل 5 سنوات كاملة، من 0-01 إلى 5-12)؛ في المحور Y: نسبة ملاحظات التجمع، والتي تتراوح من 0 إلى 1. لكل تجمع حجم مختلف (يشار إلى الحجم بـ “Freq. (مرجح n=[العدد]”. على سبيل المثال، في التجمع 6، نرى أنَّ ما يقرب من 60٪ من 3,228 شخصاً في هذا التجمع لا يواجهون أي تغييرات في وضعهم على مدى 5 أعوام.
وفي هذا الصدد، من المهم التأكيد على أن مراجعة البيانات نفسها تساهم في مراجعة توجيه السياسة العامة المعنية: وقد أدت أوجه القصور هذه، التي حددها علماء البيانات، إلى ظهور توصيات واضحة في التقرير الذي نُشر في سبتمبر/أيلول. 2023، والذي يمكن الوصول إليه باللغة الفرنسية هنا.
لذلك تعتبر قاعدة البيانات الناتجة حديثة جداً، ولكنَّها ستكون مفيدة في التحقيقات المقبلة بشأن الإعاقة والإعالة. ومع مرور الوقت، سيزداد عمقها التاريخي ويمثل تسلسلات أطول وأكثر تمثيلاً لمسار الحياة. كما أنّها ستسمح بإجراء تحليل سببي لآثار الإصلاحات المستقبلية للسياسات العامة على الاستقلالية وإدماج الأشخاص ذوي الإعاقة.
روبن كريلينغ، عالم بيانات في دائرة تحليل البيانات والعلوم
للاطلاع على المزيد: يرجى الاتصال بدائرة علوم البيانات وتحليلها في الديوان.