
يُدرّب الآلاف من الطلاب كلّ عام على نماذج الذكاء الاصطناعيّ في مجالاتٍ مُختلفة، بما في ذلك التشخيص الطّبيّ. لكنّ الكثير من هذه الدورات يتجاهل عنصرًا رئيسيًا: تدريب الطلاب على اكتشاف عيوب بيانات التدريب المُستخدمة في تطوير النموذج.
يوثّق ليو أنثوني سيلي، عالم أبحاث بارز في معهد هندسة الطب والعلوم في معهد ماساتشوستس للتكنولوجيا، وطبيب في مركز بيت إسرائيل ديكونيس الطّبيّ، وأستاذ مُشارك في كلية هارفارد الطّبية، هذه النواقص في ورقة بحثية جديدة، ويأمل في إقناع مُطوّري الدورات بتدريب الطلاب على تقييم بياناتهم بشكلٍ أكثر شمولية قبل دمجها في نماذجهم. وقد وجدت دراساتٌ سابقية عديدة أنّ النموذج المدرب بشكلٍ رئيسيّ على بياناتٍ سريرية من رجالٍ بيض لا يعمل بشكلٍ جيد عند تطبيقه على أشخاصٍ من مُجموعاتٍ أخرى. هنا، يُشير سيلي إلى أثر هذا التحيز وكيف يمكن للمُعلّمين معالجته في تعليماتهم حول نماذج الذكاء الاصطناعيّ.
سؤال: كيف يدخل التحيز إلى هذه المجموعات البيانية، وكيف يمكن معالجة هذه النواقص؟
جواب: أيّ مشاكل في البيانات ستُدمج في أيّ نمذجة للبيانات. في الماضي، وصفنا أدوات وأجهزة لا تعمل بشكلٍ جيد عبر الأفراد. كمثال، وجدنا أنّ أجهزة قياس الأكسجين في الدم تُبالغ في تقدير مستويات الأكسجين لأصحاب البشرة السّوداء، لأنّ لم يكن هناك عددٌ كافٍ من أصحاب البشرة السّوداء مسجّلين في التجارب السّريريّة للأجهزة. نُذكّر طلابنا بأنّ الأجهزة الطّبية والمُعدّات مُحسّنة على رجالٍ شبابٍ أصحّاء. لم تُحسّن أبدًا لِامرأةٍ تبلغ من العمر ٨٠ عامًا تعاني من قصور قلب، ومع ذلك نستخدمها لهذه الأغراض. ولا تتطلّب إدارة الغذاء والدواء أن يعمل الجهاز بشكلٍ جيد على هذه التنوّعات من السكان الذين سنستخدمه عليهم. كلّ ما يحتاجونه هو إثبات أنّه يعمل على مُشاركين أصحّاء.
بالإضافة إلى ذلك، لا يُمكن استخدام نظام السجلّات الصحية الإلكترونية كلبنات أساسية للذكاء الاصطناعيّ. لم تُصمّم هذه السجلّات لتكون نظامًا تعليميًا، ولهذا السبب، يجب أن تكون حذرًا جدا في استخدام السجلّات الصحية الإلكترونية. يجب استبدال نظام السجلّات الصحية الإلكترونية، لكنّ هذا لن يحدث قريبًا، لذلك نحتاج إلى أن نكون أكثر ذكاءً. نحتاج إلى أن نكون أكثر إبداعًا في استخدام البيانات التي لدينا الآن، مهما كانت سيئة، في بناء الخوارزميات.
أحد الطرق الواعدة التي نستكشفها هو تطوير نموذج محوّل لبيانات السجلّات الصحية الإلكترونية الرقمية، بما في ذلك وليس حصراً نتائج الاختبارات المخبرية. يمكن أن تُخفّف نمذجة العلاقة الأساسية بين الاختبارات المخبرية، والعلامات الحيوية، والعلاجات من أثر البيانات الناقصة نتيجة للمُحدّدات الاجتماعية للصحة والانحيازات الضمنية للمُقدّم.
سؤال: لماذا من المُهمّ أن تغطّي دورات الذكاء الاصطناعيّ مصادر التحيز المُحتمل؟ ماذا وجدت عندما حلّلت محتوى هذه الدورات؟
جواب: بدأت دورتنا في معهد ماساتشوستس للتكنولوجيا في عام ٢٠١٦، وفي بعض الوقت أدركنا أنّنا كنا نشجّع الأشخاص على التسابق لبناء نماذج مُفرطة التكيّف مع بعض المُقاييس الإحصائية لِأداء النموذج، في حين أنّ البيانات التي نستخدمها مليئة بالمشاكل التي لا يُدركها الأشخاص. في ذلك الوقت، كنا نتساءل: ما مدى شيوع هذه المشكلة؟
كان شكّنا هو أنّه إذا نظرت إلى الدورات التي يتوفّر منها المُنهج على الإنترنت، أو الدورات الإلكترونية، فإنّ لا واحدة منها تُزعج نفسها حتى بإخبار الطلاب بأنّهم يجب أن يكونوا متشكّكين في البيانات. وبالفعل، عندما نظرنا إلى الدورات الإلكترونية المُختلفة، فإنّ الأمر كله يتعلّق ببناء النموذج. كيف تبني النموذج؟ كيف تُصوّر البيانات؟ وجدنا أنّ من أصل ١١ دورة راجعناها، ٥ دورات فقط شملت أقسامًا حول التحيز في مجموعات البيانات، و ٢ دورات فقط تضمنت أيّ مناقشةٍ مُهمّة للتحيز.
مع ذلك، لا يمكننا تجاهل قيمة هذه الدورات. لقد سمعتُ الكثير من القصص حيث يُدرّب الأشخاص أنفسهم بناءً على هذه الدورات الإلكترونية، لكنّ في الوقت نفسه، نظراً لِمدى تأثيرها، نحتاج إلى أن نُضاعف التركيز على تدريس المهارات الصحيحة، مع تزايد عدد الأشخاص المُنجذبين إلى هذا العالم المُتعدّد للذكاء الاصطناعيّ. من المُهمّ للناس أن يُجهّزوا أنفسهم بِالقدرة على العمل مع الذكاء الاصطناعيّ. نأمل أن تُلقي هذه الورقة الضوء على هذه الفجوة الكبيرة في طريقة تدريسنا الذكاء الاصطناعيّ للطلاب الآن.
سؤال: ما نوع المحتوى الذي يجب أن يُدمجه مُطوّرو الدورات؟
جواب: أولاً، إعطاؤهم قائمة تحقق من الأسئلة في البداية. من أين جاءت هذه البيانات؟ من كان المُراقبون؟ من كان الأطباء والمُمرّضون الذين جمعوا البيانات؟ ثمّ تعلم شيئًا ما عن مناظر هذه المؤسّسات. إذا كانت قاعدة بيانات وحدة العناية المُركّزة، فإنّهم يحتاجون إلى السؤال عن من يصل إلى وحدة العناية المُركّزة، ومن لا يصل إليها، لأنّ هذا يُدخِل تحيزًا في اختيار العينة. إذا لم يُدخل جميع المرضى من الأقليات إلى وحدة العناية المُركّزة لأنّهم لا يستطيعون الوصول إلى وحدة العناية المُركّزة في الوقت المناسب، فإنّ النموذج لن يعمل لهم. بصدق، بالنسبة إليّ، يجب أن يكون ٥٠٪ من محتوى الدورة فهم البيانات، إن لم يكن أكثر، لأنّ النمذجة بحدّ ذاتها سهلة بمجرد فهم البيانات.
منذ عام ٢٠١٤، ينظّم تحالف البيانات الحرجة في معهد ماساتشوستس للتكنولوجيا مُسابقات بيانات (مُسابقات اختراق البيانات) حول العالم. في هذه التجمّعات، يجتمع الأطباء، والمُمرّضون، وعاملون آخرون في الرعاية الصحية، وعلماء بيانات لِتمشيط قواعد البيانات ومحاولة فحص الصحة والأمراض في السياق المحليّ. تُقدّم الكتب الدّرسية والأوراق البحثية الأمراض بناءً على مُلاحظاتٍ وتجاربٍ تتضمّن مجموعةً ديموغرافية ضَيّقة عادةً من دولٍ تملك موارد للبحث.
هدفنا الرئيسيّ الآن، ما نريد تعليمه لهم، هو مهارات التفكير النقديّ. والمُكوّن الرئيسيّ للتفكير النقديّ هو جمع الأشخاص ذوي الخلفية المُختلفة.
لا يمكنك تعليم التفكير النقديّ في غرفةٍ مليئة بِالرؤساء التنفيذيين أو في غرفةٍ مليئة بِالأطباء. البيئة ليست مُناسبة لهذا. عندما يكون لدينا مُسابقات بيانات، لا نحتاج حتى إلى تعليمهم كيف يُمارسون التفكير النقديّ. بمجرد جمع المزيج الصحيح من الأشخاص – ولا يأتي هذا فقط من خلفية مُختلفة بل من أجيالٍ مُختلفة – لا تحتاج حتى إلى إخبارهم بكيفية التفكير النقديّ. إنه يحدث بكلّ بساطة. البيئة مُناسبة لهذا النوع من التفكير. لذلك، نقول الآن لِمُشاركينا وطلابنا، من فضلكم، من فضلكم لا تبدأوا ببناء أيّ نموذج ما لم تفهموا حقًا كيف تكوّنت البيانات، أيّ مرضى دخلوا إلى قاعدة البيانات، ما هي الأجهزة المُستخدمة للقيس، وهل هذه الأجهزة دقيقة بشكلٍ ثابت عبر الأفراد؟
عندما يكون لدينا فعاليات حول العالم، نشجّعهم على البحث عن مجموعات بياناتٍ محلية، بحيث تكون ذات صلة. يوجد مُقاومة لأنّهم يعلمون أنّهم سيكتشفون مدى سوء مجموعات بياناتهم. نقول إنّ هذا جيد. هكذا تُصلح هذا. إذا لم تكن تعلم مدى سوءها، فستستمر في جمعها بطريقة سيئة جدا وهي عديمة الفائدة. يجب أن تُقرّ بأنّك لن تصل إلى النتيجة الصحيحة من المرّة الأولى، وهذا جيد تمامًا. استغرق MIMIC (قاعدة بيانات المعلومات الطبية المُخصصة لوحدة العناية المُركّزة المُبنية في مركز بيت إسرائيل ديكونيس الطّبيّ) عقدًا من الزمن قبل أن يكون لدينا مخطّط لائق، وليس لدينا مخطّط لائق إلاّ لأنّ الأشخاص أخبروا بمدى سوء MIMIC.
قد لا نملك إجاباتٍ على جميع هذه الأسئلة، لكنّنا يمكننا إثارة شيءٍ ما في الأشخاص يساعدهم على إدراك أنّ هناك الكثير من المشاكل في البيانات. أنا دائمًا مُتحمّس لِلنظر إلى مدوّنات الأشخاص الذين حضروا مُسابقة بيانات، الذين يقولون إنّ عالمهم تغيّر. الآن هم أكثر حماسًا للمجال لأنّهم يُدركون الإمكانات الهائلة، لكنّ أيضًا المخاطر الهائلة للضرر إذا لم يفعلوا هذا بشكلٍ صحيح.
هذا المحتوى تم باستخدام أدوات الذكاء الاصطناعي.