تفوق الذكاء الاصطناعي على الأطباء في تشخيص الحالات الطبية المعقدة
في دراسة حديثة أجراها باحثون من جامعتي هارفارد وستانفورد، أظهرت نتائج لافتة تؤكد تفوق نموذج الذكاء الاصطناعي o1-preview من شركة OpenAI على الأطباء في تشخيص الحالات الطبية المعقدة.
خضع النظام لسلسلة اختبارات دقيقة، حيث أظهر قدرة استثنائية في التشخيص بنسبة نجاح بلغت 78.3% من الحالات المُختبرة، وارتفعت هذه النسبة إلى 88.6% عند مقارنة أدائه في 70 حالة محددة.
الاستدلال الطبي: تفوق كبير على الأطباء المتمرسين
وفقًا لمقياس R-IDEA المستخدم لتقييم جودة الاستدلال الطبي، سجل نموذج o1-preview درجات عالية في 78 من أصل 80 حالة معقدة. بالمقابل، حقق الأطباء المتمرسون أداءً عاليًا في 28 حالة فقط، في حين حصل الأطباء المتدربون على درجات عالية في 16 حالة فقط.
وقد سلط الباحثون الضوء على قدرة النظام على تقديم استدلال طبي دقيق وعميق، مقارنةً بالأداء البشري.
التحدي والتفوق في الحالات الطبية المعقدة
صمم 25 أخصائيًا مجموعة من الحالات الطبية شديدة التعقيد لاختبار قدرة النظام والأطباء. برز o1-preview بأداء مذهل، حيث حصل على 86% من النقاط، أي أكثر من ضعف النقاط التي سجلها الأطباء باستخدام النماذج التقليدية أو الأدوات الطبية الأخرى.
وأشاد الدكتور آدم رودمان، أحد الباحثين المشاركين، بهذا الإنجاز، مشيرًا إلى أن أداء النموذج في هذه الحالات لم يحتج إلى إحصائيات لتوضيح تفوقه.
قيود النموذج في تقدير الاحتمالات الطبية
على الرغم من التفوق الواضح للنموذج، فإنه أظهر نقاط ضعف في تقدير الاحتمالات. على سبيل المثال، قدر احتمالية الإصابة بالالتهاب الرئوي بنسبة 70% في بعض الحالات، وهي نسبة تفوق بكثير النطاق العلمي المعتاد (25-42%).
وأشار مؤسسو OpenAI إلى أن هذه الأنظمة ما زالت تحتاج إلى تحسينات تدريبية كبيرة قد تصل إلى 1000 ضعف المستوى الحالي لتحقيق أداء أكثر دقة.
التوصيات والتطبيق العملي في الرعاية الصحية
أكد الباحثون أن الدراسة ركزت على أداء النظام منفردًا ولم تدرس مدى فاعليته عند التعاون مع الأطباء.
كما دعوا إلى تطوير تجارب سريرية واقعية وبنية تحتية تقنية متقدمة لتقييم هذه الأنظمة بشكل أفضل وتعزيز التعاون بينها وبين الأطباء لتحسين فعالية استخدامها في بيئات الرعاية الصحية.
رغم الإنجازات، واجه النظام انتقادات تتعلق بتكلفة الفحوصات التي يقترحها وصعوبة تطبيقها في البيئات الصحية الحالية. وحذر الباحثون من المبالغة في التوقعات، مشددين على أن هذه الدراسة معيارية ولا تعكس تعقيدات الواقع الطبي.
كما أكدوا أن الاعتماد الكامل على الذكاء الاصطناعي دون التعاون مع الأطباء قد لا يكون ممكنًا أو مستحسنًا في المستقبل القريب.
آفاق جديدة للذكاء الاصطناعي في الطب
أظهرت الدراسة إمكانات واعدة لنماذج الذكاء الاصطناعي مثل o1-preview في تحسين تشخيص الحالات الطبية المعقدة.
ومع ذلك، لا يزال هناك حاجة لمزيد من التطوير والتقييم لتوفير حلول عملية ومستدامة تُحدث تحولًا نوعيًا في مجال الرعاية الصحية.