پژوهش جدیدی که توسط دانشکده پزشکی هاروارد انجام شده، نشان میدهد مدلهای هوش مصنوعی شرکت «اوپنایآی» میتوانند در برخی سناریوهای اورژانسی، عملکردی دقیقتر یا همسطح با پزشکان انسانی داشته باشند. این یافتهها اگرچه امیدوارکننده هستند، اما چالشهای مهمی را در زمینه پذیرش و نظارت بر این فناوریها مطرح میکنند.
به گزارش پایگاه خبری حکمرانی هوشمند، در این مطالعه، عملکرد مدلهای o1 و o4 اوپنایآی با تشخیصهای دو پزشک داخلی در ۷۶ مورد اورژانسی مقایسه شد. نتایج نشان داد که مدل o1 در ۶۷ درصد موارد تشخیص دقیق یا نزدیک به دقیق ارائه داد، در حالی که این رقم برای پزشکان به ترتیب ۵۵ و ۵۰ درصد بود.
«آرجون مانرای»، رئیس آزمایشگاه هوش مصنوعی در دانشکده پزشکی هاروارد و یکی از پژوهشگران اصلی این پروژه، درباره نتایج این آزمایش گفت: ما مدل هوش مصنوعی را تقریباٌ در برابر هر معیاری آزمایش کردیم و مدل هوش مصنوعی هم مدلهای پیشین و هم مبانی اولیه پزشکان ما را تحتالشعاع قرار داد.»
این تفاوت عملکرد به ویژه در مرحله تریاژ اولیه اورژانس مشهود بود؛ جایی که اطلاعات بیمار محدود و نیاز به تصمیمگیری سریع حیاتی است. پژوهشگران تأکید کردند که دادهها بدون پیشپردازش و دقیقاً مشابه پروندههای پزشکی الکترونیکی به مدلها داده شده است.
با وجود نتایج مثبت، پژوهشگران هشدار میدهند که هوش مصنوعی هنوز برای گرفتن تصمیمات نهایی مرگ و زندگی آماده نیست. همچنین، محدودیت مدلها در پردازش ورودیهای غیرمتنی و نبود چارچوب رسمی برای پاسخگویی، از جمله موانع مهم هستند.
«آدام رادمن» از پژوهشگران این پروژه در این باره هشدار داد: در حال حاضر هیچ چارچوب رسمی برای پاسخگویی درباره تشخیصهای هوش مصنوعی وجود ندارد و بیماران هنوز هم میخواهند انسانها آنها را در تصمیمهای مربوط به زندگی یا مرگ و در تصمیمهای درمانی چالشبرانگیز راهنمایی کنند.»
همچنین، «کریستن پانتاگانی»، پزشک اورژانس، با انتقاد از نحوه مقایسه در این پژوهش، تأکید کرد که تشخیص هوش مصنوعی با پزشکان داخلی مقایسه شده، نه پزشکان اورژانس که تخصصشان مدیریت بحرانهای حاد است. او میگوید: به عنوان یک پزشک اورژانس که برای اولین بار یک بیمار را ویزیت میکند، هدف اصلی من حدس زدن تشخیص نهایی شما نیست. هدف اصلی من این است که مشخص کنم آیا شما به بیماری مبتلا هستید که بتواند شما را بکشد یا خیر.
این پژوهش در مجله معتبر «Science» منتشر شده و نیاز به آزمایشهای بیشتر در محیطهای واقعی مراقبت از بیمار را برجسته میکند.
انتهای پیام
