هوش مصنوعی گوگل نسبت به پزشکان انسانی تشخیص های بهتری می دهد

14 ژانویه, 2024 تازه ها نظری بدهید

یک سیستم هوش مصنوعی (AI) که برای انجام گفتگوهای پزشکی آموزش دیده است، عملکرد پزشکان انسانی را در گفت و گو با بیماران شبیه سازی شده با یکدیگر مطابقت داده یا حتی از آن ها پیشی می گیرد و تشخیص های احتمالی را براساس سابقه پزشکی بیماران فهرست می کند.

این چت بات که مبتنی بر یک مدل زبانی بزرگ (LLM) توسعه یافته توسط گوگل است، در تشخیص بیماری های تنفسی و قلبی عروقی از پزشکانی که مورد مورد تایید هیات مدیره بودند دقیق تر عمل کرد. در مقایسه با پزشکان انسانی، این چت بات موفق به کسب اطلاعات مشابهی در طول گفتگوهای پزشکی شد و در همدلی با بیمار رتبه بالاتری کسب کرد.

آلن کارتیکسالینگام، دانشمند تحقیقات بالینی در Google Health در لندن و یکی از نویسندگان این مطالعه می گوید: تا جایی که ما می دانیم، این اولین باری است که یک سیستم هوش مصنوعی محاوره ای به طور بهینه برای گفتگوی تشخیصی و گرفتن تاریخچه بالینی طراحی شده است که البته هنوز نیاز به بررسی بیشتر دارد.

این چت بات که AMIE نام دارد، هنوز کاملا آزمایشی است. این روش بر روی افراد با مشکلات سلامتی واقعی آزمایش نشده است و تنها بر روی بازیگرانی که برای به تصویر کشیدن افراد با شرایط پزشکی آموزش دیده اند تست شده است.” ما می خواهیم نتایج با احتیاط و بدون هیجان زدگی تفسیر شوند.”

حتی اگر چت بات در مراقبت های بالینی استفاده نشود، نویسندگان استدلال می کنند که در نهایت می تواند نقشی در دموکراتیزه سازی مراقبت های بهداشتی ایفا کند. آدام رادمن، پزشک داخلی در دانشکده پزشکی هاروارد در بوستون می گوید که این ابزار می تواند مفید باشد، اما نباید جایگزین تعامل با پزشکان شود. او می‌گوید: پزشکی خیلی بیشتر از جمع‌آوری اطلاعات است و در واقع همه چیز به روابط انسانی مربوط می‌شود.

google ai performs better than doctors 1

یادگیری هوش مصنوعی برای انجام یک کار ظریف

تلاش های کمی جهت بررسی امکان استفاده از LLM در پزشکی صورت گرفته است که آیا این سیستم‌ها می‌توانند از توانایی پزشک برای گرفتن سابقه پزشکی فرد و استفاده از آن برای رسیدن به تشخیص تقلید کنند یا خیر. رادمن می گوید که دانشجویان پزشکی زمان زیادی را صرف آموزش برای انجام این کار می کنند. این یکی از مهم‌ترین و دشوارترین مهارت‌هایی است که باید در پزشکان تلقین شود.»

ویوک ناتاراجان، دانشمند تحقیقات هوش مصنوعی در Google Health در کالیفرنیا و یکی از نویسندگان این مطالعه می گوید: یکی از چالش های پیش روی توسعه دهندگان، کمبود مکالمات پزشکی در دنیای واقعی بود که برای استفاده به عنوان داده های آموزشی در دسترس بودند. محققان برای حل این چالش راهی را ابداع کردند تا این چت بات بتواند “مکالمات” پزشکی را بهتر آموزش ببیند.

محققان دور اولیه تنظیم دقیق LLM پایه را با مجموعه داده های موجود در دنیای واقعی، مانند پرونده الکترونیک سلامت و مکالمات پزشکی رونویسی شده انجام دادند. برای آموزش بیشتر این مدل، محققان LLM را ترغیب کردند که نقش یک فرد مبتلا به یک بیماری خاص و یک پزشک همدل را با هدف درک تاریخچه فرد و ایجاد تشخیص‌های بالقوه ایفا کند.

این تیم همچنین از مدل خواست تا یک نقش دیگر بازی کند: نقش منتقدی که تعامل پزشک با فرد تحت درمان را ارزیابی می کند و بازخوردی در مورد چگونگی بهبود این تعامل ارائه می دهد. این نقد برای آموزش بیشتر LLM و ایجاد دیالوگ های بهبود یافته استفاده می شود.

محققان این سیستم را با داشتن ۲۰ نفر آموزش دیده که وانمود می کنند بیمار هستند و از مشاوره های متنی آنلاین استفاده می کنند، آزمایش کردند. آنها این کار را با AMIE و ۲۰ پزشک تایید شده انجام دادند. شرکت کنندگان نمی دانستند که آیا آنها با یک انسان گفتگو می کنند یا با یک ربات!

بازیگران ۱۴۹ سناریوی بالینی را شبیه سازی کردند و سپس از آن ها خواسته شد تا تجربه خود را ارزیابی کنند. گروهی از متخصصان نیز عملکرد AMIE و پزشکان را ارزیابی کردند.

AMIE آزمون را با موفقیت گذراند

سیستم هوش مصنوعی در هر شش تخصص پزشکی در نظر گرفته شده با دقت تشخیصی پزشکان مطابقت داشت یا از آن ها پیشی گرفت. این ربات در ۲۴ معیار از ۲۶ معیار کیفیت مکالمه، از جمله ادب، توضیح شرایط و درمان، برخورد صادقانه و ابراز دقت و تعهد، از پزشکان بهتر عمل کرد.

کارتیکسالینگام می گوید: ” این به هیچ وجه به این معنی نیست که یک مدل زبانی در گرفتن تاریخچه بالینی بهتر از پزشکان است.” او اشاره می کند که پزشکان مراقبت های اولیه در این مطالعه احتمالا به تعامل با بیماران از طریق یک چت مبتنی بر متن عادت نداشتند، که ممکن است بر عملکرد آن ها تاثیر گذاشته باشد؛ در مقابل، یک LLM این مزیت را دارد که می تواند به سرعت پاسخ های طولانی و با ساختار زیبا را ترکیب بندی کند.

خواسته محققین : یک چت بات دقیق و بی طرف

او می گوید که گام مهم بعدی برای این تحقیق، انجام مطالعات دقیق تر برای ارزیابی سوگیری های بالقوه و اطمینان از عادلانه بودن سیستم در میان جمعیت های مختلف است. تیم گوگل همچنین در حال بررسی الزامات اخلاقی برای آزمایش این سیستم با انسان هایی است که مشکلات پزشکی واقعی دارند.

دانیل تینگ، دانشمند بالینی هوش مصنوعی در دانشکده پزشکی Duke-NUS در سنگاپور می گوید که بررسی سیستم برای سوگیری ها ضروری است تا مطمئن شویم که الگوریتم، گروه های نژادی را که به خوبی در مجموعه داده های آموزشی نشان داده نشده اند، مجازات نمی کند.

تینگ می گوید که حریم خصوصی کاربران چت بات نیز جنبه مهمی است که باید در نظر گرفته شود. او می‌گوید: «در حال حاضر برای بسیاری از این پلت‌فرم‌های مدل زبان بزرگ تجاری، ما هنوز مطمئن نیستیم که داده‌ها در کجا ذخیره می‌شوند و چگونه تجزیه و تحلیل می‌شوند.

منبع : nature.com