Виртуальный консилиум: искусственный интеллект оказался в 4 раза эффективнее врачей

Однако разработку пока рано называть революционной
YandexART
YandexART

Система медицинской диагностики на базе искусственного интеллекта AI Diagnostic Orchestrator (MAI-DxO) решила пощекотать нервы врачам общей практики. Последнее исследование показало, что модель способна выявлять сложные заболевания в 85,5% случаев, в то время как рядовые специалисты справляются лишь в каждом пятом. Но заменять врачей в обозримом будущем никто не собирается: ученые пока не знают, как нейросеть покажет себя в повседневных рутинных задачах.

В рамках эксперимента настоящие врачи и нейросети разбирали 304 запутанных клинических случая, описанных в научном журнале New England Journal of Medicine.

MAI-DxO превращает любую языковую модель в команду ИИ-врачей, которая может задавать уточняющие вопросы, назначать анализы или ставить диагноз, а затем проверять стоимость и обоснованность своих выводов. После этого такой виртуальный консилиум принимает решение о своих дальнейших действиях. Машина не только справилась с задачей в 4 раза эффективнее, но и затратила на это меньше ресурсов.

Честь биологической формы жизни в эксперименте защищали практикующие врачи с клиническим опытом от 5 до 10 лет – всего 21 человек из Великобритании и США. И в среднем они справились лишь с одной пятой всех случаев. Однако исследователи всё же высказались в пользу живых: ни один врач на Земле не может быть экспертом во всех сложных медицинских задачах, являясь специалистом более узкого профиля.

Но у нейросети такого ограничения нет, и она может использовать знания из любых областей медицины, выходя за рамки, привычные человеку. Такое продвинутое мышление может полностью изменить подход к здравоохранению, считают авторы научной работы.

Если же говорить об эксперименте в целом, то команда разработчиков признает, что в нем были ограничительные рамки. К примеру, рассматриваемые кейсы не включали здоровых людей или пациентов с легкими заболеваниями. Поэтому пока неясно, насколько часто такая модель будет выдавать ложные срабатывания, когда дело дойдет до рутины.

Кроме того, не учитывались такие факторы, как дискомфорт пациента, время ожидания, ограничения по страховке, доступность теста и задержки с получением результатов. Оценку же стоимости тестирования проводили и вовсе на основе усредненных показателей по США, игнорируя различия в стоимости для плательщиков, поставщиков услуг, систем здравоохранения и географии регионов.

Наконец, искусственный интеллект столкнули всё же с врачами общей практики и терапевтами, но не с высокими экспертами. Им даже не предоставили возможность пользоваться интернетом, хотя те, кто однажды дал клятву Гиппократа, на деле часто прибегают к руководствам, обращаются к коллегам за помощью и пользуются множеством других инструментов при постановке диагноза.