Почему мы допускаем ошибки и как ИИ помогает этого избежать
Людям непросто удерживать внимание на нескольких вещах сразу, и необходимо время от времени отдыхать. При этом нередко нам все-таки приходится заниматься многими делами одновременно и трудиться на пределе возможностей организма. На помощь приходит ИИ, способный быстро обрабатывать гигантские массивы данных и при этом замечать мельчайшие детали. Рассказываем, как устроено человеческое внимание, почему мы теряем концентрацию и как алгоритмы помогают избегать ошибок там, где это критически важно, — в медицине.
Мы регулярно прибегаем к помощи алгоритмов — например, когда смотрим прогноз погоды, ищем билеты или просто хотим отдохнуть. Это такая же часть нашей жизни, как одежда и обувь, автомобили и смартфоны. Тем не менее искусственный интеллект, так глубоко проникший во все сферы нашей жизни, до сих пор может вызывать недоверие и страх. В проекте «ИИ спешит на помощь» мы рассказываем, на что способны современные технологии с использованием ИИ, где они приносят наибольшую пользу и почему не стоит бояться восстания машин. Материал подготовлен совместно с федеральным проектом «Искусственный интеллект» нацпроекта «Цифровая экономика».
В повседневной жизни под вниманием мы, как правило, подразумеваем сосредоточенное состояние человека — это слово используется как синоним бдительности (vigilance), возбуждения (arousal) или сконцентрированности (alertness).
Сконцентрированностью в научной литературе называют конкретное когнитивное состояние, при котором человек сосредоточен на решении задачи. Одним из признаков такого состояния является, например, гамма-ритмическая активность головного мозга.
Когда посреди рабочего процесса мы утрачиваем возможность сосредотачиваться на выполнении задач, чаще всего речь идет именно о потере концентрации. Любопытно, что при наличии мотивации этого не только не происходит, но даже наоборот — концентрация растет вместе с усложнением заданий.
Например, чем труднее уровни в тетрисе, тем выше уровень концентрации игрока: в начале игры он еще может уловить, что говорят по телевизору, но по мере роста сложности может и не заметить, когда его называют по имени. Этот феномен описан с помощью теста на ответ слухового отдела мозга. Исследователи показали, что в ответ на фоновый звук в стволе нейронов срабатывало меньшее количество нейронов, когда задача была трудной, и большее — если легкой. Иначе говоря, если человек работает со сложной задачей, наш мозг компенсирует это за счет увеличения концентрации — так нам удается поддерживать желаемый уровень производительности. Но почему мы все-таки теряем внимание, даже если полностью сосредоточены на задаче?
В большинстве случаев ответ на этот вопрос — это отсутствие реального интереса. Но существуют также и физиологические ограничители, например объем рабочей памяти (working memory capacity — WMC). Для того чтобы измерить этот показатель, исследователи комбинируют задачи запоминания и отвлекающие действия. Известно, что люди с высоким уровнем WMC меньше отвлекаются на фоновые звуки при выполнении сложных задач и лучше сохраняют концентрацию.
Человеческое внимание и концентрация в значительной степени управляются регуляторными центрами сна. К ним относится, например, супрахиазматическое ядро — главный генератор циркадных ритмов и регулятор выделения мелатонина в эпифизе. Помимо этого, в регуляции концентрации и внимания участвует дорсолатеральная префронтальная кора. У пациентов с синдромом хронической усталости, одним из симптомов которого является потеря концентрации, объем серого вещества в этом отделе головного мозга был снижен и успешно восстанавливался после когнитивно-поведенческой терапии.
Ключевую роль в биохимической регуляции сна и внимания отводят нейромедиатору аденозину. В процессе работы мозг расщепляет аденозинтрифосфат (АТФ) — одну из основных энергетических молекул нашего организма. При этом образуются молекулы АМФ, которые связываются с аденозиновыми рецепторами и вызывают сонливость. Часто мы пытаемся побороть ее с помощью кофеина. Он мешает АМФ связываться с аденозиновыми рецепторами и не вызывает их активацию. Эффекта сонливости не возникает, а наша бдительность и концентрация возрастают.
Однако в действительности регуляция циклов сна и бодрствования намного сложнее: разные отделы мозга реагируют на аденозин по-разному. К тому же существуют и другие медиаторы ЦНС, влияющие на регуляцию сна, например норадреналин или серотонин.
Как правило, в повседневной жизни человека окружает большое количество сигналов. Наш мозг защищает нас от сенсорной перегрузки и не обрабатывает их одновременно, и одним из способов защиты мозга можно назвать концентрацию — перераспределение ресурсов с неважных элементов на важные. В психологии такой механизм получил название селективного внимания. Именно он позволяет нам успешно ориентироваться в условиях большого количества информации.
Простейшей иллюстрацией селективного внимания можно назвать «эффект коктейльной вечеринки». Его суть заключается в способности человека выхватывать важную информацию (например, слышать собственное имя) в потоке шума. В 1953 году этот эффект был показан ученым Эдвардом Колином Черри на авиадиспетчерах, которые были способны услышать голос своего пилота среди гомона всех остальных. Кроме того, избирательное внимание связано со способностью детей воспринимать информацию.
Классический тест на селективное внимание — это тест Дэниела Симонса. Его можно пройти по этой ссылке.
По мере развития медиа и экономики внимания (attention economy) повсеместной стала медийная многозадачность. Как правило, человек работает сразу с несколькими потоками информации одновременно: проверяет рабочую почту, слушает музыку, переписывается в мессенджерах. Коммодификация нашего внимания привела к развитию клипового мышления — восприятию мира через короткие и яркие тезисы.
Для оценки медийной многозадачности используют метрику MMI (Media Multitasking Inventory), которая учитывает параллельные взаимодействия с различными медиа. В среднем молодые люди проводят около 7,5 часов в медиа, 30 процентов этого времени занимаясь мультитаскингом. Причем время, проводимое в медиа, растет с каждым годом. Оказалось, что люди с высоким уровнем медийного мультитаскинга работают хуже при выполнении задач, требующих устойчивого внимания, долговременной и кратковременной памяти или терпения. Более того, многозадачность в целом ассоциирована с повышенной утомляемостью и ухудшением качества работы.
Издержки мультитаскинга неизбежны: людям почти всегда требуется больше времени, чтобы выполнить задачу, если они параллельно работают над несколькими из них. И делают они это с большим количеством ошибок, что подтверждается как данными психологических исследований, так и данными фМРТ.
Современные компьютеры прекрасно справляются с несколькими задачами сразу. Объем рабочей памяти компьютера (WMC) эквивалентен его оперативной памяти (RAM) и в нынешних условиях ничем не лимитирован. Помимо этого, компьютеры способны к реальному мультитаскингу — параллельным вычислениям. Благодаря этому, не существует ни одной вычислительной формализуемой задачи, с которой человек бы справлялся лучше компьютера. Тем не менее для выполнения специфических задач машинам пришлось научиться человеческому механизму внимания.
Один из процессов, для которого характерна высокая концентрация, — это чтение. Во время чтения мы обращаем внимание на контекст слов. Например, человек может с легкостью понять, что в предложении «Ее коса была длинной и шелковистой» коса — это именно женская прическа, а не сельскохозяйственный инструмент. А вот для алгоритмов задача учета контекста, с которой люди справляются успешно, долгое время была серьезной проблемой. Они не умели учитывать омонимы, и даже небольшие отклонения от стандартных фраз из разговорника ставили автоматический переводчик в тупик.
Поэтому одной из ключевых вех в развитии машинного перевода можно назвать появление механизма внимания (attention). Принцип его работы можно описать так: при обучении модели с механизмом внимания добавляется еще одна идея, состоящая в том, что не все слова, которые используются в процессе обучения, имеют равный вес. Алгоритмы научили понимать, что существуют слова, которые практически не влияют на смысл предложения, например междометия или слова-паразиты. Люди не испытывают никаких сложностей при анализе таких предложений. Мы понимаем, что предложения «Пешеход переходит дорогу» и «Ну, э-э, пешеход типа переходит что-то типа дороги, что бы это ни значило» несут практически идентичную смысловую нагрузку. При этом мы не обращаем внимания на междометия и анализируем только ключевые слова. Так же ведут себя и модели машинного обучения, которые используют механизм внимания.
Значимая вариация механизма внимания — это механизм self-attention, который позволяет модели выучить закономерности между входными данными. Благодаря ему модель способна понимать, например, к какому элементу предложения относится местоимение. По мере того как модель обрабатывает каждое слово входного предложения, внутреннее внимание позволяет ей взглянуть на другие позиции входной последовательности и найти подсказку, которая помогает лучше закодировать то или иное слово.
Когда человек смотрит на изображение, его взгляд фокусируется на отдельных его частях, которые затем собираются мозгом в единую картинку. Движения глаз человека фиксируются с помощью специальных приборов — айтрекеров. Известно, например, что движения и фокус глаз меняются у профессиональных спортсменов по сравнению со спортсменами-любителями. Такого рода ограничениям не подвержен компьютер. При анализе изображений он воспринимает всю картинку целиком. Изображение при компьютерном анализе представляется в виде числовой матрицы, где каждый пиксель охарактеризован своим цветовым вектором — например, в классической RGB-палитре красный пиксель — это вектор с координатами [255, 0, 0]. Благодаря принципиально иному представлению данных компьютеры способны одновременно анализировать всю картинку целиком и не пропускать детали, которые может не заметить человек. На некоторых задачах анализа изображений компьютеры уже показывают результат лучше человеческого.
Наконец, существует закономерность, благодаря которой превосходство машин становится лишь вопросом правильной формализации: качество выполнения задач компьютером со временем будет только расти. Человек обладает конечными возможностями: объем его рабочей памяти, способность к концентрации и качество выполнения задач — константы, которые почти никак не изменяются с каждым следующим поколением. В отличие от людей, каждая следующая модель машинного обучения может использовать данные, полученные из предыдущей модели, а до стадии реального использования добираются только те модели, которые показали себя лучше предыдущих. Именно поэтому каждый доктор, который выпустится из медицинского университета, будет в среднем так же хорошо проводить диагностику, как и предыдущий, но каждая модель, которая будет создана и доведена до стадии использования, будет работать лучше своих предшественников.
Как мы выяснили, люди постоянно теряют концентрацию, и это нормально. Такова наша природа. Но, в отличие от нас, нейросети способны работать даже с рутинными задачами с постоянным «вниманием». И пока люди понемногу освобождаются от выполнения простых, но трудоемких обязанностей, там, где рутины не избежать, их заменяют алгоритмы.
Одна из индустрий, где человеческое внимание играет ключевую роль, — это здравоохранение. Инновации, связанные с искусственным интеллектом, добираются туда относительно медленно — там, где речь идет о жизни и здоровье человека, необходимо мириться со строгой государственной регуляцией. Тем не менее даже в такой консервативной области существуют разработки, которые уже используют преимущества цифровизации и машинного обучения, чтобы помогать врачам каждый день.
Так, например, перспективной областью считается лабораторная автоматизация — создание роботов, которые помогают ученым с выполнением ежедневных задач. Этим занимаются как крупные компании, например Thermo Fisher Scientific — крупнейший производитель реагентов и расходных материалов, так и совсем небольшие стартапы вроде Andrew Alliance.
Еще одна задача, которая под силу искусственному интеллекту, — это анализ изображений. Согласно последним данным, алгоритмы глубокого обучения справляются с этим не хуже, а иногда и лучше людей. Например, сервис MDDC Cardio, разработанный СберМедИИ, анализирует кардиограммы и позволяет быстрее провести расшифровку ЭКГ, а «КТ Инсульт» размечает на КТ-снимках головы зоны нарушенного кровообращения, которые встречаются при инсульте, и помогает оценить нанесенный ущерб. Цель таких алгоритмов, помимо прочего, — минимизировать вероятность врачебной ошибки.
К сожалению, при большой нагрузке даже самые опытные специалисты могут ошибаться. В связи с этим активно развиваются и системы поддержки принятия врачебных решений (СППВР). Иметь альтернативный источник информации полезно, особенно если это программа, которая работает с массивом данных о пациенте и обширной базой данных о патологиях. Помощник врача «ТОП-3» анализирует информацию, которую вводит врач на приеме из электронной карты или анамнеза пациента, и предлагает три наиболее вероятных диагноза. Некоторые научные группы и компании занимаются диагностикой заболеваний по гистопатологическим изображениям.
Одна из них — российская компания «Платформа Третье Мнение». Согласно данным исследования, которое провели эксперты в сфере онкологии и гематологии из НМИЦ ДГОИ им. Дмитрия Рогачева, глубокая сверточная нейросеть, обученная на выборке из 60 тысяч уникальных изображений, умеет обнаруживать более 100 типов клеток крови и костного мозга, характерных для различных типов лейкемии. Исследователи пришли к выводу, что медианная точность обнаружения варьируется от 83 до 95 процентов в зависимости от типа клеток.
Коллектив «Третье Мнение» разработал и применяет пул из девяти различных ИИ-сервисов, которые объединены в мультимодальную платформу. Нейросети анализируют как традиционные модальности, такие как рентген и КТ органов грудной клетки, так и экзотические по современным меркам виды исследований — снимки зубочелюстной системы (ортопантомограммы) и глазного дна. Последние проверяют на предмет наличия признаков глаукомы, диабетической и гипертонической ретинопатии.
Максим Папук, врач-рентгенолог, специалист Московского референс-центра лучевой диагностики рассказывает: «ИИ-алгоритмы постоянно усложняются, а их компетенции расширяются. Например, ИИ-сервис разработчиков „Третье Мнение“, который раньше использовался для обнаружения признаков пневмоний и других COVID-ассоциированных поражений на КТ грудной клетки, теперь обучили распознавать еще и признаки сердечно-сосудистых патологий: по наличию и объему коронарного кальция можно судить об атеросклеротическом поражении сосудов сердца, некий объем кардиального жира может являться предиктором кардиоваскулярного риска, а диаметр грудной аорты — говорить об аневризме аорты. Все эти признаки сервис компьютерного зрения уже может распознавать на серьезном уровне».
Благодаря искусственному интеллекту врачи могут беречь силы и уделять внимание действительно важным вещам, например общению с пациентами. По данным Института исследований государственной политики, применение ИИ и высоких технологий позволит высвободить более 25 процентов времени врачей (важно: самых разных клинических специальностей), которое можно будет потратить на работу с больными.
Не стоит переоценивать возможности искусственного интеллекта: машинное обучение — помощник, а не замена врачу. В основе отношений между пациентом и врачом лежат в том числе эмпатия и чуткость — то, что алгоритмы никогда по-настоящему не освоят. По мнению профессора молекулярной медицины, кардиолога и исследователя Эрика Тополя, работу с информацией о медицине и пациентах нужно передавать алгоритмам. На врачей ложится обязанность контролировать результат их работы, что требует высокой квалификации, но основным навыком медика должен быть развитый эмоциональный интеллект, умение общаться с людьми.
В книге «Искусственный интеллект в медицине» Тополь пишет: «Если вы когда-нибудь испытывали по-настоящему сильную боль, то знаете, каким одиноким и покинутым чувствует себя при этом человек: ведь никто не понимает, каково ему на самом деле, какое невыразимое отчаяние его захлестывает. Конечно, вас может успокоить любимый человек, друг или родственник, и это, безусловно, поможет. Но куда надежнее поможет больному, страдающему человеку поддержка со стороны врача, которому он доверяет и который укрепляет его веру в то, что все пройдет, что врач всегда будет рядом, что все будет хорошо. Именно такого человеческого участия, человеческой заботы мы жаждем, когда болеем. Именно эти отношения может помочь восстановить искусственный интеллект».