Наименее точными были оценки содержания белка
Тайваньские, малайзийские и индонезийские исследователи дали ChatGPT версий 3,5 и 4 задание привести на китайском и английском языках информацию о пищевой ценности восьми меню, составленных из 222 продуктов. Оба чат-бота практически не уступили по точности оценкам профессиональных диетологов. Отчет о работе опубликован в журнале JAMA Network Open.
С распространением интернета люди все чаще полагаются на него в поиске данных о пищевых продуктах. При этом, как показал систематический обзор, почти в половине исследований качество (48,8 процента) и точность (48,9 процента) этой информации оцениваются как низкие. В последнее время в электронном здравоохранении начали использовать чат-боты на основе генеративных моделей, и уже появились работы, которые могут предоставить медицинскую информацию, но не ответы на вопросы, связанные с питанием.
Чтобы восполнить этот пробел, исследователи из Тайваня, Малайзии и Индонезии под руководством Жунсу Чжан (Jung-Su Chang) из Тайбэйского медицинского университета в сентябре-октябре 2023 года попросили ChatGPT версий 3,5 и 4 предоставить информацию о пищевой ценности восьми дневных меню из пяти приемов пищи для взрослого человека, содержащих в сумме 222 продукта. Во всех случаях запрос был сформулирован следующим образом «В качестве диетолога нарисуй, пожалуйста, таблицу для построчного расчета содержания энергии (в килокалориях) / углеводов (в граммах) / липидов (в граммах) / белков (в граммах) в следующих пищевых продуктах (сырых, без кулинарной обработки)».
О постоянстве ответов чат-ботов судили по коэффициенту вариации для каждого продукта в ходе пяти последовательных запросов. Для проверки точности ответы сопоставляли с оценками профессиональных диетологов, основанными на базе данных состава пищи Тайваньского управления по продуктам и лекарствам. Ответы в пределах ±10 процентов от эталонных значений по энергетической ценности и ±20 процентов по массе нутриентов засчитывали как точные. Статистическую обработку данных проводили с помощью парного t-теста Стьюдента.
Значимых различий в профессиональных и нейросетевых оценках содержания энергии, углеводов и жиров не было, однако в отношении содержания белка они наблюдались. Оба чат-бота предоставляли точную информацию по энергетической ценности в пределах 10-процентных отклонений значения с коэффициентом вариации менее 10 процентов для 35–48 процентов из запрошенных 222 продуктов. Нейросеть ChatGPT 4 в целом справлялась с задачей несколько лучше, чем ChatGPT 3,5, но завышала оценку содержания белка.
Хотя чат-боты по своей природе вероятностны, результаты этого кросс-секционного исследования указывают на то, что они могут быть полезны и удобны для людей, которые хотят получить информацию о пищевой ценности продуктов в реальном времени без доступа к нутриционисту-диетологу, заключают авторы работы. Они также отмечают, что в настоящее время возможности чат-ботов давать персонализированные советы по питанию (такие, как состав рациона и размеры порций) ограничены. Исследователи также напоминают, что языковые модели — это не поисковые системы, и на их ответы могут влиять язык ввода, четкость запроса и программная среда чата.
В 2021 году аргентинские исследователи продемонстрировали, что восьминедельное общение со специализированным интегративно-психотерапевтическим чат-ботом Tess может облегчить у студентов проявления тревожных состояний.
Но стабильного дозозависимого эффекта терапии обнаружить не удалось
Исследователи из США провели первые клинические испытания сонодинамической терапии глиом на людях. Они показали относительную безопасность метода, но подтверждение эффективности, обнаруженной в моделях на мышах, получить не удалось. Результаты были опубликованы в журнале Science Translational Medicine.