На что способен Deep Research и как он повлияет на науку
Мнение редакции может не совпадать с мнением автора
В декабре 2024 года Google представила инструмент
Загрузка галереи
До этого пользователи могли попросить ChatGPT или другого чат-бота составить отчет со ссылками на источники, но в ответ получали в лучшем случае поверхностный обзор ссылок первой страницы поисковой выдачи. В чем же ключевое отличие Deep Research, и почему он появился только сейчас?
Для начала вспомним, что такое большие языковые модели (large language models, LLMs). Если вкратце, это нейросети, обученные генерации связного текста (подробнее об этом мы рассказывали в материале «И целого интернета мало»). Важно, что их ответы основаны на информации, которая использовалась для обучения. Из-за этого LLM знает только о том, что произошло до момента ее релиза. Например, нашумевшие в декабре 2024 года модели DeepSeek без режима поиска в интернете на момент написания текста ограничены в знаниях июлем 2024 года.
Казалось бы, чтобы устранить этот недостаток, нужно всего лишь научить модель пользоваться поисковиком. Но современные LLM только недавно начали выходить в интернет и воспринимать визуальную информацию. К примеру, это может модель o3, которую компания OpenAI выпустила 31 января 2025 года. Одна из ключевых особенностей модели o3 и ей подобных — способность планировать. Она разбивает алгоритм решения задачи на этапы и последовательно их выполняет, а в промежутках между ними оценивает результат на соответствие запросу пользователя. Это существенно повышает полезность ее ответа, но увеличивает задержку.
Такой подход, названный «цепочкой мыслей» (chain-of-thought), позволил научить модели рассуждать и реализовать Deep Research. Но если o3 — это всего лишь базовая языковая модель, которая обладает такой способностью, то Deep Research — уже специализированная настройка для многоступенчатых исследовательских задач, которую можно назвать ИИ-агентом (то есть автономной программой).
Именно агентность позволяет новому инструменту лучше ориентироваться в информационном пространстве поиска. Современные агенты работают с разными типами данных: кодом, изображениями, текстом и так далее. Автономные программы могут существовать как отдельно, так и в комплексе. Так устроен, например, AI co-scientist — многоагентный ИИ от Google, который помогает в генерации новых научных гипотез и составлении протоколов будущих экспериментов. Каждый из агентов основан на модели Gemini 2.0, но выполняет разные функции благодаря отдельным инструкциям, инструментам и очередности, по которой подключается каждая модель.
Загрузка галереи
Deep Research полезен, если нужно принять решение на основе большого количества данных. Он может справиться с информацией из разных сфер: от маркетинга и финансов до обзора литературы для научной статьи или диссертации. Например, Фелипе Миллон (Felipe Millon), глава отдела продаж для госсектора в OpenAI, рассказал, как пользовался Deep Research для анализа медицинских данных. У супруги Миллона обнаружили рак груди. После мастэктомии и химиотерапии встал вопрос о применении лучевой терапии, однако мнения специалистов разделились.
Пользуясь ранним доступом к Deep Research, Миллон загрузил в ChatGPT полный файл с гистологическим исследованием удаленных тканей и приложил персональную информацию о жене, в том числе возраст и генетические факторы. После этого он попросил модель оценить риски применения лучевой терапии. В отчете, который составил Deep Research, не только повторялись мнения врачей, но и содержались ссылки на дополнительные исследования, имеющие отношение к информации об индивидуальных особенностях пациентки. Миллон утверждает, что отчет помог супругам увереннее принять решение. Правда, какое именно, он не уточнил.
Специалисты из Google попробовали применить свой многоагентный ИИ в научных целях. У себя в блоге они рассказали о серии экспериментов по трем разным биомедицинским задачам.
В первом эксперименте система перебирала перечень одобренных препаратов, которые могли бы оказать положительный эффект при лечении острого миелоидного лейкоза. Одно из веществ, которое применяется для лечения другого вида рака, ИИ посчитал многообещающим кандидатом для клинических испытаний. Вторая задача заключалась в поиске новых мишеней со значительной антифиброзной активностью в органоидах печени человека. Наконец, в третьем исследовании ИИ сформировал гипотезы, которые могли бы объяснить эволюцию переноса бактериальных генов, связанных с устойчивостью к противомикробным препаратам.
Эксперименты с AI co-scientist уже повлияли на научный прогресс. Его создатели анонсировали научную статью по результатам поиска эпигенетических мишеней, которую они планируют опубликовать вместе с коллегами из Стэнфорда. А одна из гипотез эволюции генов совпала с мнением ученых из Имперского колледжа в Лондоне. Авторы подчеркивают, что препринт лондонских коллег, где они описали свои гипотезы, вышел лишь на день раньше поста в блоге Google, поэтому статья не могла быть найдена ИИ-системой в интернете или попасть в обучающую выборку. Один из авторов исследования, биолог Хосе Пенадес (José Penadés), был настолько шокирован этим фактом, что некоторое время подозревал коллег из Google в несанкционированном доступе к своему компьютеру.
Было бы интересно посмотреть, как Deep Research и его аналоги справляются с задачами не только в медицине, но и в других областях. Например, способен ли ИИ-агент строить новые теории в физике? Пока реальных кейсов нет — только спекуляции.
Тем не менее, уже сейчас ученые могут использовать инструмент для рутинных задач. Например, для научной статьи мне понадобилось сделать литературный обзор работ последних лет по одной, существенно «остывшей» для физики теме. Deep Research от Perplexity, которым сейчас можно пользоваться бесплатно, нашел с полдюжины релевантных работ, сэкономив мне несколько дней работы. Часть этих статей я, вероятно, мог бы даже пропустить из-за несовпадающих формулировок и смежности тематик. Кроме того, я опробовал Deep Research от ChatGPT. Сегодня это не самый удобный для России инструмент, поскольку он доступен только платным подписчикам, но им я также остался доволен. А вот функция Deep Search, которая открыта для всех пользователей X в чате с Grok 3, вопреки запросу, снабдила меня устаревшими ссылками.
На текущий момент Deep Research не способен читать платные статьи — только препринты и Open Access. Поэтому всегда имеет смысл проверить, кто цитирует эту работу и на какие источники ссылаются авторы. Зато инструмент может оценить тематику журнала. И если, к примеру, описать тему исследования и спросить, в какие журналы можно отправить статью, рекомендации будут вполне разумными. Кроме того, полезно использовать сразу несколько инструментов от разных компаний. Энтузиасты, активно изучающие возможности Deep Research, уже составляют практические советы, которые помогают повысить эффективность этого инструмента. Имеет смысл к ним прислушаться.
Наконец, не стоит целиком полагаться на ИИ-помощника — следует самостоятельно верифицировать результаты поиска. Работу делает LLM, а потому, несмотря на все старания разработчиков, есть шанс столкнуться с галлюцинациями и ошибками (подобный кейс описан тут).