Нейросеть распознает эстетически привлекательные фотографии

Елизавета Ивтушок

Разработчики Google представили NIMA — глубокую сверточную нейросеть, которая определяет самые качественные фотографии. Алгоритм ее работы, подробно описанный в блоге компании и препринте на arXiv.org, основывается на двух параметрах: технической составляющей фотографии и ее общей эстетике, оцененной человеком.

Современные технологии позволяют делать снимки отличного качества с помощью камеры смартфона и сопутствующих приложений для обработки изображений. Однако, настоящее качество фотоснимка определяется его эстетикой, которая заключается в правильной композиции и хорошо подобранном освещении — параметрах, автоматическое определение которых является сложной задачей. Ранее другая нейросеть Google, Creatism, научилась создавать эстетически качественные фотографии из снимков, сделанных камерами Google Street View.

Новая нейросеть, созданная Хуссейном Талеби (Hossein Talebi) и Пейманом Миланфаром (Peyman Milanfar) из Google Research, сможет определить лучшие фотографии из тех, которые пользователь сделал сам: NIMA (Neural Image Assessment) натренирована выбирать из серии снимков тот, который обычный пользователь-человек посчитал бы максимально качественными и эстетичными. Для обучения нейросети разработчики использовали базу данных AVA (Aesthetic Visual Analysis), содержащую около 200 тысяч фотографий, каждая из которых оценена профессиональными фотографами по шкале от 1 до 10. Исследователи обучили нейросеть угадывать рейтинг изображения на основе его анализа: NIMA правильно угадывала балл профессиональных фотографов-людей с точностью в 80 процентов.

В качестве тренировочной выборки NIMA использовала серию фотографий одного объекта (например, попугаев) и измененной яркостью или четкостью и ранжировала их по рейтингу, тем самым выбирая наиболее качественную.

По мнению авторов работы, такая нейросеть может использоваться в современных смартфонах: например, выбирать из серии сделанных пользователем фотографий лучшую или определять, какой фильтр или настройки цветопередачи подходят лучше всего.

Недавно разработчики из Бернского университета представили нейросеть для улучшения качества изображений: алгоритм на основа байесовского глубокого обучения может эффективно исправить даже размытые изображения.

Елизавета Ивтушок

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.

19:51 10.04.26 1.7 IT

Claude Mythos Preview оказалась слишком хороша в поиске уязвимостей

Anthropic отказалась от публичного релиза своей самой мощной большой языковой модели

Андрей Фокин

Anthropic решила не выпускать в открытый доступ Claude Mythos Preview — свою самую мощную на сегодняшний день большую языковую модель. Компания объясняет это тем, что модель продемонстрировала действительно выдающиеся способности в обнаружении и использовании уязвимостей в программном обеспечении, которые рано или поздно будут использованы не во благо, а наоборот. Подробности о новой модели опубликованы в ее системной карточке.