Google открыл доступ к своим разработкам в области компьютерного зрения

Схема распознавания объектов.

Кадр: Google Cloud Platform / YouTube

Компания Google выпустила API сервиса компьютерного зрения Cloud Vision. Использование API позволит реализовать распознавание различных объектов даже в проекте с небольшими вычислительными мощностями. Об этом сообщается в официальном блоге облачных сервисов Google.

При помощи Cloud Vision API разработчики могут реализовать в своих проектах чтение письменного текста, распознавание предметов, логотипов, человеческих лиц и достопримечательностей. Кроме того, облачный сервис помогает распознать небезопасные изображения (аналог Google SafeSearch в поиске изображений) и некоторые базовые эмоции человека: злость, радость, удивление.


Для демонстрации возможностей API представители компании показали несколько примеров на простом колесном роботе на базе Raspberry Pi. В частности, робот показал способность распознавать различные объекты и называть их вслух. Кроме того, в опубликованном ролике робот подъезжает ближе к человеку, если видит улыбающееся лицо.

Ранее, в ноябре 2015 года, доступ к своему сервису распознавания эмоций открыла Microsoft. Сервис, разработанный в рамках Project Oxford, распределяет условные «баллы» от одного до десяти между грустью, злостью, отвращением, презрением, страхом, счастьем, и удивлением.

Николай Воронцов

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.