Исследователи разработали технологию изгибания коммерчески доступных матриц для камер. По сравнению с плоскими, такие матрицы теряют гораздо меньше света по краям, а также меньше подвержены влиянию аберраций. Работа специалистов из исследовательского подразделения Microsoft и компании HRL Laboratories опубликована в журнале Optics Express.
Человеческий глаз устроен таким образом, что изображение формируется на изогнутой сетчатке, расположенной на задней поверхности глаза. В отличие от глаза, камеры используют плоскую конструкцию матрицы или пленки. Для того чтобы сфокусировать изображение на плоской поверхности и устранить возникающие аберрации, инженеры используют сложные системы с несколькими линзами, которые увеличивают размер, вес и стоимость камер. Ранее уже были представлены прототипы изогнутых матриц, однако они имели низкое разрешение, а некоторые из них требовали сильной доработки технических процессов при производстве.
Ученые обошли эти ограничения с помощью технологии, которая позволяет изгибать существующие коммерчески доступные сенсоры с использованием относительно простого оборудования. Они изготовили специальную пресс-форму с нанесенным на нее тонким слоем клеящего вещества, в которую помещалась гибкая подложка с сенсором. На подложку прикреплялась тонкая мембрана. Полученная конструкция переносилась в аппарат, который постепенно увеличивал давление и прижимал подложку с мембраной к пресс-форме. В отличие от подхода, использованного в других работах, исследователи решили не закреплять подложку по краям. Это позволило им избежать концентрации механических напряжений в краях подложки, которые могли бы привести к ее повреждению. За счет этого ученые получили изогнутую матрицу с гораздо большей кривизной, чем в других работах.
Исследователи сравнили качество изображения, получаемого с помощью нового сенсора формата 1/2.3″ (6,1 × 4,6 миллиметра), с изображением, полученным с использованием профессиональной полнокадровой (36 × 24 миллиметра) фотокамеры. В тестах новый сенсор показал гораздо меньшее снижение резкости на краях и практически не зависящую от удаления от центра яркость изображения.
Ученые считают, что их метод производства изогнутых матриц полностью готов к использованию с помощью существующего оборудования и технологических процессов и позволит производить небольшие камеры с характеристиками на уровне профессионального оборудования.
В 2016 году был представлен прототип камеры, позволяющий менять угол обзора за счет гибких матрицы и линз.
Григорий Копиев
Он нажимает на кнопки сенсорных терминалов самообслуживания вместо пользователя
Инженеры разработали прототип устройства, которое помогает слабовидящим пользователям взаимодействовать с сенсорными экранами терминалов и торговых автоматов. Небольшой вращающийся вокруг своей оси робот под названием Toucha11y с камерой и выдвижным стилусом прикрепляется к экрану и распознает интерфейс, после чего передает информацию на смартфон пользователя. В результате пользователь, используя встроенные функции помощи смартфона выбирает нужные команды, а робот нажимает за него на соответствующие элементы интерфейса. Доклад представлен на конференции Conference on Human Factors in Computing Systems 2023. Многие торговые автоматы, терминалы самообслуживания и банкоматы сегодня оснащены сенсорными экранами. При этом они крайне редко оснащены голосовым управлением, что становится серьезным препятствием для слепых и слабовидящих — зачастую они не в состоянии воспользоваться устройствами без посторонней помощи. Инженеры из Мэрилендского университета во главе с Хуай Шу Пэном (Huaishu Peng) предложили способ решения этой проблемы в виде мобильного приложения и работающего с ним в паре небольшого робота под названием Toucha11y, который прикрепляется к экрану терминала. Робот массой 160 грамм оснащен тремя присосками для прикрепления к экрану терминала. Корпус может поворачиваться вокруг своей оси с помощью электромотора, а в верхней части размещена камера, наклоненная на 45 градусов вниз. Одноплатный компьютер Raspberry Pi Zero внутри отвечает за работу механики и за связь с сервером, на котором производятся вычисления. Чтобы начать работу с Toucha11y, пользователь закрепляет его на тачскрине терминала. После чего гаджет с помощью камеры делает три последовательных снимка с разницей 30 градусов. Эти фотографии загружаются на сервер, где происходит распознавание интерфейса с помощью алгоритмов компьютерного зрения и сравнение с предварительно размеченными данными из базы, в которой собрана информация о наиболее часто встречающихся интерфейсах терминалов разных производителей. Исходя из этого определяются координаты робота относительно экрана интерфейса. Далее алгоритм на сервере формирует соответствующее меню и отсылает его на мобильное приложение пользователя, которое может озвучивать информацию, доступную на экране, и принимать команды от пользователя. После выбора пункта меню пользователем робот сам нажимает на соответствующую кнопку на экране с помощью выдвижного стилуса. Он представляет собой токопроводящий указатель, закрепленный на стальной рулетке. Рулетка выдвигается на нужную дистанцию из нижней части робота с помощью электромотора, и когда ее конец с указателем оказывается над нужным элементом интерфейса, он активируется с помощью электрического импульса. Таким образом, робот отвечает за физическое взаимодействие с экраном, в то время как пользователь взаимодействует со своим персональным устройством, которое уже содержит необходимые инструменты для помощи слабовидящим. https://www.youtube.com/watch?v=dqfhE42zB1I Для тестирования концепции и дизайна прототипа разработчики пригласили семь слабовидящих испытуемых. Используя робота, они должны были выполнить задание — заказать через интерфейс терминала самообслуживания определенный напиток с дополнительной опцией в виде заданного уровня сахара. Все участники исследования успешно справились с заданием со средним временем около 90 секунд. Из существующих проблем устройства, авторы доклада отмечают перекрытие нужных пунктов меню основанием робота и привязанность к базе данных. Первая проблема может быть решена простым изменением позиции робота или разработкой основания, которое могло бы взаимодействовать с сенсорным экраном. Вторая решается регулярным обновлением базы данных актуальными интерфейсами, либо использованием установленной на большей высоте дополнительной камеры, захватывающей весь экран. В отличие от установленных в общественных местах терминалов, возможностей для взаимодействия с персональными гаджетами у слепых и слабовидящих пользователей гораздо больше. Например, в 2020 году компания Google представила встроенную экранную клавиатуру TalkBack с брайлевым шрифтом для устройств для операционных систем Android.