Компания Intel закроет подразделение, занимающееся созданием новых носимых устройств, и прекратит разработку умных очков Vaunt, которые она представила в начале года, сообщает The Verge. Они сильно отличались от других разработок в этой области тем, что выглядели как обычная оправа для очков и проектор в них был незаметен для окружающих.
Очки и шлемы дополненной реальности разрабатывают и серийно выпускают уже несколько десятков компаний. Они имеют разную конструкцию, к примеру, некоторые из них покрывают большую часть поля зрения обоих глаз, а другие, как Google Glass, выводят информацию лишь в небольшой части поля зрения одного глаза. Но, независимо от конструкции, у почти всех этих разработок есть заметный недостаток — они довольно массивны, непохожи на обычные очки и носить их не так удобно.
В начале февраля компания Intel представила ранний прототип очков дополненной реальности Vaunt. Их основное отличие от предыдущих разработок в этой области — они практически неотличимы от обычных очков. В основании правой дужки очков встроен небольшой лазерный излучатель, который проецирует изображение прямо на сетчатку пользователя. Предполагалось, что пользователи будут получать через очки уведомления и другую полезную информацию, например, подсказки от приложения-навигатора. Направление проектора калибруется таким образом, что человек видит эту информацию только когда специально смотрит в нижний правый угол — это сделано для того, чтобы не отвлекать и не раздражать пользователя постоянными уведомлениями.
Во время анонса очков в феврале Intel рассказала, что до конца года планирует выпустить версию для разработчиков. Теперь стало известно, что проект не будет реализован в виде серийного устройства для пользователей и разработчиков. Компания планирует закрыть свое подразделение New Devices Group, которое занималось разработкой носимых устройств для широкого круга пользователей, среди прочего будет свернут и проект умных очков Vaunt. Как отмечает The Verge, по-видимому, закрытие этого проекта связано с тем, что Intel не удалось договориться с производителями компонентов для очков, таких как оправы и линзы. Кроме того издание ссылается на официальное заявление Intel, в котором компания говорит, что иногда ей приходится принимать тяжелые решения, когда динамика рынка не позволяет проводить дальнейшие инвестиции в проекты.
Google, ставшая одним из первых крупных производителей очков дополненной реальности, в начала 2015 года прекратила развитие своего проекта Google Glass из-за низкого спроса, вызванного высокой ценой устройства. Но летом 2017 года она сначала выпустила первое за три года обновление изначальной версии очков, а через месяц после этого представила новую версию, предназначенную для применения в промышленности и здравоохранении. Она получила более современный процессор, больший экран и складную конструкцию.
Григорий Копиев
Они распознают слова с 95-процентной точностью с помощью нейросети
Американские инженеры разработали очки, способные распознавать речь по движению губ пользователя. Для этого в оправу очков встроены два миниатюрных эхолокатора, которые получают информацию о малейших движениях губ и кожи лица, а алгоритм машинного обучения предсказывает произнесенные слова и команды почти с человеческой точностью. Доклад по результатам работы представлен на конференции CHI’23. Системы распознавания речи на основе мимики человека имеют большой потенциал практического применения. Они могут использоваться не только людьми с нарушениями речи, но и в тех случаях, когда говорить вслух становится невозможно, например, из-за сильного окружающего шума или в социально неприемлемых ситуациях. Многие существующие технологии распознавания речи по мимике используют в качестве входных данных видеоизображение. Однако для этого необходимо, чтобы перед лицом пользователя постоянно находилась видеокамера, что может быть не всегда удобно и безопасно. Кроме того, в этом случае эффективность распознавания зависит от условий освещения. Инженеры из Корнельского университета под руководством Чэня Чжана (Cheng Zhang) решили применить вместо видеокамер эхолокацию. Они создали технологию EchoSpeech, которая позволяет бесконтактным образом с помощью ультразвуковых волн отслеживать небольшие движения губ и кожи лица во время шепота. Разработанный прототип устройства представляет собой обычные очки, в нижней части оправы которых с одной стороны расположена пара звуковых динамиков, которые излучают непрерывные частотно-модулированные ультразвуковые сигналы. Отраженные от различных участков кожи лица и губ сигналы затем попадают на установленную с противоположной стороны очков пару микрофонов. Для того чтобы сигналы от каждого из двух динамиков можно было различить, частоты излучаемых сигналов отличаются. Множество отраженных звуковых сигналов образуют профиль эха — последовательность изменяющихся во времени кадров, которая содержит информацию о расстоянии до окружающих поверхностей, от которых отражается звук. Из этих данных отфильтровываются шумы и паразитные сигналы от фоновых объектов окружения, находящихся на удалении, чтобы выделить информацию, относящаяся только к лицу пользователя. После этого данные подаются на вход остаточной сверточной нейросети ResNet-18, предназначенной для классификации изображений, а затем в полносвязный декодер, на выходе которого получают набор меток, соответствующий словам из набора команд, использованных в процессе обучения. Для демонстрации возможностей создатели технологии выбрали 32 слова, соответствующие наиболее распространенным командам управления приложениями на смартфоне, а также слова, обозначающие десять цифр. В процессе тренировки пользователи должны были повторять появляющиеся на экране слова и последовательности цифр как сидя за столом, так и в процессе ходьбы, для того, чтобы создать условия, приближенные к реальному мобильному использованию устройства. Обученную на данных одних пользователей модель использовали в процессе обучения других. Это позволило снизить время, необходимое на настройку алгоритма под конкретного человека. Разработчики протестировали устройство в нескольких реальных сценариях. Например, они использовали прототип EchoSpeech в качестве дополнительного устройства ввода при взаимодействии с программами на смартфоне и планшете, а также для управления музыкальным плеером, запуская и переключая треки, меняя уровень громкости с помощью шепота. Уровень ошибок при распознавании отдельных слов составлял в среднем около 4,5 процентов в командах и 6,1 процента в непрерывных последовательностях из 3-6 цифр. Эти показатели сравнимы со значениями неверно понятых слов в общении между людьми. Помимо проводной версии устройства, которую для удобства использовали в большинстве тестов, была также создана беспроводная версия устройства, передающая данные на смартфон через модуль Bluetooth с низким энергопотреблением. EchoSpeech позволяет распознавать речь по движениям губ, однако ученые уже разрабатывают технологию нейроинтерфейса, которая позволит синтезировать речь непосредственно по данным активности головного мозга.