Немецко-французская компания LivingPackets представила новую версию умного почтового короба для посылок. В него встроен терминал с экраном на электронных чернилах, который отображает данные о посылке и разблокирует замок, а внутри расположены датчики для отслеживания состояния посылки, сообщает New Atlas.
На сегодняшний день почта стала гораздо технологичнее, чем она была еще несколько десятилетий назад. Например, многие операторы и транспортные узлы поддерживают системы отслеживания посылок и позволяют отправителю и получателю понимать, где примерно находится их посылка. В последние годы также сильно развивается сама технология доставки и в некоторых местах, в том числе в Подмосковье, уже работает доставка посылок роботами. Но сами посылки при этом изменились не так сильно и все еще представляют собой бумажные конверты, пластиковые пакеты или картонные коробки.
Компания LivingPackets создала более технологичный короб для посылок под названием THE BOX. Корпус имеет полимерную основу и внешний слой из вспененного полипропилена. Верхняя и одна из торцевых частей корпуса — это крышка, которую можно открыть, чтобы достать товар, или сложить, чтобы короб занимал намного меньше места.
На торце установлен большой экран на электронных чернилах и несколько кнопок для отправителя или получателя посылки. На экране отображаются электронная версия почтовой маркировки со штрих-кодами, адресом и прочими данными для почтовых работников и автоматических конвейеров. После того, как покупатель получил посылку, он может сдать ее, чтобы ее можно было использовать повторно до тысячи раз. При этом на короб не нужно клеить новую маркировку — вместо этого он самостоятельно меняет данные на дисплее.
В коробе установлены датчики температуры, ударов, влажности, давления и веса посылки, а также внутренняя камера, благодаря которым состояние посылки можно отслеживать в процессе доставки. Также в нее встроен микрофон и динамик, чтобы при возникновении вопросов получатель или работник почтовой службы могли связаться с отправителем. Наконец, в крышку встроен электромеханический замок, не дающий открыть короб посторонним людям.
Компания уже начала тестировать устройства вместе с несколькими курьерскими и почтовыми службами. Она планирует не продавать их, а предоставлять как услугу и брать плату за отдельные доставки.
В области доставки почты также происходит заметный прогресс. Например, с 2022 года в Свердловской области начнется испытания сервиса доставки почты и грузов с помощью беспилотных летательных аппаратов самолетного типа.
Григорий Копиев
Они распознают слова с 95-процентной точностью с помощью нейросети
Американские инженеры разработали очки, способные распознавать речь по движению губ пользователя. Для этого в оправу очков встроены два миниатюрных эхолокатора, которые получают информацию о малейших движениях губ и кожи лица, а алгоритм машинного обучения предсказывает произнесенные слова и команды почти с человеческой точностью. Доклад по результатам работы представлен на конференции CHI’23. Системы распознавания речи на основе мимики человека имеют большой потенциал практического применения. Они могут использоваться не только людьми с нарушениями речи, но и в тех случаях, когда говорить вслух становится невозможно, например, из-за сильного окружающего шума или в социально неприемлемых ситуациях. Многие существующие технологии распознавания речи по мимике используют в качестве входных данных видеоизображение. Однако для этого необходимо, чтобы перед лицом пользователя постоянно находилась видеокамера, что может быть не всегда удобно и безопасно. Кроме того, в этом случае эффективность распознавания зависит от условий освещения. Инженеры из Корнельского университета под руководством Чэня Чжана (Cheng Zhang) решили применить вместо видеокамер эхолокацию. Они создали технологию EchoSpeech, которая позволяет бесконтактным образом с помощью ультразвуковых волн отслеживать небольшие движения губ и кожи лица во время шепота. Разработанный прототип устройства представляет собой обычные очки, в нижней части оправы которых с одной стороны расположена пара звуковых динамиков, которые излучают непрерывные частотно-модулированные ультразвуковые сигналы. Отраженные от различных участков кожи лица и губ сигналы затем попадают на установленную с противоположной стороны очков пару микрофонов. Для того чтобы сигналы от каждого из двух динамиков можно было различить, частоты излучаемых сигналов отличаются. Множество отраженных звуковых сигналов образуют профиль эха — последовательность изменяющихся во времени кадров, которая содержит информацию о расстоянии до окружающих поверхностей, от которых отражается звук. Из этих данных отфильтровываются шумы и паразитные сигналы от фоновых объектов окружения, находящихся на удалении, чтобы выделить информацию, относящаяся только к лицу пользователя. После этого данные подаются на вход остаточной сверточной нейросети ResNet-18, предназначенной для классификации изображений, а затем в полносвязный декодер, на выходе которого получают набор меток, соответствующий словам из набора команд, использованных в процессе обучения. Для демонстрации возможностей создатели технологии выбрали 32 слова, соответствующие наиболее распространенным командам управления приложениями на смартфоне, а также слова, обозначающие десять цифр. В процессе тренировки пользователи должны были повторять появляющиеся на экране слова и последовательности цифр как сидя за столом, так и в процессе ходьбы, для того, чтобы создать условия, приближенные к реальному мобильному использованию устройства. Обученную на данных одних пользователей модель использовали в процессе обучения других. Это позволило снизить время, необходимое на настройку алгоритма под конкретного человека. Разработчики протестировали устройство в нескольких реальных сценариях. Например, они использовали прототип EchoSpeech в качестве дополнительного устройства ввода при взаимодействии с программами на смартфоне и планшете, а также для управления музыкальным плеером, запуская и переключая треки, меняя уровень громкости с помощью шепота. Уровень ошибок при распознавании отдельных слов составлял в среднем около 4,5 процентов в командах и 6,1 процента в непрерывных последовательностях из 3-6 цифр. Эти показатели сравнимы со значениями неверно понятых слов в общении между людьми. Помимо проводной версии устройства, которую для удобства использовали в большинстве тестов, была также создана беспроводная версия устройства, передающая данные на смартфон через модуль Bluetooth с низким энергопотреблением. EchoSpeech позволяет распознавать речь по движениям губ, однако ученые уже разрабатывают технологию нейроинтерфейса, которая позволит синтезировать речь непосредственно по данным активности головного мозга.