Китайские физики применили методы машинного обучения для прогнозирования успеха экспериментов по росту монокристаллов на основе выбранных условий. Точность алгоритма достигла 81 процента, в то время как сами ученые, на чьих данных система обучалась, правильно подбирали условия лишь в 36 процентах случаев. Применение такой системы позволит экономить ресурсы и время исследователей, пишут авторы в журнале Chinese Physics Letters.
Монокристаллы — это макроскопические кристаллические тела, структура которых представляет единую непрерывную решетку. Такие вещества обладают особыми свойствами, сильно зависящими от конкретного соединения и вида кристаллической решетки. Некоторые давно нашли применения в технике (в частности, современная электроника во многом зависит от монокристаллов кремния), а другие необходимы для проведения современных научных изысканий во многих областях, таких как нелинейная оптика и физика конденсированного состояния. Например, для исследования квантового эффекта Холла или вейлевских полуметаллов требуются высококачественные кристаллы.
Однако получение крупных монокристаллов, особенно в случае сложных соединений, исключительно трудно, так как процесс их роста зависит от многих факторов, таких как температура, соотношения элементов, потоки веществ и многое другое. Чрезвычайно сложным является процесс получения монокристаллов тернарных соединений, то есть состоящих из трех различных химических элементов. Это связано с частым отсутствием фазовых диаграмм для таких случаев, то есть зависимостей фаз и составов получающихся соединений от параметров.
Физики под руководством Хун Дина (Hong Ding) из Китайской академии наук решили облегчить работу экспериментаторов и создали автоматический способ, который позволят заранее определить, вырастет ли нужный кристалл в заданных условиях. Для этого они рассмотрели рост кристаллов тернарных соединений широко распространенным методом раствор-расплавной кристаллизации и обучили систему машинного обучения на данных реальных экспериментов.
Авторы использовали два набора экспериментальных данных (649 и 115 опытов), причем в них фигурировало 65 различных химических элементов. Данные включали температурные кривые роста, элементный состав и соотношения исходных реагентов, а также условия проведения опытов. Успешный опыт завершался получением монокристалла, в неуспешном формирования нужного соединения не происходило. Для обучения использовалось 75 процентов данных, а на остальных тестировалась работа алгоритмов.
Исследователи применили четыре метода машинного обучения: методы опорных векторов (SVM), дерева решений, случайного леса и градиентного бустинга деревьев решений. Каждый алгоритм был независимо протестирован и по итогам дерево решений использовалось для определения наиболее важных параметров при выращивании данного кристалла, а SVM использовался в качестве предсказателя — он смог достичь результата в 81 процент на тестовой выборке, в то время как ученые выбирали подходящие условия лишь в 36 процентах экспериментов. Авторы отмечают, что использование подобной методики может привести к значительной экономии средств, человеческих ресурсов и времени.
«Мы использовали модель, полученную применением дерева решений к обучающей выборке, для анализа важных факторов роста монокристаллов. На основе этой информации мы применяли SVM для прогнозирования успешности выращивания кристалла в данных лабораторных условиях, — говорит соавтор работы Юй-Цзе Сунь (Yu-Jie Sun). — Точность нашего подхода будет увеличиваться по мере накопления экспериментальных данных для обучающей выборки».
Ранее машинное обучение позволило нарисовать лица людей по голосу, предсказать зарплату, находить протопланетные диски и определять магнитное поле на дальней стороне Солнца. В целом об этом подходе к искуственному интеллекту мы говорили в материале Азбука ИИ: «Машинное обучение».
Тимур Кешелава