Нейронную сеть для автоматической обработки данных создали в Новосибирске
Модель глубокого машинного обучения для автоматической обработки спектров рентгеновской фотоэлектронной спектроскопии разработали в НГУ. Сейчас идет работа над графическим интерфейсом сервиса.
Нейронную сеть для автоматической обработки данных, полученных методом рентгеновской фотоэлектронной спектроскопии (РФЭС), разрабатывает студент 4 курса ФЕН НГУ Артем Вахрушев.
Как рассказали в пресс-службе НГУ, РФЭС — полуколичественный спектроскопический метод исследования элементного состава, химического и электронного состояния атомов на поверхности изучаемого материала, основанный на явлении внешнего фотоэффекта. Спектры РФЭС получают с помощью облучения материала пучком рентгеновских лучей с регистрацией зависимости количества испускаемых электронов от их энергии связи. РФЭС — один из самых распространенных спектроскопических методов в катализе, материаловедении, физике полупроводников и др.
С открытием ЦКП «Сибирский кольцевой источник фотонов» объем данных значительно увеличится, а инструментов для их автоматической обработки до сих пор нет. И мы решили впервые доверить решение этой проблемы нейросетям. Задачи обработки спектров могут быть решены методами глубокого машинного обучения, так как модели нейронных сетей способны обрабатывать такие неструктурированные данные, как изображения и последовательности сигналов, находя в них закономерности и оптимизируя ручной труд. <...> Для обучения модели мы использовали синтетические данные. <...> Затем мы разработали алгоритм для постобработки результатов анализа модели, — рассказал Артем Вахрушев.
Выяснилось, что разработанный подход хорошо согласуется с результатами ручного анализа. Разработка архитектуры модели, обучение и тестирование были выполнены с помощью PyTorch на Python. А так как архитектура была оптимизирована для быстрого вывода, то процесс обработки спектра теперь занимает менее секунды на домашнем ноутбуке (сейчас на описание одного спектра у научного сотрудника уходит порядка 10 минут).
В настоящее время нейросетевая модель есть только в виде кода, что неудобно для потенциальных пользователей. Поэтому сейчас идет разработка ее графического интерфейса. Также планируется создать потоковую обработку большого количества спектров, чтобы программа могла выводить динамику изменения состава исследуемой поверхности.