Разработка ИИ-инструмента для систематического просмотра научных статей, содержащих ИК-спектры нано- и микрочастиц нитрида бора
Аннотация
В данной работе представлен метод создания нейронной сети и его применение для изучения данных об оптических свойствах нано- и микрочастиц гексагонального нитрида бора. В частности, метод анализирует данные о поглощении электромагнитного излучения в инфракрасной области. В работе показано, как современные алгоритмы обработки естественного языка и глубокого обучения могут быть использованы для автоматизации поиска и анализа необработанных данных. В работе мы применяем глубинные нейросетевые модели, включая сверточную нейронную сеть (CNN) для анализа инфракрасных спектров и трансформаторы (SciBERT, ChemBERTa) для анализа текстовой информации. Мультимодальное обучение, объединяющее CNN и семантический анализ текстов, было разработано для обработки гетерогенных данных.
Ключевые слова
ИК-спектр; нитрид бора; необработанные данные; CNN; ChemBERTФинансирование
Russian Science Foundation grant: 25-23-00477
This is an open access article under the terms
of the CC BY-NC 4.0 license.
Metadata is available under the terms of the CC BY 4.0 license