Выпускная квалификационная работа по курсу "DataScience" образовательного центра МГТУ им. Н.Э. Баумана
Задачи:
- Изучить теоретические основы и методы решения поставленной задачи.
- Провести разведочный анализ предложенных данных. Необходимо нарисовать гистограммы распределения каждой из переменной, диаграммы ящика с усами, попарные графики рассеяния точек. Необходимо также для каждой колонке получить среднее, медианное значение, провести анализ и исключение выбросов, проверить наличие пропусков.
- Провести предобработку данных (удаление шумов, нормализация и т.д.).
- Обучить нескольких моделей для прогноза модуля упругости при растяжении и прочности при растяжении. При построении модели необходимо 30% данных оставить на тестирование модели, на остальных происходит обучение моделей. При построении моделей провести поиск гиперпараметров модели с помощью поиска по сетке с перекрестной проверкой, количество блоков равно 10.
- Написать нейронную сеть, которая будет рекомендовать соотношение матрица-наполнитель.
- Разработать приложение с графическим интерфейсом или интерфейсом командной строки, которое будет выдавать прогноз, полученный в задании 4 или 5 (один или два прогноза, на выбор учащегося).
- Оценить точность модели на тренировочном и тестовом датасете.
- Создать репозиторий в GitHub / GitLab и разместить там код исследования. Оформить файл README.
Тема: Прогнозирование конечных свойств новых материалов (композиционных материалов).
Описание: Композиционные материалы — это искусственно созданные материалы, состоящие из нескольких других с четкой границей между ними.
При этом композиты являются монолитным материалом, т. е. компоненты материала неотделимы друг от друга без разрушения конструкции в целом.
Их свойства определяются входящими в них компонентами, но отличаются от свойств компонентов, взятых в отдельности.
Композиционные материалы состоят из матрицы (основы) и наполнителя.
Матрица связывает композицию и в большей степени определяет технологические режимы получения материала и его эксплуатационные характеристики: рабочую температуру, плотность, удельную прочность, предел усталости.
Наполнитель, как правило, имеет высокие значения прочности, твердости и модуля упругости — значительно большие, чем показатели матрицы. Поэтому наполнитель является армирующим или упрочняющим элементом.
Композиты обладают теми свойствами, которые не наблюдаются у компонентов по отдельности.
Даже если мы знаем характеристики исходных компонентов, определить характеристики композита, состоящего из этих компонентов, достаточно проблематично. Для решения этой проблемы есть два пути: физические испытания образцов материалов, или прогнозирование характеристик. Суть прогнозирования заключается в симуляции представительного элемента объема композита, на основе данных о характеристиках входящих компонентов (связующего и армирующего компонента). Созданные прогнозные модели помогут сократить количество проводимых испытаний, а также пополнить базу данных материалов возможными новыми характеристиками материалов, и цифровыми двойниками новых композитов.
Кейс основан на реальных производственных задачах Центра НТИ «Цифровое материаловедение: новые материалы и вещества» (структурное подразделение МГТУ им. Н.Э. Баумана).
Ход выполнения и результаты работы представлены в файлах: