1. 서 론
2. 학습 데이터 생산 및 기계학습 알고리즘 설계
2.1 데이터 준비
2.2 합성곱 신경망
3. 전이학습 프레임워크
3.1 시멘트풀 공극분포특성
3.2 선행학습 및 전이학습 결과
4. 결 과
5. 결 론
1. 서 론
최근에는 재료의 개발 및 물성 예측을 위해 머신러닝 알고리즘을 적용한 연구가 증가하고 있다(Butler et al., 2018; Takahashi and Tanaka, 2016). 기계학습 관점에서 재료 특성 예측 문제는 예측 대상 특성이 일반적으로 재료 미세구조의 분포 특성과 같은 수치적 요소이기 때문에 대부분 회귀문제이다(Ziletti et al., 2018). 머신러닝 알고리즘을 설계할 때 우선적인 고려사항은 알고리즘이 재료의 특성과 관련된 많은 정보를 포함하는 것이며, 일반적으로 사용되는 정보에는 재료의 구조 정보가 포함된다(Seko et al., 2018; Swann et al., 2018). 또한, 알고리즘은 물리적 또는 화학적 관점에서 일정한 해석 가능성을 가져야 한다(Ghiringhelli et al., 2015). 본 연구는 위의 사항을 고려하여 기계학습을 이용해 시멘트풀의 미세구조를 기반으로 재료의 응답을 예측하는 기법을 제시하였다.
본 연구에서는 시멘트풀의 미세구조와 재료의 응답간의 상관관계 도출을 위해 micro-CT 이미지와 2D 직접인장 시뮬레이션 결과를 사용하였다. 가상실험을 통해 시멘트풀 미세구조의 인장강도를 계산하고, 이를 기계학습의 Convolutional Neural Networks(CNN)를 활용하여 미세구조 이미지와의 상관관계를 학습하였다. Kim 등(2022)은 micro-CT 이미지를 기반으로 미세구조를 특성화하여 물성을 예측하는 방법을 제시하였으나 많은 시간과 노력이 요구된다. 본 연구에서는 CNN 알고리즘에 시멘트풀의 micro-CT 이미지를 입력했을 때 해당 시멘트풀의 미세구조가 가지는 인장강도를 출력하도록 알고리즘을 구성하고, 학습이 완료된 알고리즘의 은닉층(hidden layer)을 시각화함으로써 알고리즘이 미세구조로부터 물성을 예측하는 과정을 확인하였다. 이때 시멘트풀의 공극분포특성(Chung et al., 2018)을 활용한 전이학습(transfer learning; Cetinic et al., 2018)을 통해 학습의 정확도를 향상시키고 미세구조-물성 간 상관관계를 분석하였다.
2. 학습 데이터 생산 및 기계학습 알고리즘 설계
2.1 데이터 준비
W/C 비율이 0.3, 0.4, 0.5, 0.6인 일반 포틀랜드 시멘트로 제작한 시멘트풀 시편의 micro-CT 이미지를 기계학습의 인풋 이미지로 사용하였다. Micro-CT는 포항가속기연구소(PAL)의 싱크로트론(synchrotron) 장비를 사용하여 에너지 준위 25keV로 촬영하였다. 0.65µm 해상도의 이미지를 단면의 도메인 크기가 1.7 × 1.7mm2(2580 × 2580pixels), 시편의 높이방향으로 총 2000장이 되도록 촬영하였다. 촬영한 3D 이미지는 학습의 인풋 이미지로 사용할 수 있도록 224 × 224pixels의 2D 이미지로 분할하였다(Fig. 1).
일반적으로 micro-CT 이미지는 회색조(grayscale) 값으로 구성된다. 회색조 값은 재료의 특성 값인 선형감쇠계수(linear attenuation coefficient, LAC)를 이미지로 시각화하기 위해 변환된 값이다. LAC 값은 재료의 밀도 및 화학 조성과 같은 재료(상) 특성과 micro-CT를 촬영하는 에너지 준위 등에 따라 달라지는 값으로, 재료의 상 특성을 반영하게 된다. 시멘트풀의 공극과 고체 상은 밀도와 화학 조성에서 큰 차이를 보이기 때문에 micro-CT 이미지의 LAC 분포로부터 시멘트풀의 공극 상과 고체 상의 상 분리 임계값(threshold)을 계산하면(Kim et al., 2019a, 2019b) 두 상을 분리할 수 있다. 시멘트풀의 거동은 공극 상과 고체 상의 특성에 큰 영향을 받는 것으로 알려져 있다(Pichler et al., 2014). 시멘트풀의 역학적 특성을 평가하기 위해 가상실험을 수행했으며, 이를 위한 메쉬(mesh)를 생성하기 위해 시멘트풀을 공극과 고체 상으로 구분했다. 공극과 고체 상으로 이진화된 미세구조는 Fig. 2와 같이 가상실험을 위한 메쉬로 변환된다(Wu, 2019). 메쉬의 경계(boundary)에서 발생하는 응력집중 현상을 줄이기 위해 경계로부터 메쉬 길이의 5%를 공극이 없는 고체로 가정했다. 2D 직접인장 가상실험을 통해 시멘트풀의 인장강도를 평가하였으며, 가상실험은 phase-field fracture model(Miehe et al., 2015)에 기반하여 수행되었다. Phase-field fracture model은 균열의 생성과 진전을 균열의 확산성(crack diffusivity, )에 따른 균질화된 균열로 가정한다. 가상실험을 위해 다음과 같은 입력 매개변수가 필요하다: 탄성계수(), 포아송비(𝜈), 파괴강도(), 균열 확산 길이 매개변수(). 이 중 와 는 나노인덴테이션 실험(Kim et al., 2022)을 통해 결정하였다. 시멘트풀의 𝜈는 0.2로 가정하였고 은 요소 크기의 두배로 결정하였다(Miehe et al., 2010). 가상실험을 통해 평가한 시멘트풀의 인장강도(Fig. 3)는 기계학습의 라벨(목표로 하는 학습 데이터의 속성)로써 사용되었다. 학습을 위해 16,000개의 서로 다른 시멘트풀 미세구조에 대해 가상실험을 수행하였으며, 이 중 12,000개의 가상실험 결과를 학습 데이터(training set), 4,000개의 가상실험 결과를 시험 데이터(test set)로 사용하였다.
2.2 합성곱 신경망
합성곱 신경망(convolutional neural network, CNN)은 이미지 인식에 주로 사용되는 신경망이다. 최근 AlexNet(Krizhevsky et al., 2012), VGG(Simonyan and Zisserman, 2014), GoogleNet (Szegedy et al., 2015), ResNet(He et al., 2016)과 같은 여러 아키텍쳐(architecture)가 제안되었으며, 이는 객체 감지 및 분류에서 높은 성능을 보여주었다. 이러한 아키텍쳐들은 성능 향상을 위해 합성곱 레이어(convolutional layer), 풀링 레이어(pooling layer)와 비선형성(non-linearity)을 공통적으로 활용한다.
합성곱 레이어는 인풋 이미지를 필터링을 통해 특징 맵(feature maps)으로 변환한다. 학습단계에서 합성곱 레이어의 필터가 가지는 매개변수는 학습 라벨과 예측 값 사이의 평균 제곱 오차를 줄이기 위해 점진적으로 수정된다. 풀링 레이어는 특징 맵을 수신하고 차원을 축소시킨다. 가장 많이 활용되는 풀링 레이어는 정해진 구역 안에서 가장 큰 값만을 사용하는 맥스 풀링(max pooling)이다. 풀링연산은 일정 영역 안의 인접한 픽셀들만을 대상으로 진행되기 때문에 인풋 이미지가 미세하게 달라지더라도 출력을 거의 일정하게 유지시켜 준다. 심층 CNN은 다수의 합성곱 레이어과 풀링 레이어로 구성된다. 인풋 이미지가 다수의 레이어를 통과하는 과정에서 더 좋은 특징공간으로 변환시키기 위해 ReLU(rectified linear unit)와 같은 비선형 함수를 추가해 주어야 한다. 가장 단순한 비선형성 중 하나인 ReLU() = max(,0)는 > 0일 때 기울기가 항상 1이기 때문에 기울기 하강법(gradient descent method)을 사용하여 CNN의 매개변수를 최적화할 때 매우 효율적이다(Goodfellow et al., 2016). 일반적으로 ReLU는 합성곱 레이어 뒤에 추가된다. 합성곱 계층의 최종 레이어로는 완전 연결 레이어(fully connected layer)가 사용된다. 합성곱 레이어는 원본 이미지에서 스칼라화된 특징을 추출하는 역할을 하는 반면, 완전 연결 레이어는 이러한 특징을 사용하는 비선형 회기모델 역할을 한다. 본 연구에서는 Table 1과 같은 ResNet50에 기반한 CNN 아키텍처를 구축하여 사용하였다.
Table 1.
Architecture of CNN based on ResNet50
일반적으로 합성곱 레이어의 필터는 학습 전에 미리 정의되지 않고 학습 데이터에 의해 학습된다. CNN은 효과적인 모델을 구현하기 위해 많은 양의 데이터 확보를 가정하고 있기 때문에 데이터 확보가 제한된 상황에서는 결과가 안 좋아지는 과적합(overfitting) 문제가 발생할 수 있다(Thanapol et al., 2020).본 연구에서 사용한 모델의 파라미터 수는 약 2,300만 개인 반면 학습 데이터 수는 12,000개로 상대적으로 적은 학습 데이터를 사용하였다. 학습에 사용되는 라벨(시멘트풀의 인장강도)을 가상실험을 통해 계산하기 때문에 많은 시간이 소요되어 학습 데이터 생산에 한계가 있었다. 제한된 데이터 상황에서 기계학습 시 발생하는 과적합 문제를 방지하기 위해 데이터 증식 (data augmentation)과 같은 방법이 활용되고 있지만, 시멘트풀 미세구조를 확대 또는 회전시킬 경우 인장강도 또한 다시 계산되어야 하기 때문에 사용하기 어렵다. 본 연구에서는 적은 데이터로 인해 발생한 과적합 문제를 해결하기 위해 전이학습을 사용하였다.
3. 전이학습 프레임워크
전이학습은 기존에 학습되어져 있는 모델의 일부 가중치(weight)를 기반으로 새로운 목적에 맞게 학습을 파인튜닝(fine- tuning) 하는 방법을 말한다. 본 연구의 라벨 데이터인 시멘트풀 인장강도는 가상실험을 통해 많은 시간을 들여 계산해야 하지만, 시멘트풀 미세구조의 공극분포특성은 micro-CT 이미지로부터 직접적으로 계산이 가능하여 소요되는 시간이 적다. 따라서 약 19만 개의 서로 다른 미세구조에 대해 학습 데이터를 생산할 수 있었다. 시멘트풀의 공극분포특성이 기계적 물성과 상관관계가 있음은 다수의 선행 연구를 통해 밝혀졌다(Ma et al., 2014; Maruyama et al., 2014). 공극분포특성을 라벨 데이터로 가지는 모델을 선행학습(pre training)한 뒤 해당 모델을 기반으로 인장강도 예측모델을 전이학습 한다면, 데이터 수가 적은 인장강도 예측모델의 과적합 문제를 해결할 수 있을 것으로 가정하였다.
3.1 시멘트풀 공극분포특성
선행학습을 위한 시멘트풀의 공극분포특성 값으로는 공극률(𝜙)과 공극연속성 계수()를 사용하였다(Han et al., 2018). 𝜙는 시멘트풀의 물성에 영향을 미치는 주요한 매개변수로 알려져 있어 물성 예측의 파라미터로 종종 사용된다. 은 𝜙만으로는 나타나지 않는 상군집 정도를 스칼라로 표현한 값이다. 확률분포 함수인 lineal-path function, 은 길이가 인 임의의 선분전체가 특정 상의 내부에 위치할 확률을 의미하며, 특정 방향으로의 상 연결성을 확인할 수 있다(Singh et al., 2008). Fig. 4(a)를 보면, 과 의 경우에는 선분 전체가 각각의 상에 위치하고 있지만, 의 경우에는 선분이 서로 다른 상에 걸쳐서 위치하고 있기 때문에 lineal-path의 고려 대상이 되지 않는다. 일반적인 lineal-path function의 극값은 식 (1)과 같다.
여기서 는 상의 부피비를 의미한다. 본 연구에서는 Coker와 Torquato(1995)에 의해 제안된 방법을 이용하여 lineal-path function을 계산하였으며, 공극 부분만 고려하기 때문에 표현의 편의상 로 표기하였다. 은 함수의 =0에서 접선과 축이 교차하는 지점에서의 값을 나타내며(Fig. 4(b)), 이 증가하면 공극이 상대적으로 군집해 있음을 의미한다. Fig. 4(b)를 보면, 공극이 분포하고 있는 형상에 따라 가로와 세로 방향의 이 다르게 나타날 수 있다. 본 논문에서는 시멘트풀 미세구조가 통계적으로 등방성을 가지기 위해 충분히 넓은 도메인의 미세구조 이미지를 사용하였지만, Fig. 4(b)와 같이 상대적으로 매우 다른 형태의 미세구조의 경우 공극분포특성이 특정 방향성을 가질 수 있다. 이 경우 인장하중을 가하는 방향과 수직한 방향의 이 수평 방향보다 주요한 정보를 나타내기 때문에 인장 방향의 수직 방향의 을 라벨 데이터로 사용하였다.
3.2 선행학습 및 전이학습 결과
선행학습은 아래 세 가지 모델에 대해 학습을 진행한 뒤, 결과를 비교하였다.
1) Input data: Micro-CT image of cement paste
2) Output data
∙ 𝜙
∙
∙
세 모델 모두 시멘트풀 미세구조 이미지를 인풋 데이터로 받았을 때 해당 미세구조의 공극분포특성 값을 예측하도록 학습이 진행되었다. 선행학습은 15만 6천개의 학습 데이터를 사용하여 학습한 뒤, 3만 개의 시험 데이터를 사용하여 정확도를 검증하였다. Fig. 5에 각 선행학습 모델들의 3만 개의 시험 데이터에 대한 평균 예측정확도를 나타내었다. 𝜙만을 예측한 모델의 경우 93%를 넘는 정확도를 나타내었고, 만을 예측한 모델은 약 89%의 정확도를 나타내었다. 두 공극분포특성을 동시에 예측할 경우 𝜙의 예측 정확도는 소폭 감소하고, 의 예측 정확도는 오히려 소폭 증가하여 평균 90%를 넘는 정확도를 나타내었다. 𝜙는 micro-CT 이미지로부터 직접적인 도출이 가능하기 때문에 CNN을 활용한 예측모델이 높은 정확도를 가질 수 있는 것으로 판단되며, 의 경우 𝜙에 비해 계산과정이 복잡하기 때문에 상대적으로 정확도가 낮게 나타난 것으로 판단된다. 𝜙와 을 동시에 예측할 경우 학습을 진행하는 모델의 파라미터 수가 증가하기 때문에 𝜙예측 정확도는 소폭 감소하지만, 두 공극분포특성을 동시에 예측하는 과정에서 학습 모델이 미세구조의 공극 영역에 집중될 수 있도록 학습이 진행되어 의 예측 정확도는 소폭 증가한 것으로 판단된다.
선행학습한 세 모델의 가중치를 각각 사용하여 시멘트풀의 인장강도를 예측하는 모델에 전이학습을 수행하였다. 전이학습은 학습 데이터가 적을 때 사용하면 학습의 정확도를 높이는 방법이지만, 선행학습 모델에서 너무 많은 레이어의 가중치를 파인튜닝할 경우 전이학습한 모델에서 과적합이 발생하거나 전체 파라미터의 신뢰도에 문제가 발생할 수 있다(Krizhevsky et al., 2012). 선행학습 모델로부터 어떤 레이어를 파인튜닝했을 때 전이학습 시 예측 정확도가 향상되는지를 확인하기 위해 매개변수 분석을 수행하였다. Table 1에 나타낸 레이어 목록에서 파인튜닝을 수행한 레이어에 따라 전이학습 모델의 인장강도 예측 정확도를 Fig. 6에 나타내었다. Fig. 6을 보면, 합성곱 레이어 3-5의 가중치를 파인튜닝했을 때 가장 정확도가 높게 나타났음을 확인하였다. 이때 𝜙만을 예측한 선행학습 모델의 가중치를 전이학습 했을 때 보다 𝜙와 을 동시에 예측한 선행학습 모델의 가중치를 전이학습 했을 때 약 7% 높은 정확도를 나타내었다. 이는 𝜙를 예측하기 위해 시멘트풀의 micro-CT이미지에서 특징을 추출하도록 학습된 합성곱 레이어의 가중치보다 𝜙와 을 동시에 예측하기 위해 학습된 합성곱 레이어의 가중치가 시멘트풀의 거동을 예측하는데 더 효과적이었음을 나타낸다.
4. 결 과
Fig. 7에 예측 정확도가 평균 이상인 시험 데이터의 공극분포특성에 따른 강도 예측 정확도 분포를 나타내었다. 시멘트풀의 𝜙의 변화에 대해서는 강도 예측의 정확도가 달라지지 않지만, 시멘트풀의 이 높을수록 강도 예측 정확도가 향상되는 것을 확인할 수 있다. 즉, 같은 𝜙이라도 공극이 군집해 있을수록(큰 공극이 많이 존재할수록) 예측 정확도가 높아지는 결과를 보였다. Table 2에 시멘트풀의 공극분포특성에 대한 강도 예측 정확도 결과 예시를 나타내었다. 시멘트풀의 𝜙가 낮더라도 군집된 공극이 두드러지게 나타나면 학습의 오차가 낮게 나타나는 것을 볼 수 있다.
Table 2.
Examples of tensile strength prediction errors by the pore distribution characteristics of cement paste
|
Virtual mesh of cement paste | ![]() | ![]() | ![]() |
| 𝜙 (%) | 9.3 | 2.5 | 0.7 |
| (µm) | 31.6 | 51.1 | 10.4 |
|
Predicted tensile strength (MPa) | 3.66 | 8.52 | 9.63 |
|
Tensile strength label (MPa) | 3.47 | 8.38 | 8.59 |
| Error (%) | 5.6 | 1.7 | 12.2 |
이러한 결과의 원인은 군집된 공극이 두드러질수록 합성곱 레이어가 micro-CT 이미지로부터 특징을 추출하기 용이하기 때문으로 판단된다. Fig. 8에 합성곱 레이어의 각 채널 활성화 정도를 시각화(Zhou et al., 2016)하여 나타내었다. Fig. 8의 붉은 사각형 창을 보면, 합성곱 레이어가 micro-CT 이미지로부터 공극 상과 유사한 이미지를 구분해내는 것을 볼 수 있다. 합성곱 과정을 통해 구분된 공극 상에서 공극이 군집된 영역에서 강도 예측에 높은 가중치가 부여되었다면 이 높은 시멘트풀의 강도 예측 정확도가 높게 나타난 원인을 설명할 수 있다. Fig. 9에 히트맵(heat map) 이미지와 가상실험 결과 확인된 균열의 시작점을 비교하여 나타내었다. 히트맵 이미지란 이미지의 어느 부분이 최종 예측에 기여하는지를 시각화한 이미지로, 특징 맵의 모든 채널 출력에 채널의 가중치 그래디언트(gradient) 평균을 곱하여 나타낸다(Selvaraju et al., 2016). Fig. 9의 히트맵에서 붉게 나타난 영역이 최종 예측에 가장 많은 기여를 한 영역을 나타낸다. 가상 실험 결과 확인된 균열의 시작점과 히트맵의 붉은 영역이 유사하게 나타남을 확인할 수 있다.
5. 결 론
본 연구에서 CNN을 통한 미세구조-물성 간의 상관관계가 미세구조 분포특성을 활용한 전이학습을 통해 성공적으로 수행되었음을 제시하였다. 제시한 미세구조-물성 상관관계 분석 방법은 기존 방법과 비교하여, 시멘트풀의 미세구조 이미지에서 미세구조 특성값을 얻기 위한 데이터 전처리 과정없이 micro-CT 이미지로부터 직접적인 물성 예측이 가능하다는 장점이 있다. 기계학습을 위한 데이터 생산에 많은 시간이 필요한 경우, 전이학습을 통해 데이터 생산에 소요되는 시간과 비용이 단축 가능한 것도 확인되었다. 기계학습의 단점은 아키텍처 내부에 대한 해석이 어려운 것이다. 본 연구는 이러한 단점을 극복하기 위해 CNN의 은닉 레이어와 히트맵을 시각화함으로써 공극분포특성이 예측 정확도 향상에 기여한 것을 확인하여 기계학습에 의한 물성 예측이 미세구조 특성과 상관관계에 근거한 것임을 검증하였다.
본 연구에서는 수많은 학습 데이터를 필요로 하는 기계학습의 특성상 2D 시멘트 미세구조와 2D 가상 실험을 통해 계산된 인장강도를 사용하였다. 시멘트풀의 거동을 정확히 분석하기 위해서는 3D 데이터에 대해 분석할 필요가 있으나, 이는 엄청난 시간과 비용을 요구한다. 새로운 알고리즘과 하드웨어의 발전을 고려할 때 3D 미세구조와 물성간의 분석이 가까운 미래에 달성될 것으로 기대한다.













