피아노 음악 채보 - 3.후처리 및 예측

By kuper0201

Published in 인공 지능

2023-09-13

1 min read

바로가기

피아노 음악 채보 - 1.전처리

피아노 음악 채보 - 2.모델 구현

피아노 음악 채보 - 3.후처리 및 예측(현재 글)

서론

이전 글에서는 Onset과 Length를 각각 감지하는 모델을 학습시켰습니다.

이번 글에서는 모델 각각의 출력값을 하나의 MIDI파일로 병합하기 위한 후처리 과정에 대해 설명하겠습니다.

데이터 입력 및 예측

원하는 오디오 파일을 모델에 입력하여 MIDI 형태로 출력받기 위해서는 학습할 때와 동일한 방법으로 입력 데이터를 전처리해 주어야 합니다.

따라서 전처리 글에서 언급한 것과 같이 CQT 변환을 수행하고 패딩을 추가 하였습니다.

입력 데이터의 전처리가 완료되었으므로 Onset과 Length 모델을 각각 로딩하고 예측을 수행 할 수 있습니다.

예측 데이터의 형태가 3차원 배열이기 때문에 (오디오의 총 시간, 88) 형태로 변환해 주었습니다.

MIDI 파일로 변환

예측 데이터를 기반으로 새로운 MIDI 파일을 생성하기 위해 pretty_midi라는 라이브러리를 사용하였습니다.

각 음계를 순회하며 Onset 예측 데이터에서 시작점을 찾고, Length 예측 데이터에서 해당 음의 길이를 찾는 방식으로 MIDI를 생성했습니다. 해당 음이 얼마나 세게 연주되는지에 대한 예측은 수행하지 않았으므로 velocity는 100으로 고정하였습니다.

모든 음을 순회한 이후, 해당 MIDI 파일을 저장하면 데이터의 변환이 완료됩니다.

들어보기

상기한 과정으로 Korobeiniki의 Tetris Theme를 변환해 보았습니다. 아래의 재생 버튼을 클릭해 직접 들어 볼 수 있습니다.

원본 오디오

user48602683 · Tetris - Theme - Korobeiniki - Arranged - For - Piano - 186249

변환된 오디오

user48602683 · Transcripted - Tetris - Korobeiniki

오디오를 들어보면 전체적인 멜로디와 반주는 원본과 비슷하지만 부분적으로 틀린 연주를 하는 경우도 볼 수 있습니다. 이러한 경우는 고조파에 영향을 받는 것으로 보이며 기존에 사용한 CQT와 다른 전처리 방식을 동시에 입력하는 다중 입력 방식의 모델을 학습하면 해결 가능 할 것으로 보입니다.