음환경, 소음진동

자기상관함수 (Auto correlation function, ACF)의 음향에 대한 이용

Dr. 임만 2021. 2. 24. 20:07
반응형

"서론"

오늘은 자기상관함수 (Auto correlation function, ACF) 에 대하여 알아보려고 한다. 

여타 분야에서 많이 활용되는 함수이지만 음향에서는 사실 그렇게까지 많이 알려진 부분은 아닌 듯하다. 

ACF의 음향에 대한 적용의 시작은 Y. Ando 교수님의 Architectural acoutsics (1998)에 기술되어 있는데 Auditory-brain model을 제안하면서 인간이 소리를 지각할 때 공간적/ 시간적 factor로 받아들인다는 가정에서 시작한다. 

Auditory-Brain model (Y. Ando, 1998)

ACF는 temporal criterion을 정량적으로 정의하는데 음향에서 사용되고 있으며, 본 포스팅에서는 ACF의 음향적 정의와 그 지표에 대해서 알아보고자 한다.

본 포스팅은 필자가 공부할 때 참고하였던 세미나, 강의, 교재 등 자료들을 모아 작성하였기 때문에 출처를 명시하기가 쉽지 않다는 점을 사전에 밝힌다. (음향 연구실 선배님들께 감사를!) 


"본론"

 정의
어떤 무작위의 신호가 두 시각에 취하는 값의 상관 관계를 나타내는 함수.
확률 과정 {X(t)}의 시간 차 t인 두 시점을 각각 t1과 t1+t라 할 때 표본값의 곱의 집합 평균 Y(t1, t1+t)=E(X(t1) X(t1+t))를 {X(t)}의 자기 상관 함수라고 한다.
자기 상관 함수는 시간 차 t만의 함수 j(t)가 된다. [출처: 네이버 백과사전] 

즉, 시간 t+τ에서의 신호값 x(t+τ)의 곱에 대한 평균(Average)으로 다음과 같이 정의된다.

자기 상관 함수 ACF는 임의의 어떤 신호(p(t))와 그 신호를 임의의 시간(t)만큼 지연시킨 신호  (p(t+t))사이의 상관관계를 파악할 수 있는 함수이다.
지연시간(t)에 대해 초기 신호의 성분이 계속해서 지속되고 있다면 ACF는 높은 상관관계를  나타낼 것이다.
반대로 어떤 지연 시간에  대해 초기 신호의 성분이 사라지고 거의 존재하지 않는다면 그 지연시간에 대한 ACF는 낮은 상관관계를 나타낼 것이다.
(아래 식에서 2T로 나누는 것은 적분구간이 –T~+T, 즉 2T이기 때문임. 즉 평균을 구하는 것)

소음에 대한 ACF 분석은 소음의 특성을 표현할 수 있는 하나의 기준이 된다.
복합적인 소음원에 대해 어떠한 성분이 지속적으로 유지되고 있는지 밝히는 과정은 사람의 청감에 지속적으로 영향을 주고 있는 주요한 피치(pitch) 성분을 추출하는 작업이다.

 자기상관함수 지표 (ACF parameters)

1. τ_1 : Delay time of the first peak (아래의 그림 참조)

- 첫번째 피크까지의 딜레이 시간
- τ1 은 Dominant frequency component (pitch)를 나타낸다. 예를 들어, Larger τ1 일수록 Lower frequency (f = 1/τ1)
- τ1이 Pitch인 이유를 살펴보면, 주기의 정의는 마루(골, 피크)에서 마루(골, 피크)까지 걸리는 시간이다.
여기서 τ1은 첫 번재 피크까지의 딜레이 시간이므로, 피크에서 피크(first)까지 걸리는 시간 즉, 주기(T)라고 할 수 있다. 진동수(주파수)는 1/T 이므로 τ1가 크게 되면 진동수 작아지므로 저주파가 특성이 주요한 음원이라 판단할 수 있다.


2,  Φ1: Amplitude of the first peak of ACF
- ACF 그래프에서 첫번째 피크의 크기, 즉 첫 번째 피크의 자기상관계수 값
- Φ1이 클수록 larger harmonic component와 stronger pitch sensation을 나타낸다.
- Harmonics(배음)은 기본음의 2배, 3배 같이 정수배로 되는 음을 발한다.
Φ1, 즉, 첫 번째 피크가 크다는 것은 큰 harmonic component 요소가 존재한다는 것을 의미한다.  
- 또한 Φ1, 즉, 첫 번째 피크가 크다는 것은 주요 주파수 성분의 에너지가 강하다는 것을 의미하므로 강한 pitch(음고: 사람이 느끼는 음의 높낮이, 주파수와는 유사하지만 다른 개념, 사람이 느끼는 음의 높낮이이므로 critical band와 관련 있음) 감각(sensation)을 일으킨다고 할 수 있다.

3.τ_e: 10-percentile delay, effective duration of envelope of ACF

- τe는 초기 신호에 대한 자기상관계수로부터 그 값의 10-percentile까지 감소할 때까지의 시간으로 정의된다.
이를 Effective duration of the envelope of the ACF라 한다.
- τe는 10*log10(abs( Φ( τ)) = -10 dB 일 때의 τ(딜레이 시간)을 나타낸다.
즉, 초기 ACF 값으로부터 10 percentile 떨어졌을 때의 τ값이다.
- τe를 쉽게 계산하는 방법은 다음과 같다.
초기 로그 ACF 값 10*log10(abs( Φ( τ))에서 -5 dB 떨어지는 감쇠율(감소 기울기)을 외삽법(extrapolation)한 것을 이용하여 –10 dB일 때의 τ값을 계산한다.

cf) The effective duration of ACF defined by the delay τe at which the envelope of the ACF becomes –10 dB (or 0.1; 10 percentile), can easily be obtained by the decay rate extrapolated in the range from 0 dB at the origin, to –5 dB (Y. Ando, 1998, Architectural acoustics, Springer, p12)

- τ_e가 커질수록 즉, 초기 로그 ACF 값으로부터 –10dB 까지 떨어지는 시간이 길어질수록(다시 말해 초기 ACF 값으로부터 10 percentile 떨어지는 값이 길어질수록), 더 많은 tonal component가 나타난다고 해석할 수 있다.
이 말은 즉, 10 percentile 까지 떨어질 때까지 오래 걸린다는 말은 ACF (자기상관계수)가 높게 오래 유지된다는 뜻이므로 반복되는 tonal 성분이 많이 있다는 뜻이고, 그 반대는 tonal 성분이 적다는 뜻으로 해석할 수 있다.

- 예를 들면, sine wave(Tonal signal) 의 경우 τe는 ∞ 무한대 값을 가지고 , White noise(random signal)에서의 τe 값은 0에 가까워진다.

4. Φ(0): Sound energy represented at the origin of the delay

- τ가 0일 때, 초기 Φ값을 나타낸다.
- Φ(0) 값을 –T 부터 +T까지 적분하면 Leq가 된다.
- ACF 정의에 적용해본다면 Φ(0)는 지연 시간이 0일 때를 나타낸다.
즉, 적분성분이 p²(t)가 되며 이는 결국 신호의 에너지 레벨을 나타낸다.
따라서 Φ(0)는 소음원이 가지고 있는 에너지 레벨을 나타낸다. 다시 말하면, 아래 식에서 볼 수 있듯이, τ가 0일 때, p²(t)값을 적분하게 되므로 수식적으로 L_eq를 계산하는 식과 같게 된다.


"결론"

ACF는 기존의 레벨과 주파수 중심의 음향지표에서 실제 청감인지 모델을 기반으로 시간적인 인지에 대해서 정량화하려는 시도로 해석될 수 있다.


다음 포스팅에서는 공간적 인지를 정량화한 양이상관함수 (Inter-aural cross-correlation function, IACF)에 대하여 포스팅하겠다.

반응형