본문 바로가기
음향학

홈 레코딩을 위한 컴퓨터 최적화와 디지털 상식 1

by 라봉뮤직 2024. 3. 7.

홈 레코딩을 위한 컴퓨터 최적화
홈레코딩을 위한 디지털 상식

컴퓨터 시대 이전의 녹음 작업

개인용 컴퓨터의 출현은 홈 리코딩의 세계에 혁명을 가져왔고 대중이 접근할 수 있게 되었습니다. 흥미롭게도 음반 판매가 전성기였을 때 녹음 스튜디오에는 컴퓨터 기술의 사치가 없었습니다. MP3가 등장한 것은 개인용 컴퓨터와 인터넷이 확산되면서부터다. 불법 음악 파일의 확산으로 음악 산업에 큰 타격을 입혔다. 그러나 컴퓨터가 계속 발전하고 스마트폰이 등장하면서 음악 청취와 첨단 기술을 완벽하게 통합한 스트리밍 서비스 덕분에 음악 시장은 다시 살아날 수 있었습니다. 개인용 컴퓨터의 광범위한 사용으로 인해 이제 누구나 자신의 음악을 제작할 수 있는 환경이 조성되었다는 점은 조목 할 가치가 있습니다.

 

컴퓨터 녹음이 널리 사용되기 이전 시대에는 자기 테이프가 소리를 녹음하는 매체로 사용되었습니다. 테이프의 사운드를 편집하는 것은 절단을 위해 면도칼을 사용해야 하는 상당한 어려움을 안겨주었습니다. 이 작업은 숙련된 엔지니어가 수행하지 않는 한 위험이 따릅니다. 흥미롭게도 테이프를 수직이 아닌 대각선으로 절단했을 때 소리가 자연스럽게 연결되어 있었습니다. 이 기술 프로세스는 현대 디지털 오디오 워크스테이션에서 발견되는 페이딩 기능의 전조로 볼 수 있으며, 이는 그 조상의 뿌리를 나타냅니다.

 

이 기간 동안에는 전기 신호가 테이프에 직접 캡처되었기 때문에 녹음 스튜디오에 컴퓨터가 있을 필요가 없었습니다. 그러나 컴퓨터가 널리 보급되면서 녹음 기술은 하드 디스크로 옮겨갔습니다. 불행하게도 초기의 하드디스크 디지털 녹음은 자기 테이프의 우수한 음질에 미치지 못하여 상업 녹음 스튜디오의 열의가 부족했습니다. 테이프가 제공하는 따뜻하고 세련된 사운드는 하드 디스크 녹음에는 없기 때문에 일부 사람들은 컴퓨터 녹음 사운드를 비인격적인 것으로 인식하게 되었습니다. 이러한 지족적인 논쟁은 계속되고 있으며 일부 사람들은 컴퓨터로 녹음하는 것이 사치스러운 느낌을 불러일으킨다고 주장합니다.

 

테이프를 흉내 내는 기계인 Tape Macing Sinulator의 특징은 '부드럽고 기분 좋은 느낌'을 만들어낸다는 점입니다. 연속적인 물리적 신호, 즉 아날로그 신호가 테이프에 기록되면 테이프 위의 자성입자가 물리적 신호에 따라 조직화됩니다. 이때 하모닉 디스토션(Harmonic Distortion)이라는 현상이 발생하는데, 이로 인해 소리가 상당히 듣기 기분 좋게 들립니다. 테이프 머신 시뮬레이터는 이 현상을 시뮬레이션하는 컴퓨터 프로그램으로, 녹음의 하드 디스크 속성이 부족합니다. 소리의 효과를 평가해 봅시다.

 

원하는 테이프 머신은 가격이 비쌌고, 슈퍼스타가 아니면 개인 녹음 공간이나 스튜디오에서 구입할 여유가 없었습니다. 당연히 녹음된 음악을 녹음하려면 앞서 언급한 믹서 외에 아웃보드 기어와 수억 달러 상당의 콘솔 등 추가 장비가 있어야 합니다. 이로 인해 해당 개인은 녹음 과정에 참여할 수 있습니다.

컴퓨터 발전과 디지털 리코딩

처음에는 컴퓨터 녹음이 대중적이지 않았지만, 컴퓨터와 변환 기술 및 장비의 발달로 점차 컴퓨터 녹음의 활용이 대중화되었습니다. 또한, 저장매체인 하드디스크의 용량이 증가함에 따라 컴퓨터를 이용하여 하드디스크에 기록하는 시대가 도래하게 되었다. 컴퓨터만 있으면 누구나 프로듀서가 될 수 있는 시대가 왔습니다. 앞서 언급했듯이 소리(공기 진동)는 마이크나 픽업과 같은 변환 장치에 의해 전기에너지로 변환됩니다. 변환된 전기 에너지를 컴퓨터에 저장하려면 디지털 신호로 변환해야 하는데, 이를 변환이라고 합니다. 우리가 인지하든지 인지하지 못하든 컴퓨터에 소리를 녹음하고, 녹음된 소리를 재생하는 과정에서 끊임없이 발생하는 현상입니다. 그렇다면 전기 신호는 어떻게 전자 신호, 즉 디지털 신호로 변환됩니까? 전기 신호를 디지털 신호로 변환하고 다시 변환하는 과정은 음질과 직접적인 관련이 있습니다.

샘플레이트와 비트뎁스

컴퓨터 녹음에서 DAW(즉, 녹음 프로그램)를 열고 녹음을 시작할 때 가장 먼저 설정해야 할 것은 샘플 속도와 비트 깊이입니다. 샘플링레이트와 비트 심도를 먼저 설정하는 이유는 아날로그 신호를 디지털로 변환할 때 샘플링 레이트와 비트 심도가 가장 기본적인 설정이기 때문입니다.

 

전기 신호(아날로그 신호)를 디지털 신호로 변환하려면 입력 아날로그 신호가 초당 몇 번 진동하는지, 얼마나 강하게 진동하는지 확인해야 합니다. 샘플링 속도는 초당 소리가 진동하는 횟수를 결정하여 생성되고, 비트 심도는 소리의 강함 또는 약함을 결정하여 생성됩니다.

 

●샘플레이트

진동은 강한 힘과 약한 힘이 반복적으로 발생할 때 발생합니다. 이러한 반복이 초당 발생하는 횟수는 헤르츠 Hertz로 표시됩니다. 샘플링 속도는 샘플이 생성되는 횟수 또는 속도를 나타내며, 들어오는 전기 신호가 감지되어 샘플로 변환되는 초당 횟수를 나타냅니다. 예를 들어, "CD 품질을 44,100Hz로 설정하고 48,000Hz에서 녹음하는 것이 가장 좋습니다."라는 말을 들어보셨을 것입니다. 전자는 입력 신호를 초당 44,100회 감지하고 샘플링한다는 뜻이고, 후자는 입력신호가 44,100회 감지하고 샘플링한다는 뜻이고, 후자는 입력 신호가 44,100회 감지된다는 의미입니다. 신호는 초당 44,100번, 48,000번 샘플링됩니다.

 

사람이 듣는 공기 진동의 주파스가 20~20,000Hz인지 확인하려면 초당 40번을 확인해야 하지만, 진동이 20,000Hz인지 확인하려면 초당 40번을 확인해야 하지만, 진동이 20,000Hz인지 알려면 40,000번, 20,000번을 두 번 확인해야 합니다. 헤르츠, 이것이 CD 음질의 탄생 이유이자 디지털 오디오 이론의 기초입니다. 이러한 디지털 오디오 이론이 컴퓨터가 발명되기 전인 1910년대에 등장했다는 것은 참으로 놀라운 일입니다.

 

참고로 44,100Hz에서의 CD 음질은 다음과 같습니다. 가장 높은 가청주파수인 20,000Hz를 안전하게 디지털로 변환하기 위해서는 20,000Hz 이상의 주파수를 차단해야 하며, 이 과정에서 소리는 22,050Hz에서 완전히 차단됩니다. 해당 주파수(22,050Hz)의 두 배로 샘플링하면 CD의 음질인 44,100Hz라는 숫자를 얻게 됩니다.

 

●오버 샘플링

시디 음질 역시 가장 높은 가청 주파수인 20,000Hz를 안전하게 디지털로 변환하려는 오버 샘플링 Over Sampling의 일종이며, 일반 음질의 표준인 48,000Hz 역시 이의 연장선이다. 샘플레이트가 높아질수록 입력되는 전기신호의 진동 횟수를 보다 자세하게 표현할 수 있으며, 이는 음질과도 연관된다. 음의 해상도가 높아진다는 말이다. 특히 고음의 해상도가 좋아진다. 고음질의 음원은 원음에 보다 가깝고, 샘플링 횟수가 96,000Hz 혹은 192,000Hz인 샘플레이트를 사용한다.

 

하지만 욕심은 금물이다. 샘플레이트가 높아지면 해상도가 좋아지는 것은 사실이나 컨버터가 초당 검사해야 하는 샘플이 많아지고, 컴퓨터도 많은 데이터를 처리해야 한다. 컨버터는 많은 샘플을 정확하게 검사해야 하기 때문에 성능이 정확해야 하고, 컴퓨터는 많은 양의 정보를 처리해야 하기 때문에 빠른 데이터 전송 속도와 처리 속도를 갖춰야 한다. 그러므로 여러 상황상 홈 리코딩의 경우, 고음질보다는 일반 음질인 44,100Hz나 48,000Hz의 샘플레이트를 사용하는 것이 효과적일 것이다.

 

●비트뎁스

샘플레이트가 진동수와 연관이 있다면 비트뎁스는 소리 크기와 연관이 있다. 큰 소리와 작은 소리를 표현하는 단계인데, 조용하게 노래를 부를 때와 크게 소리를 지를 때의 음압 차이를 표현한다는 말이다.

 

비트 bit는 디지털 오디오에서 소리 크기를 표현하는 단위다. 1비트가 표현할 수 있는 단위는 2의 1승, 즉 2단계다. 1비트는 2단계로 소리 크기를 표현한다. 2단계로 표현한다는 뜻은 무엇일까. 1단계는 '소리 안 남', 2단계는 '소리 남'을 말한다. 1비트로 녹음하는 경우는 없지만, 1비트로 녹음한다면 모든 소리의 크기는 같을 것이다. 2비트는 2의 2승이니 4단계로, 4비트는 2의 4승이니 16단계로 소리 크기를 표현한다.

 

녹음에서 사용하는 비트는 16비트 혹은 24비트다. 16비트는 2의 16승, 즉 65,536단계로 소리 크기를 표현하고, 24비트는 2의 24승, 즉 16,777,216단계로 소리 크기를 표현한다. 입력되는 전기신호의 강도를 이처럼 단계별로 나타내고, 이를 사람이 듣는 소리의 단위인 dB로 표현하면 이론적으로 비트다 약 6dB 정도의 표현이 가능하다. 16비트는 16X6, 약 96dB이다. 즉 작은 소리와 큰 소리를 표현할 때 96dB의 차이로 표현이 가능하다는 뜻이다. 24비트는 24X6, 이론상 144dB의 차이로 소리를 표현할 수 있다.

 

홈 리코딩 스튜디오에서 녹음하는 경우라면 사실 어느 비트로 작업해도 음질 차이는 크게 느낄 수 없을 것이다. 하지만 홈 리코딩이라도 24비트로 작업해야 하는 이유는 믹싱 작업에서 플러그인 사용에 이점이 있기 때문이다.