쉬어가자: 세트 간 휴식 시간이 근비대에 미치는 영향에 대한 베이지안 메타분석을 포함한 체계적 문헌고찰
Give it a rest: a systematic review with Bayesian meta-analysis on the effect of inter-set rest interval duration on muscle hypertrophy
저자: Alec Singer, Matthew Wolf, Luis Generoso, Emilio Arias, Kenneth Delcastillo, Erik Echevarria, Adrian Martinez, Patroklos Androulakis Korakakis, Martin C. Refalo, Paul A. Swinton and Brad J. Schoenfeld
Frontiers in Sports and Active Living, 6, pp. 1429789
핵심 발견
- ✓ 긴 휴식 시간(2-3분)이 짧은 휴식(1분 미만)보다 근비대에 약간 더 유리함
- ✓ 베이지안 분석 결과, 긴 휴식의 효과는 '작지만 유의미한' 수준
- ✓ 단, 시간 효율을 고려하면 짧은 휴식도 합리적인 선택
실전 적용
- ▶ 근비대 극대화 목표 시 세트 간 2-3분 휴식 권장
- ▶ 시간이 부족한 경우 1분 휴식도 충분한 근비대 효과 기대 가능
- ▶ 복합 운동은 더 긴 휴식, 고립 운동은 짧은 휴식 가능
초록
본 연구에서는 건강한 성인을 대상으로 다른 모든 훈련 변수를 통제한 상태에서 서로 다른 세트 간 휴식 시간(inter-set rest interval) 길이를 비교하여 훈련 전후 제지방량(lean mass) 및 근육량 변화를 추정한 연구들을 무작위 설계 기준으로 체계적으로 문헌 검색하였다. 포함 기준을 충족한 9개 연구에서 얻은 총 19개의 측정값(대퇴부: 10개, 팔: 6개, 전신: 3개)에 대해 계층적 모형(hierarchical model)을 활용한 비통제 효과 크기(non-controlled effect size)의 베이지안 메타분석(Bayesian meta-analysis)을 수행한 결과, 서로 다른 세트 간 휴식 시간에 걸쳐 표준화 평균 차이(standardized mean difference, SMD)가 상당히 중복되는 것으로 나타났다[이진 분류: 짧은 휴식: 0.48 (95% 신뢰구간[CrI]: 0.19–0.81), 긴 휴식: 0.56 (95% CrI: 0.24–0.86); 4범주 분류: 짧은: 0.47 (95% CrI: 0.19–0.80), 중간: 0.65 (95% CrI: 0.18–1.1), 긴: 0.55 (95% CrI: 0.15–0.90), 매우 긴: 0.50 (95% CrI: 0.14–0.89)]. 결과에는 상당한 이질성(heterogeneity)이 존재하였다. 이진 분류(짧은 vs. 긴) 통제 효과 크기에 대한 단변량 및 다변량 쌍대 메타분석(pairwise meta-analysis) 결과, 팔과 대퇴부에서 유사한 결과가 나타났으며 중심 추정값은 긴 휴식 시간을 지지하는 경향을 보였다[팔: 0.13 (95% CrI: −0.27–0.51); 대퇴부: 0.17 (95% CrI: −0.13–0.43)]. 반면, 전신의 경우 중심 추정값은 영(0)에 근접하면서 짧은 휴식 시간을 소폭 지지하였다[전신: −0.08 (95% CrI: −0.45–0.29)]. 세트 종료 시점 데이터에 대한 하위분석(subanalysis) 결과, 근력 실패(failure)까지 훈련하는지 또는 실패 직전에 중단하는지 여부는 휴식 시간과 근비대(muscle hypertrophy) 간의 상호작용에 유의미한 영향을 미치지 않는 것으로 나타났다. 결론적으로, 본 연구 결과는 세트 간 휴식 시간을 60초 초과로 설정하는 것이 소폭의 근비대 이점을 가져올 수 있음을 시사하며, 이는 훈련 볼륨 부하(volume load) 감소의 완화에 의해 매개될 가능성이 있다. 그러나 본 분석에서는 세트 간 90초 초과 휴식 시 근비대에 있어 뚜렷한 차이를 확인하지 못하였으며, 이는 볼륨 부하에 대한 부정적 영향이 이 시점을 넘어서면 정체되는 경향이 있다는 기존 근거와 일치한다.
핵심어: 휴식 시간, 회복 인터벌, 근육 성장, 근육 발달, 근육 두께, 근육 횡단면적
서론
저항 훈련(resistance training, RT) 프로그램 변수의 조작이 골격근 근비대(skeletal muscle hypertrophy)를 최적화하는 데 도움이 될 수 있다는 주장이 제기되어 왔다 [1]. 그러나 직접 감독하는 종단 RT 프로토콜을 수행하는 데 소요되는 막대한 시간적 부담으로 인해, 프로그램 변수 조작 효과에 관한 연구 대부분은 비교적 소규모 표본을 대상으로 진행되었다. 따라서 주어진 주제와 관련된 모든 연구 결과를 통합하고 탐색하는 메타분석 기법은 효과의 크기를 정량화함으로써 해당 주제에 대한 추가적인 통찰을 제공할 수 있으며, 이는 운동 처방(exercise prescription)을 안내하는 데 도움이 될 수 있다. 최근까지 비교적 최신의 메타분석들이 부하(load) [2], 볼륨(volume) [3], 빈도(frequency) [4], 근력 실패 근접도(proximity to failure) [5] 등 다양한 RT 프로그램 변수의 조작이 근비대 결과에 미치는 영향을 조사하여, 이들의 실제적 함의에 대한 이해를 높여왔다.
세트 간 휴식 시간(rest interval)은 본 연구에서 RT 중 세트 사이의 시간으로 조작적으로 정의되며, 운동 처방에 중요한 함의를 갖는 변수로 여겨진다 [6]. 미국 국가근력조건화협회(National Strength and Conditioning Association)는 근비대 최적화를 위해 비교적 짧은 휴식 시간(30–90초)을 권고하고 있다 [7]. 이는 주로 짧은 휴식 시간이 RT 후 호르몬 반응을 증가시키며, 이것이 근육 적응을 촉진한다는 이론에 기반한 급성 연구 결과에 근거한다 [8]. 그러나 최근 연구들은 운동 후 일시적인 호르몬 상승이 근비대 유발에 중요한 역할을 하지 않을 수 있음을 시사하고 있으며 [9, 10], 이는 근육 발달 최적화에 있어 짧은 휴식 시간의 이점에 의문을 제기한다. 더욱이, 휴식 시간의 길이와 후속 세트에서 들어 올리는 중량 크기 사이에는 역의 관계가 존재한다. 즉, 더 짧은 휴식 시간은 더 긴 휴식 시간에 비해 주어진 반복 횟수를 완료하기 위해 중량을 더 크게 감소시킬 것을 요구한다 [11, 12]. 기계적 장력(mechanical tension)이 RT 유발 근비대의 주요 기전(mechanism)임을 고려할 때 [13], 이러한 볼륨 부하(volume load) 감소는 오히려 근육 적응을 저해할 수 있다. 실제로 McKendry 등 [14]은 짧은 휴식 시간(1분) 조건에서 급성 테스토스테론 상승이 더 높음에도 불구하고, 짧은 휴식 시간이 긴 휴식 시간(5분)에 비해 RT에 대한 근원섬유 단백질 합성(myofibrillar protein synthetic) 반응을 둔화시켰다고 보고하였으며, 예상대로 짧은 휴식 조건에서 볼륨 부하가 더 큰 폭으로 감소하였다.
휴식 시간이 근비대에 미치는 영향을 조사한 종단 연구들의 결과는 대체로 엇갈렸다(equivocal). Grgic 등 [15]의 체계적 문헌고찰(systematic review)은 비훈련 개인의 경우 짧은 세트 간 휴식 시간과 긴 세트 간 휴식 시간 모두 근비대 최적화에 있어 실행 가능한 선택지이지만, 이전에 RT 경험이 있는 이들에게는 긴 휴식 시간이 유리할 수 있다고 결론지었다. 이 리뷰는 2017년에 출판되었으며 이후 해당 주제에 관한 추가 연구가 진행되었음을 유의해야 한다. 더욱이, 현재까지 어떤 연구도 서로 다른 휴식 시간 조건 간 효과 크기를 정량화하여 RT 처방에 있어 그 차이가 실질적으로 의미 있는지 여부를 판단하려는 시도를 하지 않았다. 따라서 본 연구의 목적은 근비대 측정에 대한 RT 중 휴식 시간의 효과에 관한 기존 데이터를 체계적으로 문헌 고찰하고 베이지안 메타분석을 수행하는 것이었다.
연구 방법
본 리뷰는 "체계적 문헌고찰 및 메타분석을 위한 선호 보고 항목(Preferred Reporting Items for Systematic Reviews and Meta-Analyses, PRISMA)" 지침에 따라 수행되었다. 연구는 오픈 사이언스 프레임워크(Open Science Framework, https://osf.io/ywevc)에 사전 등록되었다.
문헌 검색 전략
해당 주제와 관련된 연구를 확인하기 위해 PubMed/MEDLINE, Scopus, Web of Science 데이터베이스에서 다음의 불리언 검색 구문(Boolean search syntax)을 사용하여 포괄적인 검색을 실시하였다: ("rest interval" OR "inter-set rest" OR "interset rest" OR "rest period*" OR "rest between sets" OR "resting interval" OR "resting period" OR "recovery interval") AND ("resistance training" OR "resistance exercise" OR "weight lifting" OR "weightlifting" OR "strength exercise" OR "strength training" OR "strengthening" OR "resistive exercise" OR "resistive training") AND ("muscle hypertrophy" OR "muscular hypertrophy" OR "muscle mass" OR "lean body mass" OR "fat-free mass" OR "fat free mass" OR "muscle fiber" OR "muscle size" OR "muscle fibre" OR "muscle thickness" OR "cross-sectional area" OR "computed tomography" OR "magnetic resonance imaging" OR "ultrasound" OR "DXA" OR "DEXA" OR "bioelectrical impedance analysis"). 이전 연구에서 기술된 바와 같이 [16], 포함 기준을 충족할 수 있는 추가 연구를 발굴하기 위해 검색된 논문 및 관련 리뷰 논문의 참고문헌 목록도 검토하였으며, 저자들의 해당 주제에 대한 개인적 지식도 활용하였다 [17]. 또한 포함된 연구의 인용 문헌에 대해 Google Scholar에서 전방(forward) 및 후방(backward) 이차 검색을 수행하였다.
이전에 기술된 바와 같이, 검색 과정은 3명의 연구자(LG, AS, MR)가 별도로 수행하였다. 처음에는 온라인 소프트웨어(https://www.rayyan.ai/)를 사용하여 포함/제외 기준을 충족할 가능성이 있는 연구를 파악하기 위해 모든 제목과 초록을 선별하였다. 잠재적으로 관련성이 있다고 판단된 논문은 전문(full text)을 검토하여 포함 여부를 결정하였다. 검색팀에서 해결하지 못한 이견은 네 번째 연구자(BJS)가 최종 판정하였다. 검색은 2024년 3월에 완료되었다.
포함 기준
다음 기준을 충족하는 연구를 포함하였다: (a) 무작위 설계(within-group 또는 between-group 설계)로서, 건강한 성인(만 18세 이상)에서 다른 모든 훈련 변수를 통제(볼륨의 경우 세션당 근육군당 세트 수 또는 세션당 볼륨 부하[세트 × 반복 횟수 × 중량]로 대표)한 상태에서 서로 다른 세트 간 휴식 시간을 비교하여, 검증된 측정 방법(이중에너지 X선 흡수계측[DXA], 생체전기 임피던스 분석(bioelectrical impedance analysis), 자기공명영상[MRI], 전산화단층촬영[CT], 초음파, 근육 생검(biopsy) 또는 사지 둘레 측정)으로 훈련 전후 제지방량/근육량 변화를 추정한 연구; (b) 최소 4주간 주 2회 이상 RT 세션을 포함; (c) 동료 검토 영어권 학술지 또는 프리프린트 서버에 출판. 다음에 해당하는 연구는 제외하였다: (a) 근비대 반응을 저해할 수 있는 동반 질환(근골격계 질환/손상/심혈관 이상)을 가진 참가자를 포함; (b) 불균등한 식이 보충제 제공을 사용(즉, 한 그룹에는 특정 보충제, 다른 그룹에는 대안 보충제/위약을 제공).
데이터 추출
3명의 연구자(KD, EA, MW)가 포함된 각 연구에서 다음 데이터를 독립적으로 추출하고 코딩하였다: 저자명, 제목 및 출판 연도, 표본 크기, 참가자 특성(성별, 훈련 상태, 나이), 훈련 중재 설명(기간, 볼륨, 빈도, 방식), 영양 통제 여부(예/아니오), 제지방량/근육량 평가 방법(DXA, MRI, CT, 초음파, 생검, 둘레 측정), 훈련 전후 제지방량/근육량의 평균값 및 해당 표준편차. 휴식 시간이 시간에 따라 변동된 경우, 평균값을 계산하여 보고하였다. 제지방량/근육량 변화에 대한 측정값이 보고되지 않은 경우, 이전에 기술된 바와 같이 [16] 해당 데이터를 얻기 위해 교신저자에게 연락을 시도하였다. 데이터를 얻을 수 없는 경우, 온라인 소프트웨어(https://automeris.io/WebPlotDigitizer/)를 통해 그래프에서 데이터를 추출하였다(가능한 경우). 코더 편향(coder drift) 가능성을 고려하여, 평가를 위해 무작위로 선정된 연구의 30%를 세 번째 연구자(AS)가 재코딩하였다 [18]. 사례별 일치도(per case agreement)는 동일하게 코딩된 변수의 수를 전체 변수 수로 나누어 산출하였다. 수용 기준은 평균 일치도 0.90 이상이었다. 추출된 데이터의 불일치는 코더들의 토론과 상호 합의를 통해 해결하였다.
방법론적 질 평가
포함된 연구의 방법론적 질은 "종단 설계 저항 훈련 평가 표준 방법(Standards Method for Assessment of Resistance Training in Longitudinal Designs, SMART-LD)" 척도를 사용하여 평가하였다 [16]. SMART-LD 도구는 연구 편향(bias)과 보고 품질을 복합적으로 다루는 20개 문항으로 구성되며, 다음과 같이 구분된다: 일반(문항 1–2), 참가자(문항 3–7), 훈련 프로그램(문항 8–11), 결과(문항 12–16), 통계 분석(문항 17–20). 체크리스트의 각 문항은 기준이 충분히 표시되면 1점, 불충분하게 표시되면 0점을 부여한다. 모든 문항의 값을 합산하여 최종 총점으로 연구를 다음과 같이 분류한다: "양호(good quality)" (16–20점), "보통(fair quality)" (12–15점), "불량(poor quality)" (≤11점). 3명의 검토자(EE, AM, PAK)가 각 연구를 SMART-LD 도구를 사용하여 독립적으로 평가하였으며, 이견은 다수결로 해결하였다. 연구 등급에 관계없이 모든 데이터를 포함하였다.
통계 분석
모든 메타분석은 베이지안 프레임워크(Bayesian framework) 내에서 수행되었으며, 이를 통해 관심 모수(parameter)에 대한 확률적 진술(probabilistic statement)을 사용하여 표준 빈도주의(frequentist) 접근법에 비해 결과를 보다 직관적으로 해석할 수 있었다 [19]. 베이지안 프레임워크는 효과의 존재 또는 부재에 관한 메타분석 결과의 이분법적 해석(예: p값 사용)을 피하고, 대신 평균 효과에 대해 가장 가능성 높은 값을 기술하는 데 더 큰 비중을 두면서 [19], 어떤 세트 간 휴식 시간이 가장 큰 근비대를 유발할 가능성이 높은지와 같은 실제적 질문을 다룬다. 세트 간 휴식 시간 스펙트럼에 걸친 비교를 용이하게 하기 위해, 두 가지 구분점(cut-point) 체계를 사용하여 기간을 분류하였다. 첫 번째는 짧은(≤60초)과 긴(>60초)의 이진 분류이며, 두 번째는 4범주 분류(짧은: ≤60초, 중간: 60초 초과 120초 미만, 긴: 120초 이상 180초 미만, 매우 긴: ≥180초)이다. 이 구분점은 연구 전반에서 사용된 일반적인 휴식 시간에 기반한다.
서로 다른 측정 기술의 사용으로 인해, 효과 크기는 표준화 평균 차이(standardized mean difference, SMD)를 사용하여 정량화하였다. 근력 및 조건화 분야에서 일반적으로 사용되는 소규모 표본 크기를 고려하여 편향 수정(bias correction)을 적용하였다 [20]. 본 메타분석의 일차 측정값은 하나의 세트 간 휴식 시간 범주의 기저선 변화에서 다른 범주의 기저선 변화를 차감하고 사전 중재 풀링 표준편차(pre-intervention pooled standard deviation)로 나누어 얻은 통제 크기 기반 SMD(controlled magnitude-based SMDs)였다 [20]. 포함된 중재의 전반적인 효과를 평가하기 위해, 초기 분석은 비통제 SMD를 사용하여 수행되었다 [21]. 효과 크기의 크기 해석은 근력 및 조건화 결과에 대해 개발된 소, 중, 대 기준값과의 비교를 통해 이루어졌다 [22].
비통제 SMD를 사용하여 결과를 요약하기 위해 세트 간 휴식 시간을 범주형 변수로 포함한 3수준 계층적 모형(three-level hierarchical model)을 사용하였다. 이진 및 4범주 표현에 걸쳐 비교하기 위해, 각각 통제 SMD를 사용한 쌍대(직접 비교만) 및 네트워크(직접 및 간접 비교) 메타분석 접근법을 적용하였다. 측정 부위(전신, 대퇴부, 팔)별로 구분한 단변량 분석도 수행하였다. 직접 비교의 경우, 측정 부위 간 상관관계를 허용하는 다변량 분석도 수행하였다. 네트워크 메타분석(network meta-analysis)은 근거 합성(evidence synthesis)에서 점점 더 보편화되고 있으며, 개별 연구들이 모든 수준을 직접 비교할 가능성이 낮은 질적으로 상이한 처치를 비교하는 데 가장 많이 활용된다 [23]. 이 기법은 두 수준을 비교하는 연구에서 쌍대 효과 크기를 계산하고(직접 근거), 공통 비교군(common comparator)을 통해 다른 수준을 비교하는 간접 근거를 생성한다 [23]. 네트워크에서 모든 세트 간 휴식 시간 범주에 걸쳐 근비대의 잠재적 차이를 요약하기 위해 누적 순위 곡선 하면적(Surface Under the Cumulative Ranking curve, SUCRA [24])을 사용하였다. 각 범주에 대해 백분율로 표현된 SUCRA 값을 계산하였으며, 이는 해당 범주가 다른 범주에 비해 가장 높거나 높은 순위의 근비대를 보일 가능성을 나타낸다. 해당하는 경우, 확률은 분포의 영(0) 초과 비율을 나타내는 p값으로 보고하였다.
모든 모형에 정보적 사전분포(informative prior)를 사용하였다. 계층적 메타회귀(hierarchical meta-regression)의 경우, SMD로 표현된 근력 및 조건화 결과에 관한 대규모 메타분석에서 얻은 정보적 사전분포를 포함하여 중재 전후 평균 변화를 설정하였다 [22]. 통제 효과 크기의 경우, 비교 효과 크기를 사용한 근력 및 조건화 분야의 유사 연구를 활용하였다 [25]. 연구 간 표준편차에 대한 정보적 사전분포는 다수의 이전 메타분석에서 생성된 예측 분포 분석에 기반하였다 [26]. SMD를 사용하는 메타분석에서 중재 변화 점수(intervention change score)에 대해 사전 기반 없이 고정값(예: 0.7)의 사전-사후 연구 상관관계를 사용하는 것은 일반적인 한계이다 [27]. 이 한계를 해결하기 위해, 각 연구의 표본 오차를 상관계수 0.9에서 계산된 표본 오차를 하한으로, 상관계수 0.5에서 계산된 표본 오차를 상한으로 하는 정보적 균일 사전분포(informative uniform prior)를 사용하여 추정하였다. 모든 분석은 R에서 베이지안 표본추출을 위한 R2OpenBUGS 패키지를 사용하여 수행되었다 [28].
분석의 정확성, 투명성, 재현성을 높이기 위해 WAMBS-체크리스트(When to Worry and How to Avoid Misuse of Bayesian Statistics, WAMBS)를 사용하였으며, 비정보적 사전분포(non-informative prior)를 포함한 민감도 분석(sensitivity analysis)을 실시하였다 [29]. WAMBS-체크리스트에 대한 문서는 일차 분석에 대한 기타 진단 결과(퍼널 플롯(funnel plot) 및 네트워크에서의 처치 비교에 걸친 연구 특성 분포의 전이성(transitivity) 확인 포함)와 함께 보충 파일에 제공된다. 네트워크에서의 루프(loop) 부재와 불충분한 데이터로 인해 네트워크에 대한 일관성 분석(consistency analysis)은 수행하지 않았다.
결과
초기 선별에서 359개 연구를 검토하여 포함 기준을 잠재적으로 충족하는 11개 연구를 확인하였다. 이들 연구의 전문을 검토한 후 2개 연구를 제외하였다: 1개는 조건 간 세트 볼륨 또는 볼륨 부하가 동등화되지 않았기 때문이고 [30], 다른 1개는 해당 운동의 첫 번째 세트에서 부하 범위가 동등화되지 않았기 때문이다 [31].
연구 특성
8개 연구는 젊은 참가자(18–35세)를 대상으로 하였고 [32–39], 1개 연구는 고령 참가자(65세 초과)를 대상으로 하였다 [40]. 6개 연구는 비훈련 참가자를 포함하였고 [32–36, 40], 3개 연구는 저항 훈련 경험자를 포함하였다 [37–39]. 6개 연구는 남성 참가자만을 대상으로 하였고 [32, 33, 37–40], 1개 연구는 여성 참가자만을 대상으로 하였으며 [36], 1개 연구는 남녀 참가자 모두를 대상으로 하였고 [35], 1개 연구는 참가자의 성별을 명시하지 않았다 [34]. 3개 연구는 전신 근비대를 평가하였고 [32, 33, 40], 5개 연구는 상지 근비대(상완이두근 및 상완삼두근)를 평가하였으며 [33, 34, 37–39], 7개 연구는 하지 근비대(대퇴사두근 및 전체 대퇴부)를 평가하였다 [33–39]. 포함된 연구의 기간은 5주에서 10주 사이였다.
비통제 효과 크기 메타분석
9개 연구에서 얻은 총 19개 측정값(대퇴부: 10개, 팔: 6개, 전신: 3개)에 대해 계층적 모형을 사용한 비통제 효과 크기 메타분석 결과, 서로 다른 세트 간 휴식 시간에 걸쳐 SMD가 상당히 중복되는 것으로 나타났다[이진 분류: 짧은: 0.48 (95% CrI: 0.19–0.81), 긴: 0.56 (95% CrI: 0.24–0.86); 4범주 분류: 짧은: 0.47 (95% CrI: 0.19–0.80), 중간: 0.65 (95% CrI: 0.18–1.1), 긴: 0.55 (95% CrI: 0.15–0.90), 매우 긴: 0.50 (95% CrI: 0.14–0.89)]. 결과에는 상당한 이질성이 존재하였다. 중심 추정값은 중재 전반에 걸친 개선이 중간에서 대(medium to large) 수준일 가능성이 가장 높음을 시사하였으며, 이는 본 리뷰에 포함된 중재가 휴식 시간에 관계없이 전반적으로 효과적이었음을 강조한다.
통제 효과 크기 메타분석
이진 분류(짧은 vs. 긴) 통제 효과 크기에 대한 단변량 및 다변량 메타분석을 신체 부위별(팔, 대퇴부, 전신)로 구분하여 수행하였다. 팔과 대퇴부에서 유사한 결과가 나타났으며, 중심 추정값은 긴 휴식 시간을 소폭 지지하였다[팔: 0.13 (95% CrI: −0.27–0.51); t: 0.10 (75% CrI: 0.02–0.31); 대퇴부: 0.17 (95% CrI: −0.13–0.43); t: 0.17 (75% CrI: 0.02–0.22)]. 반면, 전신의 경우 중심 추정값은 영(0)에 근접하면서 짧은 휴식 시간을 소폭 지지하였다[전신: −0.08 (95% CrI: −0.45–0.29); t: 0.08 (75% CrI: 0.02–0.27)]. 다변량 메타분석 모형을 적용하자 불확실성이 소폭 감소하였으며, 더 작은 중심 추정값은 모두 긴 휴식 시간을 소폭 지지하였다[팔: 0.11 (95% CrI: −0.26–0.48); 대퇴부: 0.16 (95% CrI: −0.13–0.41); 전신: 0.03 (95% CrI: −0.28–0.36)].
세트 간 휴식 시간의 4범주에 대한 통제 효과 크기는 네트워크 메타분석으로 분석하였다. 팔과 대퇴부의 단변량 분석에 충분한 데이터가 확보되었다. 전반적으로, 신체 두 부위 모두에서 효과 크기 추정값과 SUCRA 값은 짧은 범주를 초과하는 휴식 시간이 더 효과적임을 시사하였다.
하위분석
이진 효과 크기의 직접 비교에 대한 하위분석이 세트 종료 시점(즉, 순간적 근육 실패(momentary muscular failure)까지 훈련 또는 비실패) 및 훈련 상태(비훈련 참가자를 포함한 설계에 특화)에 따라 연구를 구분하여 수행되었다. 순간적 근육 실패까지의 훈련을 포함한 3개 연구의 데이터로 구성된 다변량 분석이 대퇴부 [0.31 (95% CrI: −0.03–0.61)] 및 팔 [0.04 (95% CrI: −0.37–0.44)] 근비대에 대해 수행되었다. 마찬가지로, 비실패 RT를 포함한 3개 연구의 데이터로 구성된 다변량 분석이 대퇴부 [0.27 (95% CrI: −0.02–0.51)], 팔 [0.04 (95% CrI: −0.37–0.44)], 전신 [−0.06 (−0.40–0.27)] 근비대에 대해 수행되었다. 일관된 결과는 서로 다른 세트 종료 시점에서 휴식 시간의 영향에 차이가 없음을 나타내는 근거를 제공하지 못하였다. 마지막으로, 비훈련 참가자를 포함한 6개 연구의 데이터로 구성된 다변량 분석에 충분한 데이터가 확보되어, 대퇴부 [0.17 (95% CrI: −0.15–0.47)], 팔 [0.02 (95% CrI: −0.41–0.46)], 전신 [−0.05 (−0.43–0.26)] 근비대에 대해 수행되었다. 훈련 경험자에 대한 결과를 하위분석하기에는 데이터가 불충분하였다.
소규모 연구 편향 분석
퍼널 플롯의 시각적 검사 결과 소규모 연구 편향(small study bias)의 근거는 확인되지 않았다.
방법론적 질적 평가
SMART-LD 도구를 통한 포함 연구의 질적 평가 결과, 평균 점수는 가능한 20점 만점 중 15점이었다(범위: 12–17점). 4개 연구는 양호 수준으로 판정되었고 [34, 37, 38, 40], 4개 연구는 보통 수준으로 판정되었으며 [32, 35, 36, 39], 1개 연구는 불량 수준으로 판정되었다 [33].
고찰
본 메타분석은 서로 다른 휴식 시간의 효과를 근비대 측정값과 직접 비교한 연구들의 데이터를 정량화하였다. 비통제 효과 크기를 사용한 초기 메타회귀(meta-regression)는 연구들 사이에 상당한 이질성이 존재함을 강조하였으나, 동시에 대부분의 중재가 휴식 시간에 관계없이 근비대 적응을 효과적으로 유발하였음을 보여주었으며, SMD는 중간에서 대 수준으로 분류될 수 있는 크기였다. 짧은(≤60초)과 긴(>60초) 휴식 시간을 비교한 이진 분류에서, 긴 휴식 조건을 더 지지하는 소폭 더 큰 중심 추정값이 나타났다(SMD = 0.56 대 0.48). 데이터를 추가로 층화하면, 짧은(SMD = 0.47), 중간(SMD = 0.65), 긴(SMD = 0.55), 매우 긴(SMD = 0.50) 휴식 시간 간에 미미한 차이가 나타났다. 이 결과들은 근비대 촉진을 목적으로 휴식 시간을 변경하는 것이 뚜렷한 이점이 없음을 시사한다. 그러나 상당한 이질성을 감안할 때, 소수의 연구를 대상으로 한 메타회귀는 강한 추론을 도출하는 능력이 제한적이며, 관찰된 차이는 연구 분포의 우연적 불균형으로 인한 결과일 수 있다. 따라서 본 연구의 주요 추론은 이진 분류를 통한 직접 쌍대 비교만(bivariate categorization) 또는 네트워크 모형을 통한 직접 및 간접 쌍대 비교(4범주) 모두를 포함하는 통제 효과 크기로 구성된 메타분석에 집중되었다.
메타분석은 베이지안 프레임워크 내에서 수행되었으며, 이는 네트워크 모형에서 가장 일반적으로 사용되는 방식으로 결과를 더 잘 해석하기 위한 순위 및 확률 출력값을 자연스럽게 생성한다 [41]. 또한, 베이지안 모형은 정보적 사전분포의 사용을 허용하며, 본 연구에서는 효과 크기의 표본 오차, 연구 간 변동, 추정값의 정밀도를 높이기 위한 이전 지식을 활용하여 효과 크기 값에 정보적 사전분포를 설정하였다.
신체 부위별 하위분석
상지와 하지 근비대에 대한 휴식 시간의 효과를 하위분석한 결과, 60초 초과 휴식 시간에서 소폭의 이점이 있음을 시사한다. 이진 분류에서, 팔에 대한 풀링 효과 크기는 긴 휴식 시간이 짧은 휴식 시간보다 근비대에 더 유리함을 소폭 지지하였다(SMD = 0.13). 효과가 영(0)보다 클 확률은 74%였으며, 효과의 차이가 소(small) 수준을 초과할 확률은 45%에 불과하였다. 마찬가지로, 대퇴사두근의 풀링 효과 크기는 긴 휴식 시간이 짧은 휴식 시간보다 소폭 유리함을 지지하였다(SMD = 0.17). 이 효과가 영(0)보다 클 강한 확률이 존재하였지만(88%), 효과의 차이가 소 수준을 초과할 확률은 54%에 불과하였다. 상지와 하지 분석 모두에서 효과 차이가 중(medium) 수준을 초과할 확률은 매우 낮았다(SMD = 0.18 및 0.15). 반대로, 전신 근비대 측정값에서는 짧은 휴식 시간이 긴 휴식 시간보다 소폭 더 큰 효과를 보였으나(SMD = −0.08, p(>0) = 0.69, p(>소) = 0.36), 전신 데이터를 제공하는 연구가 단 3개뿐이어서 상당한 불확실성이 존재한다.
사지 근비대와 전신 근비대 연구 결과 간의 잠재적 불일치는 평가 방법의 차이와 관련될 수 있다. 전신 근육 성장 측정값은 DXA, BIA 및 수중 밀도측정(hydrodensitometry)을 통한 제지방량(fat-free mass, FFM) 추정값에 기반하였으며, 이는 종종 근비대의 대리 지표로 사용된다 [42]. 그러나 FFM은 지방량을 제외한 모든 신체 조직을 포함하며, RT 중 발생하는 FFM 변화의 대부분은 골격근으로 구성되지만 수분과 무기질 같은 다른 성분들도 결과에 영향을 미칠 수 있다 [43]. 반면, 사지 평가의 대부분은 MRI 및 초음파를 통한 근육량 변화의 직접 측정 방법을 채택하였다. 직접 평가 방법이 간접 평가보다 RT 유발 근비대를 더 민감하게 감지하는 것으로 나타난 점을 고려할 때 [44, 45], 전신 분석 결과는 주의하여 해석해야 한다.
휴식 시간과 볼륨 부하
60초 초과 휴식 시간이 근비대에 미치는 잠재적 이점은 훈련 세션 동안 볼륨 부하가 유지되는 것에 기인할 수 있다. 연구에 따르면 짧은 휴식 시간(≤60초)은 긴 휴식 시간에 비해 다중 세트에 걸쳐 수행되는 반복 횟수를 상당히 감소시키며 [11, 12, 46], 이는 장기적인 근육 적응에 부정적인 영향을 미칠 수 있다. 이 가설은 Longo 등 [35]의 연구에 의해 지지되는데, 그들은 10주 중재 기간 동안 60초 대비 180초의 세트 간 휴식 시간으로 훈련할 때 대퇴사두근 횡단면적(cross-sectional area)이 더 크게 증가하였다고 보고하였다(각각 13.1% vs. 6.8%). 주목할 점은, 짧은 휴식 조건에서 볼륨 부하가 긴 휴식 조건에 비해 유의하게 더 크게 감소하였다는 것이다(3개 세트에 걸친 평균 반복 횟수: 각각 9.8 ± 2.9 vs. 16.1 ± 5.2). 그러나 조건 간 볼륨 부하를 동등화하기 위해 추가 세트를 수행한 경우 유사한 근비대가 관찰되었다.
반면, 이전 근거들은 120초 대 180초 휴식 시간을 비교할 때 볼륨 부하의 차이가 수렴되는 경향이 있음을 시사한다 [11, 46]. 매우 짧은 휴식 시간(≤60초)과 비교할 때, 본 연구의 네트워크 메타분석은 매우 긴 휴식 시간(≥180초)이 대퇴사두근 근비대와 관련하여 중간(61–119초) 및 긴(120–179초) 휴식 시간에 비해 소폭 유리함을 시사하였다. 그러나 이 데이터는 높은 불확실성을 보였으며, 조건 간 중간 추정값의 U자형 반응은 이 결과의 신뢰성에 추가적인 의문을 제기한다. 팔 근비대 분석에서는 중간 휴식 시간(>60초)을 초과하는 휴식 시간이 뚜렷한 효과를 보이지 않았다. 향후 연구는 휴식 시간의 단계적 증가가 근육 적응을 변화시키는지, 그리고 볼륨 부하가 그 과정에서 어느 정도 역할을 하는지를 더 잘 규명하기 위해 이 주제를 더 상세히 탐색해야 한다.
근력 실패 근접도 하위분석
세트 종료 시점에 대한 하위분석 결과, 세트 종료 시의 근력 실패 근접도(즉, 실패 또는 비실패)는 휴식 시간과 근비대 간의 상호작용에 유의미한 영향을 미치지 않는 것으로 나타났다. 두 분석의 중심 추정값 모두 RT 중 도달한 근력 실패 근접도와 관계없이 대퇴사두근에서 긴 휴식 시간의 근비대 이점을 시사하였다. 그러나 효과의 크기는 상대적으로 작았다(비실패 및 실패 조건에서 각각 SMD = 0.27 및 0.31). 반면, 팔에서는 근력 실패 근접도에 관계없이 휴식 시간의 영향이 무시할 수 있는 수준이었다(SMD = 0.04). 이 결과는 더 짧은 휴식 시간이 근력 실패에 더 가까이 훈련할 때 더 긴 휴식 시간에 비해 벤치 프레스 수행 능력을 더 크게 저해한다는 데이터와 다소 대조적이다 [47]. 급성 및 종단 결과 간의 잠재적 불일치를 더 잘 이해하기 위한 추가 연구가 필요하다.
참가자 훈련 상태 하위분석
훈련 상태가 휴식 시간에 미치는 잠재적 영향에 대한 하위분석 결과, 비훈련 개인은 대퇴사두근 훈련 시 긴 휴식 시간에서 소폭의 근비대 이점을 보였다(SMD = 0.17). 그러나 휴식 시간은 비훈련 개인의 팔 및 전신 근비대 측정값에 무시할 수 있는 효과를 보이는 것으로 나타났다(각각 SMD = 0.02 및 −0.05). 이 데이터는 Grgic 등 [15]의 체계적 문헌고찰과 비교적 일치하며, 그들은 초보 훈련자의 근비대 증진을 위해 더 짧은 휴식 시간과 더 긴 휴식 시간 모두 동등하게 실행 가능한 선택지라고 결론지었다. Grgic 등 [15]의 체계적 문헌고찰은 또한 훈련 경험자가 긴 휴식 시간에서 이점을 얻을 수 있으며, 이는 아마도 다중 세트 프로토콜에 걸쳐 더 큰 볼륨 부하를 허용함으로써 가능하다고 제안하였다. 안타깝게도 훈련 경험이 있는 리프터의 결과를 하위분석하기에는 데이터가 불충분하여, 이 주장을 추가로 일반화할 수 없었다. 따라서 훈련 상태가 휴식 시간에 대한 반응에 어떻게 영향을 미치는지를 더 잘 이해하기 위한 추가 연구가 필요하다.
제한점
본 분석에는 운동 처방에 대한 실제적 추론을 도출할 때 고려해야 할 몇 가지 제한점이 있다. 첫째, 포함된 연구들은 운동 선택에 있어 상당한 이질성이 있었으며, 프로토콜은 자유 중량 및 기구, 단관절(single-joint) 및 다관절(multi-joint) 운동(경우에 따라 이러한 방식의 조합)을 다양하게 사용하였다. 운동의 복잡성이 세트에 걸친 피로 반응을 변화시킬 수 있음을 감안할 때 [11], 휴식 시간 처방은 사용된 운동의 유형에 따라 달라져야 할 가능성이 있다. 둘째, 체간 근육(흉근, 광배근, 삼각근 등)에 대한 휴식 시간의 효과를 조사한 연구가 없으며, 이러한 근육 그룹이 사지 근육과 다르게 짧은 휴식 시간에 반응할 가능성이 있지만, 이는 그렇지 않을 가능성이 높다. 셋째, 포함된 연구에서 훈련 볼륨은 전반적으로 중간 수준이었으므로, 근육군당 세트 수가 더 많을 경우 휴식 시간의 차이가 근비대에 어떤 영향을 미치는지는 아직 미결 상태로 남아있다. 넷째, 현재까지의 연구 대부분이 비훈련 상태의 젊은 참가자를 대상으로 수행되었다. 따라서 저항 훈련 경험자와 고령자에게 결과를 더 잘 일반화하기 위해 추가 연구가 필요하다. 마지막으로, 관찰된 효과 차이는 영(0)과 소 사이에 있을 가능성이 높지만, 중재 기간이 비교적 짧았다(5–10주). 따라서 더 긴 시간 틀에 걸쳐서는 근육량 증가의 누적 차이가 더 뚜렷하게 나타날 가능성이 있다.
결론
본 메타분석은 근비대가 광범위한 휴식 시간 범위에 걸쳐 달성될 수 있음을 시사하며, 동시에 근비대를 위해 짧은 세트 간 휴식 시간보다 긴 세트 간 휴식 시간을 적용하는 것이 소폭의 이점을 제공함을 시사한다. 긴 세트 간 휴식 시간을 지지하는 효과는 팔 및 하지 근육 사이에서 비교적 일관되게 나타났으며, 결과는 RT가 실패까지 수행되는지 또는 비실패로 수행되는지 여부에 따라 유의미한 영향을 받지 않았다. 이 결과들은 근비대 관련 목표를 위해 비교적 짧은 휴식 시간(30–90초)을 처방하는 미국 국가근력조건화협회의 권고와 일치하지 않는다 [7]. 따라서 근비대 달성을 위한 현행 휴식 시간 처방 지침은 재검토가 필요하다.
현재 근거는 세트 간 90초 초과 휴식이 근비대 적응을 추가로 향상시키는지 여부에 대해 여전히 엇갈린다. 본 분석은 이와 관련한 이점의 근거에 의문을 제기한다. 그러나 근거의 불확실성을 감안할 때, 해당 주제에 대한 더 나은 통찰을 제공하기 위해 광범위한 휴식 시간 스펙트럼에 걸쳐 근비대 측정값을 비교하는 추가 연구가 필요하다.
관련 논문
저항 훈련에서 실패 근접도가 골격근 비대에 미치는 영향: 메타분석을 포함한 체계적 문헌고찰
12개 공유 용어
주간 저항 훈련 볼륨과 근육량 증가 사이의 용량-반응 관계: 체계적 문헌고찰 및 메타분석
10개 공유 용어
근비대의 메커니즘과 저항 훈련에의 적용
13개 공유 용어
운동할 시간이 없다고? 시간 효율적인 근력 및 근비대 훈련 프로그램 설계: 내러티브 리뷰
12개 공유 용어
저항 훈련 중 가동 범위가 근육 발달에 미치는 효과: 체계적 문헌고찰
11개 공유 용어