환자분들이 논문을 공부하고 오실때가 많습니다. 하지만 논문을 볼 때 표,그래프 및 결과 해석이 쉽지는 않습니다.
몇가지만 알고 계셔도도 더욱 논문 이해가 쉬울 것입니다!
표 (table)
표는 모든 논문에서 중요합니다.
중요한 것은 어느 논문이든간에 "p-value" 가 나오는데, p-value 가 통계 분석의 핵심입니다.
이해하기는 어려운 내용이기때문에 쉽게 설명하면 (정확히 그런 의미는 아니지만) p-value 값에 곱하기 100을 하면 "그룹 (혹은 군) 간에 별 차이가 없을 확률" 로 생각하시면 판하십니다.
우선 위 표의 2번째 세로열 "total" (전체 환자들) 의 특성이 있고, 오른쪽 3번째 4번째 열에는 "ISG 라는 그룹"과 "LSG 라는 그룹"의 특성이 있습니다. 여기서 가장 오른쪽에 표시해둔 것이 p-value 입니다.
예를 들어 아래와 같이 해석을 할 수 있겠습니다.
- Initial age 의 p-value (0.081) 를 곱하기 100을 하면 "8.1" 이다 →8.1%의 확률로 두 그룹의 나이가 동일
- Neoadjuvant chemotherapy (수술전 항암) 은 곱하기 100을 하면 → 0.1%의 확률로 두 그룹간에 수술 전 항암을 받았을 확률이 동일하다.
통상적으로 의학 통계 분석을 할때, 5%의 미만의 확률로 동일하다면, "그룹간에 차이가 확실히 있다"고 합니다 (p-value가 0.05보다 작을 때). 또 딱 정해진 숫자가 없지만 비록 5% 이상이더라도 확률이 낮으면 "그런 경향이 있다" 라고도 합니다.
따라서 위의 예시에서는 처음 나이 (initial age) 는 ISG, LSG 두 군간에 확실한 차이는 없지만, LSG 그룹의 환자들의 나이가 더 많은 경향이 있다고 해석할 수 있겠습니다.
또 수술전 항암을 받은 환자들은 ISG 그룹에서 확실히 더 많이 받았다고 해석할 수 있습니다.
생존 그래프 (figure)
왼쪽 그래프는 오른쪽으로 갈 수록 (시간이 지날수록) 올라가고, 오른쪽 그래프는 오른쪽으로 갈 수록 낮아지는 것을 볼 수 있습니다.
세로축 (y축) 이 무엇을 나타낸건지에 따라 다릅니다. 여기선 영어 해석이 중요한데..
- 왼쪽 그래프는 "cumulative recurrence rate"
: 누적 재발 발생률. 시간이 지날수록 전체 환자들중에서 재발은 발생하므로, 이 환자들을 계속 합치게 되면 점점 더 증가하게 됩니다.
- 오른쪽 그래프는 "overall survival rate"
: 살아있을 확률. 시간이 지날수록 사망하는 환자들은 계속 쌓이기 때문에 전체 환자들 중에서 살아있는 환자들의 퍼센트(%)는 줄어들게 됩니다.
- 가끔 "recurrence free survival rate" 라는 것도 있습니다. 말그대로 재발(recurrence) 에서 자유로운 (free) 생존 비율인데요, 암은 시간이 지날수록 재발하는 환자들이 생깁니다.
이 환자들을 빼고 남아있는 사람들의 비율을 그리는 그래프이기 때문에, 시간이 지날수록 그래프는 점점 줄어들게 됩니다.
자 이제 왼쪽 그래프를 보면, 파란색 ISG 그룹의 환자들이 주황색 LSG 그룹의 환자들보다 일정하게 높습니다. "ISG 그룹의 환자들이 시간이 지날수록 재발을 더 많이해서 점점 재발을 한 사람들이 쌓여서 더 많이 증가한 것"이지요.
그렇다면 두 그룹간에 정말로 차이가 있는 것일까요? 혹은 통계적으로 차이가 있을까요?
: 여기서도 위의 p-value 가 쓰입니다. 본 그래프에는 Log-rank p-value=0.083 입니다.
: 위에서 설명한것처럼 p-value 가 0.05 이하일때 차이가 있다고 하기 때문에, 연구 대상자들 중 실제로 파란색 그룹이 주황색 그룹보다 더 많이 재발을 하였지만, 그 차이가 미미해서 차이가 없다 라고 말할 수 있겠습니다. (log-rank 는 통계 분석 방법 중 하나. Breslow 등 다른것도 있지만 p-value 해석은 동일합니다)
: 반면 오른쪽 그래프를 보면 주황색 그룹이 파란색 그룹보다 시간이 지날수록 살아있는 환자들이 더 많습니다 (그래프가 더 위에 있음). 따라서 "LSG 그룹의 환자들이 시간이 지날수록 더 많이, 오래 살았다"고 해석할 수 있습니다. 그리고 p-value 를 보면 0.046 이기때문에 "통계적으로 유의하게, 실제로 LSG 그룹의 환자들이 더 많이 오래 살았다" 라고 할 수 있는 것입니다.
표 (table)
"유의하다", "유의한 차이"
: 유의하다는 것은 의미가 있다는 뜻. 통계적으로 두 군간에 실제로 차이가 있다고 해석
"IF", Impact factor, 학술지의 영향력 지수
: 논문 학술지는 여러종류가 있습니다. 높은 IF 일수록 인용이 많이 되고 학술지의 질이 높다고 볼 수 있기 때문에, 점수가 높은 학술지에서 발표한 논문일수록 더 의미를 갖습니다. (물론 낮은 점수의 학술지 논문도 좋은 논문이 많다)
"Doi:"
: 우리가 인터넷을 할때 모든 페이지에 www. 로 시작하는 고유한 주소를 가진것처럼, 논문도 주소가 있습니다. Doi 는 그 논문의 고유한 주소. (예: https://doi.org/10.1038/s41598-021-82485-w)
"PMID"
: 대부분의 논문들이 모아있는 사이트가 있습니다 (pubmed.gov). 이 사이트에선 논문별로 번호를 하나씩 주는데요, 위의 doi 처럼 고유한 번호입니다. (예: PMID: 33531549)
"SCI, SCIE 급 논문", "SCOPUS"
: 미국에서 만든 학술지 데이터베이스. 간단히 설명하면, 미국에서 영향력이 뛰어난 학술지들을 모은 데이터베이스라고 생각하시면 됩니다.
: SCI 는 옛~날에 종이나 CD로 출판하는 학술지고, SCIE는 인터넷으로 출판된 학술지입니다 (2020년부터 통합되었음). 추가적으로 "SCOPUS" 라는 네덜란드서 만든 데이터베이스입니다.
: SCI/SCIE 급 논문은 좋은 곳에 실린 논문! (일반적으로 SCI/SCIE > SCOPUS > 국내 KCI (한국판 SCI) > 일반 학술지)
가끔 환자분들이 논문을 읽어오시는 분들이 종종 계십니다.
자신의 병이 어떤 병인지, 또 왜 내가 이 치료를 받아야하는지 안다고 해서 예후가 달라지는 것은 아니겠지만, 자신이 어쩌면 친구처럼 평생 동반해야하는 것이기 때문에 병에 대해 아는 것은 매우 올바른 방향입니다.
하지만 주위에서, 인터넷에 떠도는 정보보다는 이런 논문들이 훨씬 중요합니다!
환자분들이 논문을 공부하고 오실때가 많습니다. 하지만 논문을 볼 때 표,그래프 및 결과 해석이 쉽지는 않습니다.
몇가지만 알고 계셔도도 더욱 논문 이해가 쉬울 것입니다!
표 (table)
표는 모든 논문에서 중요합니다.
중요한 것은 어느 논문이든간에 "p-value" 가 나오는데, p-value 가 통계 분석의 핵심입니다.
이해하기는 어려운 내용이기때문에 쉽게 설명하면 (정확히 그런 의미는 아니지만) p-value 값에 곱하기 100을 하면 "그룹 (혹은 군) 간에 별 차이가 없을 확률" 로 생각하시면 판하십니다.
우선 위 표의 2번째 세로열 "total" (전체 환자들) 의 특성이 있고, 오른쪽 3번째 4번째 열에는 "ISG 라는 그룹"과 "LSG 라는 그룹"의 특성이 있습니다. 여기서 가장 오른쪽에 표시해둔 것이 p-value 입니다.
예를 들어 아래와 같이 해석을 할 수 있겠습니다.
통상적으로 의학 통계 분석을 할때, 5%의 미만의 확률로 동일하다면, "그룹간에 차이가 확실히 있다"고 합니다 (p-value가 0.05보다 작을 때). 또 딱 정해진 숫자가 없지만 비록 5% 이상이더라도 확률이 낮으면 "그런 경향이 있다" 라고도 합니다.
따라서 위의 예시에서는 처음 나이 (initial age) 는 ISG, LSG 두 군간에 확실한 차이는 없지만, LSG 그룹의 환자들의 나이가 더 많은 경향이 있다고 해석할 수 있겠습니다.
또 수술전 항암을 받은 환자들은 ISG 그룹에서 확실히 더 많이 받았다고 해석할 수 있습니다.
생존 그래프 (figure)
왼쪽 그래프는 오른쪽으로 갈 수록 (시간이 지날수록) 올라가고, 오른쪽 그래프는 오른쪽으로 갈 수록 낮아지는 것을 볼 수 있습니다.
세로축 (y축) 이 무엇을 나타낸건지에 따라 다릅니다. 여기선 영어 해석이 중요한데..
: 누적 재발 발생률. 시간이 지날수록 전체 환자들중에서 재발은 발생하므로, 이 환자들을 계속 합치게 되면 점점 더 증가하게 됩니다.
: 살아있을 확률. 시간이 지날수록 사망하는 환자들은 계속 쌓이기 때문에 전체 환자들 중에서 살아있는 환자들의 퍼센트(%)는 줄어들게 됩니다.
이 환자들을 빼고 남아있는 사람들의 비율을 그리는 그래프이기 때문에, 시간이 지날수록 그래프는 점점 줄어들게 됩니다.
자 이제 왼쪽 그래프를 보면, 파란색 ISG 그룹의 환자들이 주황색 LSG 그룹의 환자들보다 일정하게 높습니다. "ISG 그룹의 환자들이 시간이 지날수록 재발을 더 많이해서 점점 재발을 한 사람들이 쌓여서 더 많이 증가한 것"이지요.
그렇다면 두 그룹간에 정말로 차이가 있는 것일까요? 혹은 통계적으로 차이가 있을까요?
: 여기서도 위의 p-value 가 쓰입니다. 본 그래프에는 Log-rank p-value=0.083 입니다.
: 위에서 설명한것처럼 p-value 가 0.05 이하일때 차이가 있다고 하기 때문에, 연구 대상자들 중 실제로 파란색 그룹이 주황색 그룹보다 더 많이 재발을 하였지만, 그 차이가 미미해서 차이가 없다 라고 말할 수 있겠습니다. (log-rank 는 통계 분석 방법 중 하나. Breslow 등 다른것도 있지만 p-value 해석은 동일합니다)
: 반면 오른쪽 그래프를 보면 주황색 그룹이 파란색 그룹보다 시간이 지날수록 살아있는 환자들이 더 많습니다 (그래프가 더 위에 있음). 따라서 "LSG 그룹의 환자들이 시간이 지날수록 더 많이, 오래 살았다"고 해석할 수 있습니다. 그리고 p-value 를 보면 0.046 이기때문에 "통계적으로 유의하게, 실제로 LSG 그룹의 환자들이 더 많이 오래 살았다" 라고 할 수 있는 것입니다.
표 (table)
"유의하다", "유의한 차이"
: 유의하다는 것은 의미가 있다는 뜻. 통계적으로 두 군간에 실제로 차이가 있다고 해석
"IF", Impact factor, 학술지의 영향력 지수
: 논문 학술지는 여러종류가 있습니다. 높은 IF 일수록 인용이 많이 되고 학술지의 질이 높다고 볼 수 있기 때문에, 점수가 높은 학술지에서 발표한 논문일수록 더 의미를 갖습니다. (물론 낮은 점수의 학술지 논문도 좋은 논문이 많다)
"Doi:"
: 우리가 인터넷을 할때 모든 페이지에 www. 로 시작하는 고유한 주소를 가진것처럼, 논문도 주소가 있습니다. Doi 는 그 논문의 고유한 주소. (예: https://doi.org/10.1038/s41598-021-82485-w)
"PMID"
: 대부분의 논문들이 모아있는 사이트가 있습니다 (pubmed.gov). 이 사이트에선 논문별로 번호를 하나씩 주는데요, 위의 doi 처럼 고유한 번호입니다. (예: PMID: 33531549)
"SCI, SCIE 급 논문", "SCOPUS"
: 미국에서 만든 학술지 데이터베이스. 간단히 설명하면, 미국에서 영향력이 뛰어난 학술지들을 모은 데이터베이스라고 생각하시면 됩니다.
: SCI 는 옛~날에 종이나 CD로 출판하는 학술지고, SCIE는 인터넷으로 출판된 학술지입니다 (2020년부터 통합되었음). 추가적으로 "SCOPUS" 라는 네덜란드서 만든 데이터베이스입니다.
: SCI/SCIE 급 논문은 좋은 곳에 실린 논문! (일반적으로 SCI/SCIE > SCOPUS > 국내 KCI (한국판 SCI) > 일반 학술지)
가끔 환자분들이 논문을 읽어오시는 분들이 종종 계십니다.
자신의 병이 어떤 병인지, 또 왜 내가 이 치료를 받아야하는지 안다고 해서 예후가 달라지는 것은 아니겠지만, 자신이 어쩌면 친구처럼 평생 동반해야하는 것이기 때문에 병에 대해 아는 것은 매우 올바른 방향입니다.
하지만 주위에서, 인터넷에 떠도는 정보보다는 이런 논문들이 훨씬 중요합니다!