Using Large Language Models to Detect Depression From User-Generated Diary Text Data as a Novel Approach in Digital Mental Health Screening: Instrument Validation Study
https://www.sciencedirect.com/org/science/article/pii/S1438887124005806
2024, Journal of Medical Internet Reserach
1. Problem
- 우울증 연구에 사용되는 텍스트 데이터의 상당 부분은 전자 의료 기록이나 소셜 미디어에서 가져온 것이므로 자연어 사용을 완전히 반영하지 못할 수 있습니다[ 29]. 매일 글쓰기는 우울증 및 비자살적 자해 개선을 포함한 치료적 이점이 있는 보편적인 인간 활동입니다[30-34 ] . 일기 쓰기는 환자의 자기 성찰, 성장 및 치료사와의 소통 을 지원하므로 유망한 EMA 데이터 소스입니다.
2. dea


CoT(Cognitive Outcome Training) 프롬프트 기법을 GPT-3.5으로 평균 정확도가 0.902로 가장 높음.
그러나 미세 조정이나 프롬프트 기법을 적용하지 않은 경우에도 GPT-3.5는 균형 정확도 0.844와 재현율 0.929로 가장 높은 수치기록.
걸음 수, 일일 신체 활동량, 수면 시간과 같은 정량적 지표도 함께 활용하는 방안이 있음.
4. Materials & Methods
- 본 연구에서는 91명의 참가자로부터 총 428개의 일기를 수집했으며, 참가자 1인당 평균 4.7개(표준편차 4.44, 중앙값 7.0개)의 일기를 작성
- 일기를 작성하면서, PHQ-9 및 BSS 점수를 통해 우울증을 평가함. 이를 ground truth로 활용