A Survey on Multilingual Mental Disorders Detection from Social Media Data
https://arxiv.org/html/2505.15556v2
2026, arXiv
1. Problem
- 기존 영어 대부분은 영어 데이터에만 초점을 맞춤
- 영어 이외의 언어로 된 소셜 미디어 데이터를 활용한 정신 질환 탐지 사례 조사
- 25개 언어 108개의 데이터셋 목록 작성
2. Related Work
- 2013년 De Choudhury 등의 연구를 기점으로 소셜 미디어를 통한 정신 질환 탐지 연구가 본격
- 페이스북 데이터를 활용해 미래의 우울증 진단 여부를 예측 성능의 향상시킬 수 있음을 보여줌.
- https://www.pnas.org/doi/abs/10.1073/pnas.1802331115
- 실제로 우울증을 진단받은 환자의 페이스북 게시물을 사용. 진단받기 직전(6개월 이내)의 게시물만 사용.
- 우울증 예측에 활용한 언어적 요인:
정서적(슬픔), 대인관계적(외로움, 적대감), 인지적(자아에 대한 집착, 반추)
3. Idea
- 이 연구는 코로나19 팬데믹 기간 동안 발표된 연구들 중 정신 건강, 외로움, 불안, 스트레스, 외상 후 스트레스 장애(PTSD), 우울증, 자살 및 기타 정신 질환을 다룬 연구에 초점
- 영어 이외의 언어로 된 정신 질환 탐지 연구에 대한 최초의 포괄적인 조사를 제공함

4. Materials & Methods
- 질병: 자살, 우울증, 불안, 양극성 장애
- 작업 단위: 게시물 단위 / 사용자 단위
- 작업:
- 분류
- 조기 위험 예측
- 중증도 예측
- 평가:
- , 일반적으로 설문 기반 평가에서 사용되는 표준화된 설문지(예: 우울증 평가를 위한 BDI-II(Parapar et al., 2021), 섭식장애 평가를 위한 EDE-Q(Parapar et al., 2024))의 항목을 추정하는 데 활용
5. Evaluation & Findings
- https://www.sciencedirect.com/science/article/pii/S0165178123005292
- 불안 장애를 겪는 사람들이 걱정, 자신감 부족, 부정적인 자아상, 감정 조절 장애 등을 자주 표현할 수 있음을 시사.
sns의 빈도 및 문장 길이에 따라서도 분석한 것이 특징 - 너, 나 라는 단어 빈도가 적은 것까지 의미를 분석함.
- 두 그룹 모두에서 가장 자주 사용된 단어는 긍정적인 단어나 부정적인 단어는 비슷하나, 불안 장애를 가진 사용자들이 부정적인 감정을 반영하는 용어를 더 자주 사용함.
- 불안 장애를 겪는 사람들이 걱정, 자신감 부족, 부정적인 자아상, 감정 조절 장애 등을 자주 표현할 수 있음을 시사.