본문 바로가기

Paper

간단리뷰 Day 50. A Survey on Multilingual Mental Disorders Detection from Social Media Data

A Survey on Multilingual Mental Disorders Detection from Social Media Data

https://arxiv.org/html/2505.15556v2

2026, arXiv

 

1. Problem

  • 기존 영어 대부분은 영어 데이터에만 초점을 맞춤
    • 영어 이외의 언어로 된 소셜 미디어 데이터를 활용한 정신 질환 탐지 사례 조사
    • 25개 언어 108개의 데이터셋 목록 작성

2. Related Work

  • 2013년 De Choudhury 등의 연구를 기점으로 소셜 미디어를 통한 정신 질환 탐지 연구가 본격
  • 페이스북 데이터를 활용해 미래의 우울증 진단 여부를 예측 성능의 향상시킬 수 있음을 보여줌. 
    • https://www.pnas.org/doi/abs/10.1073/pnas.1802331115 
    •  실제로 우울증을 진단받은 환자의 페이스북 게시물을 사용. 진단받기 직전(6개월 이내)의 게시물만 사용.
    • 우울증 예측에 활용한 언어적 요인: 
      정서적(슬픔), 대인관계적(외로움, 적대감), 인지적(자아에 대한 집착, 반추)

3. Idea

  • 이 연구는 코로나19 팬데믹 기간 동안 발표된 연구들 중 정신 건강, 외로움, 불안, 스트레스, 외상 후 스트레스 장애(PTSD), 우울증, 자살 및 기타 정신 질환을 다룬 연구에 초점
  • 영어 이외의 언어로 된 정신 질환 탐지 연구에 대한 최초의 포괄적인 조사를 제공함

4. Materials & Methods

  • 질병: 자살, 우울증, 불안, 양극성 장애
  • 작업 단위: 게시물 단위 / 사용자 단위
  • 작업:
    • 분류
    • 조기 위험 예측
    • 중증도 예측
  • 평가:
    • , 일반적으로 설문 기반 평가에서 사용되는 표준화된 설문지(예: 우울증 평가를 위한 BDI-II(Parapar et al., 2021), 섭식장애 평가를 위한 EDE-Q(Parapar et al., 2024))의 항목을 추정하는 데 활용

5. Evaluation & Findings

  • https://www.sciencedirect.com/science/article/pii/S0165178123005292
    • 불안 장애를 겪는 사람들이 걱정, 자신감 부족, 부정적인 자아상, 감정 조절 장애 등을 자주 표현할 수 있음을 시사.
      sns의 빈도 및 문장 길이에 따라서도 분석한 것이 특징
    • 너, 나 라는 단어 빈도가 적은 것까지 의미를 분석함.
    • 두 그룹 모두에서 가장 자주 사용된 단어는 긍정적인 단어나 부정적인 단어는 비슷하나, 불안 장애를 가진 사용자들이 부정적인 감정을 반영하는 용어를 더 자주 사용함.