Evidence-Linked Labeling: A Verifiable Pipeline for Quantifying Conversational Qualitative Data

ELL은 대화형 설문 응답을 검증 가능한 정량 지표로 전환하는 파이프라인입니다. AI가 라벨을 붙이되 숫자는 코드가 세고, 모든 수치에서 원문 응답까지 역추적할 수 있습니다.

1) 모든 숫자는 결정적으로 집계되어야 함, 2) 모든 주장은 실제 응답으로 역추적 가능해야 함, 3) 해석의 불확실성을 공개해야 함. 이 세 가지가 기존 AI 요약과 ELL을 구분하는 핵심 원칙입니다.

보니(bonny) 육아코칭 서비스에서 100세션, 약 4,500턴의 대화형 설문으로 실증했습니다. 동일 100명 대상 객관식 15문항과 병행 수집하여 비교 검증했습니다.

Evidence-Linked Labeling

Type

Year

DOI

대화형 설문 응답을 검증 가능한 정량 지표로 전환하는 파이프라인. 모든 숫자에서 원문까지 역추적할 수 있습니다.

라벨 어휘를 사전 정의하여 일관된 분류 보장. AI의 자의적 해석을 차단합니다.

정성 서술과 정량 수치를 아키텍처 수준에서 분리. AI는 분류만, 집계는 코드가.

동일 데이터에 두 번 라벨링 후 Jaccard 일치도로 신뢰도를 정량화합니다.

모든 수치에서 원문 응답까지 드릴다운. 근거 없는 숫자가 없습니다.

모든 숫자는 결정적으로 집계되어야 한다. 같은 데이터에 같은 코드를 돌리면 항상 같은 결과.

모든 주장은 실제 응답으로 역추적 가능해야 한다. 근거 없는 요약은 존재하지 않는다.

해석의 불확실성을 공개해야 한다. 확신도를 감추지 않고 투명하게 보여준다.

12개 인사이트 + Voronoi 지도 + 원문 탐색기를 웹에서 확인

국문 28페이지 / 영문 27페이지, Zenodo 영구 아카이브

100세션 × 14토픽을 페르소나별 가중 시각화

3,478개 user turn을 검색·필터·CSV 다운로드