ㅇ 본 기술이전은 하기 2개의 기술을 포함하며, 필요시 각 기술별로 분할되어 이전 가능 함
- 기술 1: 한국어 특화 음성인식(STT, Speech-to-Text) 기술
- 기술 2: 자동 개인정보 비식별화(De-ID, De-identification) 기술
ㅇ (기술 1 - 한국어 특화 음성인식 기술)
본 기술은 한국어 음성 데이터를 입력받아 대규모 멀티모달 언어모델을 활용하여 텍스트로 자동 변환하는 인공지능 기술이다.
ㅇ (기술 2 - 자동 개인정보 비식별화 기술)
본 기술은 음성인식 결과 텍스트 내 포함된 개인정보(이름, 전화번호, 이메일, 주소 등)를 자동 탐지하고 사전에 정의된 토큰([이름], [전화번호], [이메일] 등)으로 치환하는 기술이다.
규칙 기반 탐지(rule-based) 와 개체명 인식(NER) 을 결합하여 일반적인 패턴뿐 아니라 문맥적 개인정보 표현도 식별 가능하다.
ㅇ 산업·사회적 배경과 문제
- 국내 기분장애(우울증 등) 진료 인원은 2016년 777,781명 에서 2020년 1,016,727명(▲30.7%)으로 증가하여 정신건강 수요가 빠르게 확대됨
- 감정노동자 비중이 국내 취업자의 최대 42.2%로 추정되어, 대면·비대면 고객응대 산업 전반에서 리스크 관리 필요성이 큼
- 콜센터 상담노동자 실태조사(표본 1,996명)에서 자살 생각 경험 48%(최근 1년 30%)가 확인되어 현장의 고위험 신호가 통계적으로 드러남
ㅇ 규제·준법 환경과 데이터 활용 한계
- 개인정보보호법(PIPA)은 개인정보 처리의 법적 요건과 안전조치를 규정하며, 가명정보는 통계·연구 목적 등에서 정보주체 동의 없이 처리 가능하도록 2020년 개정이 정비됨. 콜센터 녹취·상담 로그와 같은 음성·텍스트 데이터의 가명처리·비식별화가 필수 전제 (개인정보보호법)
- 개인정보보호위원회(PIPC) ‘가명처리 가이드라인’ 개정으로 기업의 안전한 데이터 활용 범위와 절차가 명확화됨. 자동 비식별화 체계가 있어야 합법적 2차 활용(교육, VOC 분석, 모델 고도화)이 가능
ㅇ (기술개념-1 : 한국어 음성인식(STT) 모듈) 본 기술은 대규모 멀티모달 언어모델(Phi-4 기반)을 활용하여 한국어 음성을 텍스트로 자동 변환하는 모듈을 가리킴. 의료 도메인 한국어 데이터로 파인 튜닝 한 모델로 의료 환경 및 의료 관련 단어에서도 잘 작동할 것을 기대함. 음성인식 정확도는 단어 오류율(WER) 지표를 이용해 정량 평가하며, 시험 결과 평균 WER 0.255, 평균 처리시간 9.07 초로 양호한 성능을 보임.
ㅇ (기술개념-2 : 자동 개인정보 비식별화(De-ID) 모듈) 음성인식 결과로 생성된 텍스트 내에서 개인정보(이름, 기관명, 전화번호, 이메일, 주소 등)를 규칙 기반 탐지(rule-based pattern matching)와 한국어 개체명 인식(NER) 모델(KoELECTRA)을 결합하여 자동 탐지·치환함. 탐지된 개인정보는 사전에 정의된 토큰(예: [이름], [전화번호], [주소])으로 변환되어 재식별 위험을 근본적으로 차단함. 성능은 Micro F1 Score 를 기준으로 평가하며, 시험 결과 F1 = 0.66, 평균 처리시간 ≤ 1 초로 기준(0.65 이상)을 충족함.
ㅇ 기술이전 내용
- 한국어 음성 데이터를 대규모 멀티모달 기반 음성인식 모델(Phi-4 계열)을 활용하여 고정확도로 텍스트로 변환
- 전사된 텍스트에서 이름·기관·주소·전화번호·이메일·URL 등 개인정보를 규칙 기반 탐지 와 한국어 개체명 인식(NER, KoELECTRA) 결합 방식으로 자동 식별
- 탐지된 개인정보를 사전 정의된 토큰(예: [이름], [전화번호], [주소])으로 자동 치환하여 재식별 위험을 근본적으로 차단
ㅇ 기술이전 범위
- 요구사항정의서 1건
- 기술문서 총 3건(시험절차 및 결과서 포함)
- 소프트웨어 1건
ㅇ (정신건강 진단 및 관리 향상) 한국어 특화 음성인식 및 자동 비식별화 기술을 적용하여 감정노동자·상담사 등의 직무 스트레스 수준을 자동 분석하고, 정신건강복지센터·콜센터·의료기관 등에서 정확하고 신속한 심리 평가 및 상담 지원이 가능함.
ㅇ (기업 차원의 재직자 정신건강 관리 수요 대응) 산업안전보건공단 조사에 따르면 감정노동자의 약 40%가 정신건강 위험군으로 분류되어, 기업 성과와 직결되는 재직자 정신건강 모니터링 시스템에 대한 수요가 지속 증가하고 있음.
ㅇ (정신질환 조기 발견 및 예방) 음성 기반 AI 분석을 통해 우울·불안 등 심리 이상 신호를 초기 단계에서 탐지함으로써, 전문 상담 및 치료 연계가 가능하며, 이는 정신질환의 만성화 예방과 조기 회복에 도움을 줌.
ㅇ (삶의 질 향상 및 복지비용 감소) 감정노동자의 직무 스트레스를 정기적으로 측정·관리함으로써 정신적 안정감과 근 로 만족도를 높이고, 국가 차원의 복지비용 절감 및 건강한 근로환경 조성에 기여함.
ㅇ (데이터 수집 및 활용의 신뢰성 확보) 한국어 특화 음성인식과 자동 개인정보 비식별화 기술을 결합하여 음성 데이터 수집 단계에서부터 개인정보 노출을 원천 차단함. 이를 통해 상담·교육·의료 등 다양한 분야에서 법적 규제를 준수하면서도 안전하게 데이터 수집·분석·활용이 가능함.