o 한국어 법률분야 딥러닝 언어모델 KorBERT-Legal
- 한국어는 어근에 어미/조사가 결합되므로, 의미의 최소 단위인 형태소로 구분 필요
- 형태소 분석 이후, 형태소 단위에 대해서 BPE를 적용하여 한국어 특성 최대한 활용
- 법률분야 텍스트를 적용한 법률도메인 적응 언어모델 KorBERT-Legal 기술
- 법률분야 기계독해 적용 시, 일반분야 언어모델 대비 2.01% 성능 개선
o 법률분야 자연어 질문분석
- 법률명 인식을 통한 질문의 주요한 대상 법령 인식 기술
- 사용자의 질문이 요구하는 정답의 형태를 정확하게 파악하여 정답을 제약하는 기술
- 응답 방법에 따른 사용자 질문분류 기술 (정의형, 서술형, 단답형)
o 법률문서 시맨틱 색인 및 검색
- 조항 단위의 가상문서를 생성하기 위한 전처리 기술
- 어휘/어휘의미 관계에 기반 색인 및 검색 기술
- 법령문서의 구조 정보를 반영한 색인 및 검색 기술
- 심볼릭 기반 시맨틱 재순위화 기술
o KorBERT-Legal 기반 법률분야 딥러닝 재순위화 및 기계 독해
- KorBERT-Legal 기반 조항의 정답포함 여부에 따른 재순위화 기술 (정답의 신뢰도)
- 상위 N개의 조항을 대상으로 정답을 찾기 위한 기계독해 기술
- 정답의 이형태(synonym) 사전에 기반한 정답통합 기술
o 딥러닝과 Lexico-Semantic 기반 Hybrid FAQ 검색
- Lexico-Semantic 기반 문장 유사도 계산 알고리즘 기술
- 딥러닝 기반의 KorBERT-Legal 문장 유사도 계산 알고리즘 기술
- FAQ을 위한 질문/정답/근거조항 정보에 대한 색인/검색 기술
o 분산처리 플랫폼
- 분산처리를 위해 질의응답 시스템을 프로세스 단위의 쓰레드풀(thread pool) 적용
- 대용량 분산 검색을 위한 Solr 와 언어분석 저장을 위한 Hadoop 플랫폼 적용
- 복수개의 서버에 대한 로드밸런싱 플랫폼 적용
o 한국어 법률분야 딥러닝 언어모델 KorBERT-Legal
- KorBERT-Legal 기반 법률분야 한국어 언어모델
- KorBERT-Legal 기반 한국어 언어모델 사용 매뉴얼
o 법률분야 자연어 질문분석
- 법률분야 질문분석을 위한 엔진
- 법률명 인식을 위한 리소스 데이터
- 정답유형과 질문분류를 위한 SVM 기계학습 모델과 규칙 사전
- 질문분석기술에 대한 상세 매뉴얼 및 자료구조 설명서
o 법률문서 시맨틱 색인 및 검색
- 조항 단위의 가상문서를 생성하기 위한 가이드라인 및 변환 도구
- 시맨틱 색인, 검색, 심볼릭 기반 재순위화 엔진
- 증분색인 등을 위한 색인 도구
- 시맨틱 색인 및 검색을 위한 사용자 매뉴얼 및 자료구조 설명서
o KorBERT-Legal 기반 법률분야 딥러닝 재순위화 및 기계 독해
- KorBERT-Legal 기반 한국어 법률분야 언어모델을 이용한 재순위화 엔진
- KorBERT-Legal 기반 한국어 법률분야 언어모델을 이용한 기계독해 엔진
- KorBERT-Legal 기반 재순위화와 기계독해 상세 매뉴얼 및 자료구조 설명서
o 딥러닝과 Lexico-Semantic 기반 Hybrid FAQ 검색
- FAQ(질문/정답/근거정보)를 색인/검색하는 엔진
- Lexico-Semantic 문장 유사도 계산 엔진
- KorBERT-Legal을 이용한 딥러닝 문장 유사도 계산 엔진
- Hybrid FAQ 검색 상세 매뉴얼 및 자료구조 설명서
o 분산처리 플랫폼
- 법률분야 질의응답 분산처리 엔진
- 법률분야 질의응답 사용자 Web UI
- 분산처리 플랫폼 구성을 위한 상세매뉴얼 및 자료구조 설명서