o 각 세부기술별 사양 및 기술료조건(정액기술료, 부가세 별도)
- 세부기술1: 음성인식용 한국어 숫자, 단어, 문장 음성DB(16kHz) : 중소기업 25백만원, 중견기업 75백만원, 대기업 100백만원
. 한국어 단어 DB: 2,000명 발성. 발성내용은 주식상장회사명, 지명, 인명, 제품명, PC명령어, PDA 명령어, 일반명사로 구성
. 한국어 숫자 DB: 2,000명 발성. 발성내용은 1~10연숫자.번호독식/봉독식 발성, 계좌번호, 단위, 전화번호로 구성
. 한국어 문장 DB: 2,000명이 발성한 방송뉴스 문장으로 구성
- 세부기술2: 음성인식용 한국어 숫자, 단어, 문장 음성DB(8kHz) 중소기업 30백만원, 중견기업 90백만원, 대기업 120백만원
. 한국어 대화체 문장 DB: 가상 시나리오를 사용해 콜센터 환경에서의 고객과 상담원 대화 녹취(500명)
. 한국어 단어 DB: 2,000명 발성. 발성내용은 주식상장회사명, 지명, 인명, 제품명, PC명령어, PDA 명령어, 일반명사로 구성
. 한국어 숫자 DB: 2,000명 발성. 발성내용은 1~10연숫자.번호독식/봉독식 발성, 계좌번호, 단위, 전화번호로 구성
- 세부기술3: 언어모델용 신문기사 텍스트 DB : 중소기업 12백만원, 중견기업 36백만원, 대기업 48백만원
. 일간지 신문 4,500만어절 수동 철자/띄어쓰기 수정.
- 세부기술4: 음성합성용 한국어 낭독체 음성 DB : 중소기업 12백만원, 중견기업 36백만원, 대기업 48백만원
. 남녀 성우 각 2인 트라이폰 분포 고려한 10,000문장 발성(44.1kHz 또는 16kHz). 피치추출용 래링고 데이터 동시 녹취.
. 각 2,000문장 음소분할됨. 다이폰/반음절 단위 음성 추가 발성. 어절경계 트라이폰을 고려한 발성 추가
. 남성우 1: 16시간, 남성우2: 20시간, 여성우1: 17시간, 여성우2: 24시간
- 세부기술5: 음성합성용 한국어 대화체 음성 DB : 중소기업 6백만원, 중견기업 18백만원, 대기업 24백만원
. 회화책에서 추출한 대화체 문장으로 문장단위 철자 전사
. 남녀 성우 각 2인이 8시간 발성
- 세부기술6: 음성합성용 영어 낭독체 음성 DB : 중소기업 2백만원, 중견기업 6백만원, 대기업 8백만원
. 영어 모국어화자 아나운서가 발성한 낭독체 문장
. 여성 화자 1인 12시간 발성
- 세부기술7: 화자인식용 한국어 숫자, 단어, 문장 음성DB(16kHz) : 중소기업 10백만원, 중견기업 30백만원, 대기업 40백만원
. 발성목록은 2연숫자, 4연숫자, 단문 등으로 구성
. 250명이 발성목록 반복 5회, 시차별 발성
. 100명 화자 1주간격 4회 발성. 100명 화자 1달간격 4회발성, 50명 화자 3달간격 4회발성
- 세부기술8: 화자인식용 한국어 숫자, 단어, 문장 음성DB(8kHz) : 중소기업 12백만원, 중견기업 36백만원, 대기업 48백만원
. 발성목록은 2연숫자, 4연숫자, 단문 등으로 구성
. 250명이 발성목록 반복 5회, 시차별 발성
. 100명 화자 1주간격 4회 발성. 100명 화자 1달간격 4회발성, 50명 화자 3달간격 4회발성
세부기술1: 음성인식용 한국어 숫자, 단어, 문장 음성DB(16kHz)
○ 한국어 단어, 숫자, 문장 음성 DB(16kHz) 500시간 규모
세부기술2: 음성인식용 한국어 숫자, 단어, 문장 음성DB(8kHz)
○ 한국어 단어, 숫자, 문장 음성 DB(8kHz) 600시간 규모
세부기술3: 언어모델용 신문기사 텍스트 DB
○ 언어모델용 신문기사 텍스트 DB 4,500만 어절
세부기술4: 음성합성용 한국어 낭독체 음성 DB
○ 음성합성용 한국어 낭독체 음성 DB 77시간 규모
세부기술5: 음성합성용 한국어 대화체 음성 DB
○ 음성합성용 한국어 대화체 음성 DB 32시간 규모
세부기술6: 음성합성용 영어 낭독체 음성 DB
○ 음성합성용 영어 낭독체 음성 DB 12시간 규모
세부기술7: 화자인식용 한국어 숫자, 단어, 문장 음성DB(16kHz)
○ 화자인식용 한국어 숫자, 단어, 문장 음성 DB(16kHz) 160 시간 규모
세부기술8: 화자인식용 한국어 숫자, 단어, 문장 음성DB(8kHz)
○ 화자인식용 한국어 숫자, 단어, 문장 음성 DB(8kHz) 200 시간 규모