ETRI-Knowledge Sharing Plaform

ENGLISH

성과물

논문 검색
구분 SCI
연도 ~ 키워드

상세정보

학술지 유전체 분석 파이프라인의 I/O 워크로드 분석
Cited - time in scopus Download 0 time Share share facebook twitter linkedin kakaostory
저자
임경열, 김동오, 김홍연, 박기한, 최민석, 원유집
발행일
201302
출처
정보처리학회논문지 : 소프트웨어 및 데이터 공학, v.2 no.2, pp.123-130
ISSN
2287-5905
출판사
한국정보처리학회 (KIPS)
DOI
https://dx.doi.org/10.3745/KTSDE.2013.2.2.123
협약과제
12VS1100, 유전체 분석용 슈퍼컴퓨팅 시스템 개발, 최완
초록
최근 유전체 데이터의 급격한 증가로 인해 이를 처리하기 위한 고성능 컴퓨팅 시스템이 필요로 하게 되었으며 대량의 유전체 데이터를 저장 관리할 수 있는 고성능 저장 시스템이 필요하게 되었다. 본 논문에서는 대략 5억 개 정도의 시퀀스 리드 데이터를 분석하는 유전체 분석 파이프라인의 I/O워크로드를 수집 및 분석하였다. 실험은 86시간 동안 수행되었다. 1031.7 GByte 크기의 630개 파일이 생성되었으며 91.4 GByte크기의 535개의 파일이 삭제되었다. 전체 654개의 파일 중 0.3%인 2개의 파일이 전체 접근 빈도의 80%를 차지하여 전체 파일 중 일부분의 파일이 대부분의 I/O를 발생시킨다는 것을 알 수 있다. 요청 크기 단위로는 읽기에서 주로 512 KByte 크기 이상의 요청이 발생했고 쓰기에서 주로 1 MByte 크기 이상의 요청이 발생했다. 파일이 열려있는 동안의 접근 패턴은 읽기와 쓰기 연산에서 각각 임의와 순차패턴을 보였다. IOPS와 대역폭은 각 단계마다 고유한 패턴을 보였다.