정보시스템감리/감리 및 사업계획

인공지능 학습용 데이터 품질관리 가이드라인 및 구축안내서

미니~ 2024. 11. 20. 07:50

[제1권] 품질관리 가이드라인 v3.1.pdf
15.83MB
[제2권] 초거대AI 데이터 품질관리 가이드라인 v3.1.pdf
4.81MB

 

인공지능 학습용 데이터의 품질관리 프레임워크에서 주요 프로세스와 산출물(데이터)는 다음과 같다. 
(프로세스) 데이터 획득/수집 - 데이터 정제 - 데이터 가공 - 데이터 학습 - 데이터 운영/활용   
(데이터) 원시데이터 - 원천데이터 - 라벨링 데이터 - 학습용 데이터 - 학습용 데이터(공개용)

 

(미니 포인트)
인공지능 학습용 데이터의 품질관리 프레임워크에서, 
1. 개인정보 자율점검표는 "데이터 획득/수집 - 원시데이터"의 산출물
2. 데이터 법적 근거 검토는"데이터 획득/수집 - 원시데이터"의 품질관리 활동
3. 개인정보/민감정보 비식별화 등 법적 준거 확보는 "데이터 정제 - 원천데이터"의 품질관리 활동
4. 라벨링 방법 및 기준 현행화는 "데이터 가공 - 라벨링데이터"의 품질관리 활동
5. 구축목적-AI모델 합치성 확인은 "데이터 학습 - 학습용데이터"의 품질관리 활동

인공지능 학습용 데이터 품질관리 가이드라인은 다년간의 인공지능 학습용 데이터 구축사업을 통해 축적된 품질관리 활동 및 산출물을 프로세스화한 '품질관리 프레임워크'로 

1권. 인공지능 학습용 데이터 품질관리 가이드라인: 인공지능 학습용 데이터 구축 사업 내 품질관리 거버넌스 및 프레임워크, 품질검증 지표 등을 안내
2권. 초거대AI 데이터 품질관리 가이드라인: 초거대AI 분야 데이터의 특징만 발췌하여 별도의 가이드라인으로 구성
별권. 주요 산출물 양식 및 작성 예시: 1-2권에서 다루는 품질관리 활동에 따른 주요 산출물의 작성방법, 예시 등을 제공