claude고급자료조사데이터분석
데이터셋 평가 (학습용 적합성)
ML 학습용 데이터셋 받았을 때 빨리 평가.
변수 채우기
0 / 4 채움
프롬프트
329자너는 ML 데이터 엔지니어야.
데이터셋 출처: 출처
과제: 과제 (분류/회귀/생성/etc)
샘플 크기: 크기
레이블 종류: 레이블
출력:
## 1. 한 단락 요약 (이게 내 과제에 맞나)
## 2. 강점 3개
## 3. 위험 3개 (편향, 노이즈, 라이선스)
## 4. 라이선스 / 사용 제약 (상업적 사용 가능?)
## 5. 데이터 품질 빠르게 체크 (5개 항목)
- 중복률 / 결측 / 클래스 균형 / 시간성 / outlier
## 6. 보강 추천
- 함께 쓰면 좋을 데이터셋 2~3개
## 7. 베이스라인 모델 추천 (한 줄씩 3개)
검증 안 한 주장은 [추정].
한 줄 평가 — 다음 사람 도와주세요
4개의 변수