728x90
반응형

정규화 3

데이터 전처리 기술(Data Preprocessing Techniques)

개요데이터 전처리는 원시(raw) 데이터를 분석 가능한 형태로 정제하고 구조화하는 과정으로, 머신러닝, 데이터 분석, 시각화의 전 단계이자 가장 중요한 품질 확보 절차입니다. 정확한 전처리는 모델 성능을 극대화하며, 잘못된 전처리는 잘 만든 알고리즘조차 무용지물로 만들 수 있습니다. 이 글에서는 전처리의 정의, 핵심 기법, 적용 도구, 실무 전략을 정리합니다.1. 데이터 전처리란? 항목 설명 정의원시 데이터를 분석 또는 학습에 적합한 형태로 변환하는 일련의 정제 작업목적노이즈 제거, 일관성 확보, 결측 보완, 형식 정렬을 통해 모델 성능 향상대상정형 데이터(테이블), 비정형 데이터(텍스트, 로그, 이미지 등) 모두 포함전처리는 ‘모델 학습을 위한 데이터 품질 확보 단계’입니다.2. 주요 전처리 기법분류..

Topic 2025.04.21

DB Smell

개요'Code Smell'처럼 'DB Smell'은 데이터베이스에서 유지보수성과 확장성을 해치는 구조적 결함 또는 나쁜 설계 습관을 의미합니다. 즉시 오류를 발생시키진 않지만, 장기적으로는 성능 저하, 비즈니스 로직 중복, 데이터 품질 저하 등의 문제를 유발합니다. 이 글에서는 대표적인 DB Smell의 유형, 원인, 진단 방법, 개선 전략을 실무 중심으로 소개합니다.1. DB Smell이란? 항목 설명 정의데이터베이스 설계·구현 상에서 나타나는 구조적 문제 또는 나쁜 냄새(징후)발생 위치테이블 구조, 컬럼 설계, 관계 모델, 인덱스, 트리거, 제약 조건 등위험 요소데이터 중복, 무결성 저하, 성능 문제, 비표준 설계 유입DB Smell은 궁극적으로 기술 부채로 이어지며, 코드뿐 아니라 데이터 모델에서..

Topic 2025.04.21

데이터 모델링(Data Modeling)

개요데이터 모델링은 데이터 기반 시스템 구축의 첫 번째이자 가장 중요한 단계입니다. 현실 세계의 비즈니스 개념을 데이터 구조로 표현하여, 정보 흐름을 체계화하고 개발·운영·분석에 최적화된 데이터 환경을 구축합니다. 본 글에서는 데이터 모델링의 개념, 유형, 기법, 설계 원칙, 실무 적용 전략을 정리합니다.1. 데이터 모델링이란? 항목 설명 정의현실의 개념·비즈니스 규칙을 데이터로 구조화하는 과정목적데이터 일관성 확보, 중복 제거, 정보 흐름 명확화, 설계 기반 확보결과물개념/논리/물리 모델, ERD(Entity Relationship Diagram), 테이블 스키마모델링은 데이터의 설계도이자 시스템 구조의 뼈대입니다.2. 데이터 모델링 3단계단계설명산출물개념 모델핵심 개체와 관계 정의, 비즈니스 중심엔..

Topic 2025.04.16
728x90
반응형