
데이터베이스 분포도
분포도가 낮을수록 좋다는데 왜 성별은 분포도가 좋지 않다는 거지? 라는 의문을 해소하기 위해 알아본 자료를 정리해보았다. Selectivity 선택성, 분포도 양쪽으로 번역되는 것 같다. 개인적으로는 선택성이라는 번역이 해당 내용에 대한 이해를 돕는 것 같다. 이유는, 이 개념이 필요한 이유가, 인덱스를 구성하기 위해 한 테이블에서 어떤 속성을 선택할지를 결정하기 위함이기 때문이다. 선택성이/분포도가 좋다는 말은 내가 원하는 값을 쉽게 찾아갈 수 있다는 뜻이다. 이를 위해서는 특정 컬럼의 데이터가 테이블에 평균적으로 분포되어 있는 정도를 알아야 한다. 산식 해당 컬럼 기준으로 distinct(중복제거)된 count / 전체 count col1 컬럼 : 전체 건수 100건, 값들은 모두 A, B 의 2가지..