본문 바로가기
반응형

용어2

Cardinality vs Selectivity (카디널리티와 선택도의 차이) 데이터를 다루는 DB나 빅데이터 분야에서 ‘카디널리티(Cardinality)’와 ‘선택도(Selectivity)’는 자주 언급되는 용어다. 이 용어의 차이점을 잘 알고 있어야 데이터의 특성을 잘 파악할 수 있다. 카디널리티(Cardinality)와 선택도(Selectivity)는 절대적인 수치 계산이라기보다는 두 개의 데이터 집합의 특성을 비교하는 상대적인 개념으로 사용해야한다. 카디널리티(Cardinality) 카디널리티(Cardinality)는 특정 데이터 집합의 유니크(Unique)한 값의 개수이다. 예를 들어 데이터베이스에 '성별' 컬럼의 경우 남자와 여자라는 값을 갖는다. (생물학적인 성별만 고려하자면) 이 경우 카디널리티는 2다. 반면 주민등록 번호는 테이블에 존재하는 모든 레코드에 유니크 할.. 2019. 7. 1.
디스크(Disk), 파티션(Partition)과 볼륨(Volume)의 차이 클러스터의 입출력(I/O) 테스트를 진행하다가 디스크, 파티션, 볼륨이라는 용어가 자주 나오는 것을 봤다. 특히 파티션(Partition)과 볼륨(Volume)이라는 단어는 많이 혼용되기도 하는데, 정확하게 이들이 어떻게 다른지 찾아서 정리해봤다. 디스크(Disk) 일반적으로 디스크는 시스템에 장착되어 있는 물리적인 저장장치를 의미한다. 본래 디스크의 의미는 자기(Magnetic) 물질이 발라져 있는 디스크 플래터(Platter)와 디스크 헤더, 암(Arm) 등으로 구성되어 있는 하드디스크(HDD)를 의미했다. 하지만 최근에는 SSD, 플래시 메모리, RAM 디스크, 가상 디스크 등도 디스크로 통칭해서 부른다. 파티션(Partition) 마치 사무실에 파티션을 쳐서 여러 공간으로 분리하듯 물리적인 디스크.. 2019. 4. 2.
반응형