브라이틱스(Brightics)에서 무작위 row를 추출할 때 사용하는 Random Sampling
을 알아본다.
Transform Statistics Pre-Processing
※ 본 내용은 Load
함수 블럭에서 sample_iris.csv 파일을 불러온 후에 진행한다.
개요
Random Sampling
함수 블럭은 각 row를 단순 임의 추출(Simple Random Sampling)을 할 수 있다.
설정
Random Sampling
블럭의 설정 창은 다음과 같다.
Method 는 Number
로 지정하면 임의 추출할 row 개수를 지정할 수 있고, Fraction
으로 지정하면 백분율로 지정할 수 있다.
Number 는 Method를 Number
로 설정했을 때 지정할 수 있으며 출력할 row 개수를 지정한다. 이 때 row 개수는 1개 부터 입력된 데이터의 row 값 사이를 입력한다. 그리고 Method 를 Fraction
으로 설정하면 다음과 같이 설정 창이 바뀐다.
Replacement 는 True
로 복원추출을, False
로 비복원추출을 지정할 수 있다.
Seed 는 임의 추출을 하더라도 그 결과를 고정할 수 있도록 해준다. 예를 들어 그냥 임의 추출을 하게 되면 항상 다른 값이 나오게 되는데 여기에 숫자를 입력하게 되면 해당 숫자에 맞게 임의 추출 값이 고정이 된다. 즉, 다른 컴퓨터에서 이 블럭을 실행시키더라도 Seed 에 입력한 숫자가 123 으로 동일하다면 출력되는 결과도 동일하다.
결과
Method 는 Number
, Number는 5, Replacement 는 False
, Seed 는 123 설정으로 실행한 결과는 다음과 같다.