Br) 함수 블럭 - Random Sampling

Br) 함수 블럭 - Random Sampling

브라이틱스(Brightics)에서 무작위 row를 추출할 때 사용하는 Random Sampling 을 알아본다.


Transform Statistics Pre-Processing

※ 본 내용은 Load 함수 블럭에서 sample_iris.csv 파일을 불러온 후에 진행한다.
사전 준비


개요

Random Sampling 함수 블럭은 각 row를 단순 임의 추출(Simple Random Sampling)을 할 수 있다.


설정

Random Sampling 블럭의 설정 창은 다음과 같다.
Random Sampling 블럭 설정 창

MethodNumber로 지정하면 임의 추출할 row 개수를 지정할 수 있고, Fraction으로 지정하면 백분율로 지정할 수 있다.

NumberMethodNumber로 설정했을 때 지정할 수 있으며 출력할 row 개수를 지정한다. 이 때 row 개수는 1개 부터 입력된 데이터의 row 값 사이를 입력한다. 그리고 MethodFraction 으로 설정하면 다음과 같이 설정 창이 바뀐다.
Fraction 설정

ReplacementTrue로 복원추출을, False로 비복원추출을 지정할 수 있다.

Seed 는 임의 추출을 하더라도 그 결과를 고정할 수 있도록 해준다. 예를 들어 그냥 임의 추출을 하게 되면 항상 다른 값이 나오게 되는데 여기에 숫자를 입력하게 되면 해당 숫자에 맞게 임의 추출 값이 고정이 된다. 즉, 다른 컴퓨터에서 이 블럭을 실행시키더라도 Seed 에 입력한 숫자가 123 으로 동일하다면 출력되는 결과도 동일하다.


결과

MethodNumber, Number는 5, ReplacementFalse, Seed 는 123 설정으로 실행한 결과는 다음과 같다.
표본 추출 결과

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×