잡동사니

반응형

질문

 

약 8 백만 개의 관측치가있는 데이터 프레임이 있습니다. 그 샘플을 가져와야 하지만 둘 이상의 열에서 샘플링하고 싶습니다.

작동하지 않는 다음을 시도했습니다.

import pandas as pd

state = ['mi', 'mi', 'mi', 'nc', 'pa', 'pa', 'ga']
state = state * 50
age = ['21', '22', '23', '23', '23', '50', '50']
age = age * 50
random = ['.445', '.324', '.234', '.143', '.568', '.777', '.256']
random = random * 50
data = {'state':state, 'age': age, 'random': random}
df = pd.DataFrame.from_dict(data = data)

df_sample = df.sample(n = 25, weights = ['state', 'age'], random_state = 48)

pandas 문서에 내가 원하는 작업이 명시되어 있지 않다는 것을 알고 있습니다. 내가 할 수 있는 방법이 있습니까?

 

답변1

 

IIUC,

나는 당신이 다음을 달성하려고 생각합니다.

df_sample = df[['state','age']].sample(n = 25, random_state = 48)

 

 

 

 

 

출처 : https://stackoverflow.com/questions/59202341/how-to-do-a-pandas-sample-on-more-than-one-column

반응형

이 글을 공유합시다

facebook twitter googleplus kakaoTalk kakaostory naver band