반응형
아래 코드를 이용하면 각자의 타입에따라서 출력이 가능하다
Counter(train.dtypes.values)
아래 코드를 이용하면 컬럼이 int형인것과 float64형태로 구분할수있다.
train_float = train.select_dtypes(include=['float64'])
train_int = train.select_dtypes(include=['int64'])
아래코드를 사용하면 값별 종속성을 알수있다.
mf = mutual_info_classif(train_float.values,train.target.values,n_neighbors=3, random_state=17 )
print(mf)
아래 코드는 binal을 알수있는 코드이다.
bin_col = [col for col in train.columns if '_bin' in col]
zero_list = []
one_list = []
for col in bin_col:
zero_list.append((train[col]==0).sum())
one_list.append((train[col]==1).sum())
그것을 시각화하는 코드이다.
trace1 = go.Bar(
x=bin_col,
y=zero_list ,
name='Zero count'
)
trace2 = go.Bar(
x=bin_col,
y=one_list,
name='One count'
)
data = [trace1, trace2]
layout = go.Layout(
barmode='stack',
title='Count of 1 and 0 in binary variables'
)
fig = go.Figure(data=data, layout=layout)
py.iplot(fig, filename='stacked-bar')
반응형
'필사필요코드' 카테고리의 다른 글
산점도 행렬 출력 (0) | 2024.03.03 |
---|---|
상관분석 코드 (0) | 2024.03.03 |
bar를 통한 count 시각화 (0) | 2024.03.03 |
캐글 결측치 컬럼별 출력 (0) | 2024.03.03 |
seaborn 시본 형제수에 따른 생존률 (0) | 2024.03.03 |