본문 바로가기

필사필요코드

컬럼 타입별로 구분

반응형

 

아래 코드를 이용하면 각자의 타입에따라서 출력이 가능하다

Counter(train.dtypes.values)

아래 코드를 이용하면 컬럼이 int형인것과 float64형태로 구분할수있다.

train_float = train.select_dtypes(include=['float64'])
train_int = train.select_dtypes(include=['int64'])

 

아래코드를 사용하면 값별 종속성을 알수있다.

mf = mutual_info_classif(train_float.values,train.target.values,n_neighbors=3, random_state=17 )
print(mf)

아래 코드는 binal을 알수있는 코드이다.

bin_col = [col for col in train.columns if '_bin' in col]
zero_list = []
one_list = []
for col in bin_col:
    zero_list.append((train[col]==0).sum())
    one_list.append((train[col]==1).sum())

 

그것을 시각화하는 코드이다.

trace1 = go.Bar(
    x=bin_col,
    y=zero_list ,
    name='Zero count'
)
trace2 = go.Bar(
    x=bin_col,
    y=one_list,
    name='One count'
)

data = [trace1, trace2]
layout = go.Layout(
    barmode='stack',
    title='Count of 1 and 0 in binary variables'
)

fig = go.Figure(data=data, layout=layout)
py.iplot(fig, filename='stacked-bar')
반응형

'필사필요코드' 카테고리의 다른 글

산점도 행렬 출력  (0) 2024.03.03
상관분석 코드  (0) 2024.03.03
bar를 통한 count 시각화  (0) 2024.03.03
캐글 결측치 컬럼별 출력  (0) 2024.03.03
seaborn 시본 형제수에 따른 생존률  (0) 2024.03.03