본문 바로가기

필사필요코드

생소한 판다스 표현

반응형

한글데이터를 판다스로 받기

DataUrl = 'https://raw.githubusercontent.com/Datamanim/pandas/main/Jeju.csv'
df = pd.read_csv(DataUrl,encoding='euc-kr')

 

수치형 변수출력

df.select_dtypes(exclude=object).columns

 

범주형 변수 출력

Ans = df.select_dtypes(include=object).columns

데이터컬럼의 통계 출력하기

df.describe()

 

IQR구하기

df['평균 속도'].quantile(0.75) -df['평균 속도'].quantile(0.25)

 

특정컬럼의 값이 3인 경우의 상위 5개 출력

df.loc[df['quantity']==3].head()

위의 행렬을 0부터 정렬하기

df.loc[df['quantity']==3].head().reset_index(drop=True)

 

데이터의 첫글자 제외하기

 df['item_price'].str[1:]

 

데이터의 조건을 넣어서 출력하기

df.loc[(df.item_name =='Chicken Salad Bowl') & (df.new_price <= 9)]

 

특정값을 기준으로 정렬하기

df.sort_values('new_price').reset_index(drop=True)

 

특정컬럼에서 특정한 문자를 가지는 데이터 출력

df.loc[df.item_name.str.contains('Chips')]

특정한 컬럼을 기준으로 내림차순 정렬

df.sort_values('new_price',ascending=False).reset_index(drop=True)

중복행 제거

Ans.drop_duplicates('item_name')

 

데이터의 평균값 출력

df.new_price.mean()

 

데이터의 특정한 값 수정

df.loc[df.item_name =='Izze','item_name'] = 'Fizzy Lizzy'
Ans = df

문자 n으로 시작하는 데이터

df[df.item_name.str.startswith('N')]

문자길이가 15이상인 데이터

df[df.item_name.str.len() >=15]
반응형

'필사필요코드' 카테고리의 다른 글

단어의 빈도를 시각화하는 코드  (0) 2024.03.30
불용어 제거 코드  (0) 2024.03.30
산점도 행렬 출력  (0) 2024.03.03
상관분석 코드  (0) 2024.03.03
컬럼 타입별로 구분  (0) 2024.03.03