생소한 판다스 표현

한글데이터를 판다스로 받기

DataUrl = 'https://raw.githubusercontent.com/Datamanim/pandas/main/Jeju.csv'
df = pd.read_csv(DataUrl,encoding='euc-kr')

수치형 변수출력

df.select_dtypes(exclude=object).columns

범주형 변수 출력

Ans = df.select_dtypes(include=object).columns

데이터컬럼의 통계 출력하기

df.describe()

IQR구하기

df['평균 속도'].quantile(0.75) -df['평균 속도'].quantile(0.25)

특정컬럼의 값이 3인 경우의 상위 5개 출력

df.loc[df['quantity']==3].head()

위의 행렬을 0부터 정렬하기

df.loc[df['quantity']==3].head().reset_index(drop=True)

데이터의 첫글자 제외하기

 df['item_price'].str[1:]

데이터의 조건을 넣어서 출력하기

df.loc[(df.item_name =='Chicken Salad Bowl') & (df.new_price <= 9)]

특정값을 기준으로 정렬하기

df.sort_values('new_price').reset_index(drop=True)

특정컬럼에서 특정한 문자를 가지는 데이터 출력

df.loc[df.item_name.str.contains('Chips')]

특정한 컬럼을 기준으로 내림차순 정렬

df.sort_values('new_price',ascending=False).reset_index(drop=True)

중복행 제거

Ans.drop_duplicates('item_name')

데이터의 평균값 출력

df.new_price.mean()

데이터의 특정한 값 수정

df.loc[df.item_name =='Izze','item_name'] = 'Fizzy Lizzy'
Ans = df

문자 n으로 시작하는 데이터

df[df.item_name.str.startswith('N')]

문자길이가 15이상인 데이터

df[df.item_name.str.len() >=15]

백준파이썬개발자:프로젝트골드