반응형
한글데이터를 판다스로 받기
DataUrl = 'https://raw.githubusercontent.com/Datamanim/pandas/main/Jeju.csv'
df = pd.read_csv(DataUrl,encoding='euc-kr')
수치형 변수출력
df.select_dtypes(exclude=object).columns
범주형 변수 출력
Ans = df.select_dtypes(include=object).columns
데이터컬럼의 통계 출력하기
df.describe()
IQR구하기
df['평균 속도'].quantile(0.75) -df['평균 속도'].quantile(0.25)
특정컬럼의 값이 3인 경우의 상위 5개 출력
df.loc[df['quantity']==3].head()
위의 행렬을 0부터 정렬하기
df.loc[df['quantity']==3].head().reset_index(drop=True)
데이터의 첫글자 제외하기
df['item_price'].str[1:]
데이터의 조건을 넣어서 출력하기
df.loc[(df.item_name =='Chicken Salad Bowl') & (df.new_price <= 9)]
특정값을 기준으로 정렬하기
df.sort_values('new_price').reset_index(drop=True)
특정컬럼에서 특정한 문자를 가지는 데이터 출력
df.loc[df.item_name.str.contains('Chips')]
특정한 컬럼을 기준으로 내림차순 정렬
df.sort_values('new_price',ascending=False).reset_index(drop=True)
중복행 제거
Ans.drop_duplicates('item_name')
데이터의 평균값 출력
df.new_price.mean()
데이터의 특정한 값 수정
df.loc[df.item_name =='Izze','item_name'] = 'Fizzy Lizzy'
Ans = df
문자 n으로 시작하는 데이터
df[df.item_name.str.startswith('N')]
문자길이가 15이상인 데이터
df[df.item_name.str.len() >=15]
반응형
'필사필요코드' 카테고리의 다른 글
단어의 빈도를 시각화하는 코드 (0) | 2024.03.30 |
---|---|
불용어 제거 코드 (0) | 2024.03.30 |
산점도 행렬 출력 (0) | 2024.03.03 |
상관분석 코드 (0) | 2024.03.03 |
컬럼 타입별로 구분 (0) | 2024.03.03 |