필사필요코드
불용어 제거 코드
백준파이썬개발자:프로젝트골드
2024. 3. 30. 13:28
반응형
import nltk
nltk.download('all')
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize
stop_words = set(stopwords.words('english'))
word_tokens = word_tokenize(exple)
result = []
for token in word_tokens:
if token not in stop_words:
result.append(token)
print(len(word_tokens))
print("불용어 제거")
#print(result)
반응형