fake news
https://www.kaggle.com/competitions/fake-news/data Fake News | Kaggle www.kaggle.com nltk : 자연어 처리 패키지 stopwords (불용어) : 중요한 의미를 가지지 않은 단어 (관사, 전치사) PorterStemmer : 유사한 의미를 가진 단어들을 동일한 형태로 처리 STEMMING : 언어를 정규화 시키는 알고리즘 - 유사하지만 다양한 형태의 단어를 공통된 형태로 줄일 수 있음 actor, actress, acting --> act eating, eats, eaten --> eat - ^는 반전을 의미 : a~z, A~Z를 제외한 것은 공백처리 - stem 어간추출 예시 : the going → the go TF-IDF : 단어..
2023.12.23