dragonhyeon 님의 블로그

  • 홈
  • 태그
  • 방명록

AI/NLP 1

NLP 간단 정리

텍스트 전처리 (Preprocessing)텍스트를 모델이 이해할 수 있는 형태로 변환하는 과정텍스트를 정제하여 학습 데이터 불균형을 방지하고 성능 저하를 막음학습과 테스트 과정 모두 사용모델을 평가할 때, 학습 데이터와 동일한 방식으로 전처리해야 일관된 결과가 나옴딥 러닝 모델 사용 여부에 따라 전처리 정도가 달라질 수는 있으나, 전통적인 NLP 방식과 딥 러닝 기반의 NLP 방식 모두에서 전처리는 중요한 과정텍스트 전처리의 주요 단계텍스트 정제 (Cleaning)HTML 태그, 이모지, 특수문자 제거ex. "Hello!" → "Hello!"토큰화 (Tokenization)문장을 단어 또는 서브워드 단위로 분리ex. "I love NLP!" → ["I", "love", "NLP", "!"]정규화 (Nor..

AI/NLP 2025.02.11
이전
1
다음
더보기
프로필사진

dragonhyeon 님의 블로그

김드레곤현이다

  • 분류 전체보기 (56) N
    • AI (7)
      • Spatio-temporal (1)
      • LLM (4)
      • NLP (1)
      • PyTorch (1)
    • CS (18)
      • OS (6)
      • Linux (7)
      • Compilers (2)
      • DB (3)
    • Dev (25) N
      • Python (2) N
      • VCS (18)
      • DevOps (0)
      • Web Programming (5)
    • 기타 지식 (4)
    • 일상 (2)

Tag

merge, etc., db, Github, LangChain, rebase, vcs, git, django, squash, dev, OS, CS, ubuntu, LLM, drf, 웹 프로그래밍, Linux, Python, ai,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

Archives

Calendar

«   2025/08   »
일 월 화 수 목 금 토
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

  • GitHub

티스토리툴바