본문 바로가기 메뉴 바로가기

johanjun

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

johanjun

검색하기 폼
  • 분류 전체보기 (27)
    • Study (25)
      • Deep Learning (0)
      • NLP (9)
      • Data Science (0)
      • Data Engineering (0)
      • MLOps (11)
      • Statistics (1)
      • UX (2)
      • Product (2)
    • Jobs (2)
  • 방명록

Tokenization (1)
NLP with DeepLearning (3) - Tokenization

텍스트 데이터 레이블 텍스트 데이터의 레이블은 다양한 형태로 존재할 수 있다. csv파일(comma-separated variables)은 문장 내의 comma와 혼동 될 수 있어서, tsv(tab-separated variables)를 권장한다. text classification의 경우는 클래스와 sentence가 tab으로 구분된 형태로 존재한다. Class Sentence positive !빠른 배송 좋아요 negative 이게뭐야?진짜이게뭐야?리뷰보고구매했는데!나원참! negative 제품 손잡이가 생각보다 너무약해 사용하기가 불편합니다. ... ... sentence ↔ sentence의 경우 1번과 같은 형태, 또는 대응되는 다른 파일로도 저장되어 있을 수 있다. Sentence Segmen..

Study/NLP 2021. 11. 20. 15:28
이전 1 다음
이전 다음
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
  • torch
  • 쿠버네티스
  • 인공지능
  • Oreilly
  • PM
  • 도커
  • PO
  • container
  • 머신러닝
  • Kubernetes
  • 스타트업
  • mlpipeline
  • pmpo
  • ML
  • dl
  • MLOps
  • 전처리
  • 머신러닝파이프라인
  • productmanager
  • 자연어처리
  • Tennis
  • Bert
  • deeplearning
  • nlp
  • DDUX
  • 파이프라인
  • productresearch
  • productowner
  • 딥러닝
  • docker
more
«   2025/08   »
일 월 화 수 목 금 토
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
글 보관함

Blog is powered by Tistory / Designed by Tistory

티스토리툴바