IT is 푸린

  • 홈
  • 방명록

도마뱀책 1

텍스트 데이터 다루기

'파이썬 라이브러리를 활용한 머신러닝' 책으로 공부한 내용을 바탕으로 작성한 글입니다. 문자열 데이터의 종류 범주형 데이터 고정된 목록으로 구성된다. 예) 드롭다운 메뉴의 “빨강”, “녹색”, “파랑”, “노랑” 중 하나를 선택하는 경우 범주에 의미를 연결시킬 수 있는 임의의 문자열 입력 받은 문자를 일정한 범주 안에 포함시킨다. 예) 텍스트 필드에서 쥐색, 회색 등의 답을 입력 받고 이를 ‘여러가지 색’ 범주에 할당한다. 구조화된 문자열 데이터 입력한 값들이 일정한 구조를 가진다. 텍스트 데이터 자유로운 절과 문장으로 구성되어 있다. 데이터셋 - 말뭉치 데이터 포인트 - 문서 영화 리뷰 감성 분석하기 이 데이터셋은 리뷰 텍스트와 '양성' 혹은 '음성'을 나타내는 레이블을 포함한다. IMDb 웹사이트에는..

스터디/머신러닝 2021.05.05
1
더보기
프로필사진

푸로그래밍 공부 기록 공간

  • 분류 전체보기 (44)
    • C언어 (8)
    • 회고록 (1)
    • 스터디 (7)
      • 머신러닝 (5)
      • 블록체인 (2)
    • Python,Django (2)
    • 일상 (0)
    • 알고리즘 (10)
      • 문제 풀이 (6)
    • Java,Spring (7)
    • 뉴스 클리핑 (6)

Tag

django, 제어문과메서드, 텍스트데이터, 자바, 머신러닝, 문제풀이, 머신러닝입문서, 장고, JavaProgramming, IT도서리뷰, Java, 토픽모델링, 백준, 머신러닝교과서, 파이썬라이브러리, 머신러닝책, 기초문법, 도마뱀책, 인공지능, 백엔드,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바