ADsP :: R 이론부터 실전까지 한번에 보기<텍스트마이닝>
ADsP를 준비하며 정리했던 자료들. 내가 정리 한 것들은 2017년 개정판, 인터넷자료들,위키백과 등 이다. 카테고리는 2017개정판 데이터분석 전문가 책기준으로 되어있다. 1절 텍스트 마이닝 텍스트마이닝 이란 최근 10년사이에 크게 발전한 영역이다. 1980년대에는 노동집약적인 수동적인 방법이 이루어 졌었다. 현대의 텍스트마이닝이란 텍스트를 사용하여, 패턴이나 관계를 추출한 뒤, 그 안의 의미있는 정보나 가치를 발굴하고 해석하는 일을 일컫는다. 다양한 형태의 문서에서 데이터를 획득할 수 있고-웹이나 pdf, ms오피스, 오라클오픈오피스,xml,txt 등- 많은 기업에서 트위터, 고객의 정보를 API로 읽어들여서 분석하고 경영에 반영하고 있다. 텍스트 마이닝의 기능 으로는 문서요약, 분류, 군집화, 특..
2017. 6. 22.