R 문법
-
R기초6 R 로 데이터 수집하기 이번 시간에는 인터넷 상에 있는 데이터를 R을 이용해서 수집하는 scraping을 보겠습니다. 흔히, 크롤링(crawling)이라는 표현을 쓰는데, 이는 검색 엔진에 더 적합한 표현이고, 단순히 웹으로 부터 데이터를 수집하는 것은 scraping이 더 맞는 표현이라고 합니다.크롤링은 기본적인 과정은 web의 html 파일을 가져온 후, 파싱(parsing)을 해서 원하는 데이터에 접근하게 됩니다. parsing 방법에는 html 태그 혹은 css나 id 를 통해 원하는 데이터에 접근하는 방식과 html의 트리 구조를 이용하여 접근하는 XML 방식이 있습니다. 본 포스팅에서는 태그와 css를 이용해 접근하는 방식을 사용해 보겠습니다.먼저, rvest 패키지를 설치합니다. i..
R로 크롤링하기 - 보배드림 예제R기초6 R 로 데이터 수집하기 이번 시간에는 인터넷 상에 있는 데이터를 R을 이용해서 수집하는 scraping을 보겠습니다. 흔히, 크롤링(crawling)이라는 표현을 쓰는데, 이는 검색 엔진에 더 적합한 표현이고, 단순히 웹으로 부터 데이터를 수집하는 것은 scraping이 더 맞는 표현이라고 합니다.크롤링은 기본적인 과정은 web의 html 파일을 가져온 후, 파싱(parsing)을 해서 원하는 데이터에 접근하게 됩니다. parsing 방법에는 html 태그 혹은 css나 id 를 통해 원하는 데이터에 접근하는 방식과 html의 트리 구조를 이용하여 접근하는 XML 방식이 있습니다. 본 포스팅에서는 태그와 css를 이용해 접근하는 방식을 사용해 보겠습니다.먼저, rvest 패키지를 설치합니다. i..
2016.08.07 -
R기초5 R기초 문법 #5 - dplyr 호돌2 R을 이용한 데이터 전처리 : dplyr 오늘은 R을 활용한 데이터 전처리를 다뤄보겠습니다. 여기서 데이터 전처리라 함은 Data munging 혹은 data wrangling 이라고도 불리는데요. 이는 raw 데이터를 우리가 원하는 형태로 바꾸는 것을 의미합니다. 불필요한 정보를 제거하거나 다른 패키지의 input으로 활용하는 등의 다양한 작업에 있어서 꼭 필요한 작업인 동시에 많은 시간이 필요한 작업입니다. 오늘 배울 dplyr는 특정 데이터를 추출, 새로운 변수를 추가, group별 연산 등 다양하게 활용되는 패키지이므로 꼭 알아두시기 바랍니다. dplyr dplyr에서 다음 3가지는 꼭 알아두세요. * filter(데이터, 조건, 조건, ..) : ..
R 핵심만 배우기 #5 - dplyrR기초5 R기초 문법 #5 - dplyr 호돌2 R을 이용한 데이터 전처리 : dplyr 오늘은 R을 활용한 데이터 전처리를 다뤄보겠습니다. 여기서 데이터 전처리라 함은 Data munging 혹은 data wrangling 이라고도 불리는데요. 이는 raw 데이터를 우리가 원하는 형태로 바꾸는 것을 의미합니다. 불필요한 정보를 제거하거나 다른 패키지의 input으로 활용하는 등의 다양한 작업에 있어서 꼭 필요한 작업인 동시에 많은 시간이 필요한 작업입니다. 오늘 배울 dplyr는 특정 데이터를 추출, 새로운 변수를 추가, group별 연산 등 다양하게 활용되는 패키지이므로 꼭 알아두시기 바랍니다. dplyr dplyr에서 다음 3가지는 꼭 알아두세요. * filter(데이터, 조건, 조건, ..) : ..
2016.08.04 -
R 기초 4 R 핵심 문법 #4 - data.frame 2번째 양호성 데이터 프레임 다루기 지금까지 배웠던 자료구조들을 토대로 데이터를 다루는 것을 조금씩 해보겠습니다. data.frame 에서 row / column 추가하기 두 벡터를 각각 row로 하는 dataframe을 만들고 싶으면? : rbind vec1
R 핵심만 배우기 #4 - 데이터 프레임 2번째R 기초 4 R 핵심 문법 #4 - data.frame 2번째 양호성 데이터 프레임 다루기 지금까지 배웠던 자료구조들을 토대로 데이터를 다루는 것을 조금씩 해보겠습니다. data.frame 에서 row / column 추가하기 두 벡터를 각각 row로 하는 dataframe을 만들고 싶으면? : rbind vec1
2016.08.03 -
R 핵심만 배우기 #3 - 데이터 프레임(data.frame) 첫번째 R 핵심만 배우기 #3 - 데이터 프레임(data.frame) 첫번째 호돌2 2017년 10월 29일 (2017년 업데이트 하면서, R(3.4.2버전), R Notebook 으로 작성되었습니다.) > data.frame 다루기 data.frame에 대해 알아봅시다 데이터 프레임은 R의 핵심적인 자료구조로서,쉽게 말해 엑셀과 같이 숫자, 문자 등 다양한 데이터를 하나의 테이블에 담을 수 있는 자료구조입니다.이를 잘 활용하면 엑셀의 기능들을 R에서도 자유자제로 사용할 수 있습니다. 먼저 데이터 데이터 프레임을 생성하는 방법은 다음과 같습니다. df
R 핵심만 배우기 #3 - 데이터 프레임(data.frame) 첫번째R 핵심만 배우기 #3 - 데이터 프레임(data.frame) 첫번째 R 핵심만 배우기 #3 - 데이터 프레임(data.frame) 첫번째 호돌2 2017년 10월 29일 (2017년 업데이트 하면서, R(3.4.2버전), R Notebook 으로 작성되었습니다.) > data.frame 다루기 data.frame에 대해 알아봅시다 데이터 프레임은 R의 핵심적인 자료구조로서,쉽게 말해 엑셀과 같이 숫자, 문자 등 다양한 데이터를 하나의 테이블에 담을 수 있는 자료구조입니다.이를 잘 활용하면 엑셀의 기능들을 R에서도 자유자제로 사용할 수 있습니다. 먼저 데이터 데이터 프레임을 생성하는 방법은 다음과 같습니다. df
2016.08.01 -
R 핵심 문법 #2 - 리스트, 메트릭스, 배열 R 핵심 문법 #2 - 리스트, 메트릭스, 배열 호돌2 2017년 10월 29일 R 기초 두번째 두번째 시간입니다. 이번 시간에는 리스트와 메트릭스에 대해서 알아보겠습니다. list에 대해 알아봅시다 list는 vector 처럼 여러 원소를 담을 수 있는 그릇인데, vector와 가장 큰 차이점은 여러가지 자료형 원소도 함께 담을 수 있다는 점입니다. lst
R 핵심만 배우기 #2 - 리스트, 메트릭스, 배열R 핵심 문법 #2 - 리스트, 메트릭스, 배열 R 핵심 문법 #2 - 리스트, 메트릭스, 배열 호돌2 2017년 10월 29일 R 기초 두번째 두번째 시간입니다. 이번 시간에는 리스트와 메트릭스에 대해서 알아보겠습니다. list에 대해 알아봅시다 list는 vector 처럼 여러 원소를 담을 수 있는 그릇인데, vector와 가장 큰 차이점은 여러가지 자료형 원소도 함께 담을 수 있다는 점입니다. lst
2016.08.01 -
R 핵심 기능 #1 - 스칼라, 요인, 벡터 R 핵심 기능 #1 - 스칼라, 요인, 벡터 호돌2 2017년 10월 29일 (2017년 업데이트 하면서, R(3.4.2버전), R Notebook 으로 작성되었습니다.) 들어가며 안녕하세요. 호돌2 입니다. 시중에는 이미 많은 R 교재와, 수많은 블로그들이 존재합니다. 다만, 성격이 급한 제가 R, Python등을 처음 공부하면서 느꼈던 점은 자주 사용되는 기능들이 강조되기 보다는, 모든 기능들에 대해 단순히 나열되어 있어서 초반에 배우는 게 매우 지루했습니다. 그리고, 이러한 문법 또는 함수가 어느 상황에 사용되는지 직접 경험을 통해 체득할 기회가 적다는 점이었습니다. 본 포스트는 제가 대학생들을 대상으로 R기초 부분 강의를 준비하면서 만들었던 자료를 토대..
R 핵심만 배우기 #1 - 스칼라, 요인, 벡터R 핵심 기능 #1 - 스칼라, 요인, 벡터 R 핵심 기능 #1 - 스칼라, 요인, 벡터 호돌2 2017년 10월 29일 (2017년 업데이트 하면서, R(3.4.2버전), R Notebook 으로 작성되었습니다.) 들어가며 안녕하세요. 호돌2 입니다. 시중에는 이미 많은 R 교재와, 수많은 블로그들이 존재합니다. 다만, 성격이 급한 제가 R, Python등을 처음 공부하면서 느꼈던 점은 자주 사용되는 기능들이 강조되기 보다는, 모든 기능들에 대해 단순히 나열되어 있어서 초반에 배우는 게 매우 지루했습니다. 그리고, 이러한 문법 또는 함수가 어느 상황에 사용되는지 직접 경험을 통해 체득할 기회가 적다는 점이었습니다. 본 포스트는 제가 대학생들을 대상으로 R기초 부분 강의를 준비하면서 만들었던 자료를 토대..
2016.08.01