top 327

Case 8. ggplot2() 와 ggmap 을 사용한 지도위에 표기하기

아래의 예는 ggplot2() 패키지와 ggmap 을 활용하는 방법을 보여주고 있으며 원문은http://freesearch.pe.kr/archives/3953 입니다. > rm(list=ls())> install.packages("doParallel")Installing package into ‘C:/Users/stu/Documents/R/win-library/3.0’(as ‘lib’ is unspecified)trying URL 'http://cran.nexr.com/bin/windows/contrib/3.0/doParallel_1.0.7.zip'Content type 'application/zip' length 184085 bytes (179 Kb)opened URLdownloaded 179 Kb p..

IT기술/BigData 2014.02.24

Case 7. 서울의 온도변화 차트 그리기 - ggplot2() 사용

1. 작업 디렉토리 설정> setwd("d:/yul/temp") 2. ggplot2() 패키지 설치 후 로딩> install.packages("ggplot2")Installing package into ‘C:/Users/stu/Documents/R/win-library/3.0’(as ‘lib’ is unspecified)--- Please select a CRAN mirror for use in this session ---trying URL 'http://cran.nexr.com/bin/windows/contrib/3.0/ggplot2_0.9.3.1.zip'Content type 'application/zip' length 2656354 bytes (2.5 Mb)opened URLdownloaded 2..

IT기술/BigData 2014.02.24

Case 6. 서울시 Wifi Zone 설치 정보 분석하기

> setwd("d:/yul/temp")> rm(list=ls())> install.packages("doParallel") #대량의 작업일 경우 병렬처리를 하게 해주는 패키지Installing package into ‘C:/Users/stu/Documents/R/win-library/3.0’(as ‘lib’ is unspecified)--- Please select a CRAN mirror for use in this session ---also installing the dependencies ‘foreach’, ‘iterators’ trying URL 'http://cran.nexr.com/bin/windows/contrib/3.0/foreach_1.4.1.zip'Content type 'appli..

IT기술/BigData 2014.02.21

Case 5 국가별 인구밀도 분석하기

step1. 자료 불러오기자료출처: 국토연구원 전자도서관 (http://library.krihs.re.kr/statmove.do) > rm(list=ls())> setwd("d:/yul/temp")> d names(d)[1] "국명" "국토면적" "인구밀도"> dim(d)[1] 17 3 step 2. 자료 처리하기> d[order(d$국명),] 국명 국토면적 인구밀도11 네 덜 란 드 41,530 39216 뉴 질 랜 드 267,710 153 대 만 36,190 6327 덴 마 크 43,090 1269 독 일 357,050 2325 미 국 9,632,030 312 방글라데시 144,000 98512 스 웨 덴 450,290 2013 스 위 스 41,280 17614 영 국 243,610 24610 이 탈..

IT기술/BigData 2014.02.20

데이터 핸들링 하기

데이터 프레임 사용하기데이터 프레임이란 배열과 비슷하지만 차이점은 각 컬럼별로 데이터 형태가 다를 수 있다는 점입니다. 즉 RDBMS 에서 테이블과 비슷한 형태라고 생각하면 됩니다.일반 DBMS 에서는 컬럼이라고 부르는 것을 R 에서는 라벨이라고 부릅니다.일반 DB에서 컬럼을 통해 데이터 접근이 가능하듯이 R 에서도 라벨을 이용해서 데이터 제어가 가능합니다. No Name Price Qty1 Apple 500 52 Banana 200 23 Peach 200 74 Berry 50 9 위와 같은 형태를 R 에서는 데이터 프레임이라고 하며 직접 R 에서 만들 수도 있고 외부 파일에서 읽어와서 데이터를 생성할 수도 있습니다. 1. R 에서 데이터 프레임 생성하기1) 벡터로 부터 데이터 프레임 생성하기 > no ..

IT기술/BigData 2014.02.19

R 그래프 함수 활용하기

학습개요그래프는 데이터를 시각적으로 보여주는데 중요한 역할을 한다. R프로그램에서 그래프 함수를 잘 활용하면 데이터를 보다 명료하고 해석이 용이하게 할 수 있다. 이번 장은 R프로그램에서 활용할 수 있는 그래프 함수에 대해서 알아본다. 학습목표1. PLOT 함수에 대해서 알아보자.2. PLOT 함수 옵션에 대해서 알아보자.3. R에서 제공하는 PLOT 종류에 대해서 알아보자.4. 그래프에 유용한 함수들을 알아보자.5. 통계분포 함수를 이용하여 그래프를 그려보자 주요용어Plot, Points, Lines, 분포 1. 그래프 함수 활용도입그래프라는 개념이 없었다면 어떻게 되었을까? 간단한 자료는 쉽게 파악할 수 있지만 복잡한 자료는 그렇지 못할 것이다. 머릿속으로 복잡한 자료의 구조나 형태를 파악하려면 머리..

IT기술/BigData 2014.02.18

R 기초 입문

R 은 데이터 분석을 위한 통계 및 그래픽스를 지원하는 Freeware Software 입니다.아주 훌륭한 성능을 가지고 있으면서도 Freeware 라는 것이 놀라울 정도인 멋진 Software 이지요. 이렇게 좋은 프로그램의 뿌리는 벨 연구소에서 만들어진 통계 분석 언어 S입니다. R 은 S언어를 근간으로 뉴질랜드의 University of Auckland에서 RossIhaka 와 Robert Gentleman 로 부터 시작되었습니다. R 은 현재 데이터 분석 을 위한 도구로 많은 인기를 누리고 있습니다.한 가지 사례로 kdnugget 에서 실시한‘ 지난 12개월 간 실제로 사용한 분석, 데이터 마이닝, 빅데이터 소프트웨어’에 대한 설문 조사가 있습니다.그 조사 내용에 따르면 R 은 2012년 기준으로..

IT기술/BigData 2014.02.13

03 하둡 분산 파일 시스템

3.1 HDFS 기초DAS (Direct-attached storage): 서버에 직접 연결된 스토리지이며, 외장형 하드디스크로 이해하며 됩니다. 여러 개의 하드디스크를 장착할 수 있는 있는 외장 케이스를 이용하는 방식NAS (Network-attached storage): 일종의 파일서버입니다. 별도의 운영체제를 사용하며, 파일시스템을 안정적으로 공유할 수 있습니다.주로 첨부파일이나 이미지 같은 데이터를 저장하는데 많이 사용합니다.SAN (storage area network): 수십에서 수백대의 SAN 스토리지를 데이터 서버에 연결해 총괄적으로 관리해주는 네트워크를 의미합니다.DAS 의 단점을 극복하기 위해 개발됐으며, 현재 SAN 기법이 시장의 절반 이상을 차지합니다.DBMS 와 같이 안정적이고 빠..

IT기술/BigData 2014.02.12