IT기술/BigData 15

윈도우용 R 에서 오라클 DB 에 접속하는 방법

이번 테스트 환경은 윈도 7 (64비트) 에 설치된 64비트 R (3.0.2) 버전에서 물리적으로 다른 장비에 RHEL 5 버전에 설치된 Oracle 11g R2 에 버전에 접속하게 합니다.이 실습을 하기 위해 윈도 PC 에는 Oracle client 가 설치되어 있고 tnsnames.ora 파일이 설정되어 있어 오라클 DB 와 접속이 잘된다고 가정하고 진행합니다.만약 이 전제조건이 안될 경우 아래 내용도 안되므로 이 부분이 잘 되는지 확인 후 아래의 연결작업을 진행하세요.확인방법은 윈도에서 cmd 창을 열어서 tnsping tns_name 해서 ok 나와야 합니다. 1. R 설치 (http://www.r-project.org/ 에서 다운받기) 2. 64비트 R 이므로 64-bit oracle data ..

IT기술/BigData 2014.02.28

연습문제

서울시 지하철 2호선 역위치를 지도 위에 표시하기 csv 파일 만들기1. 구글 지도에서 역찾아서 해당역에 마우스 우측버튼 중앙으로 위치2. 좌측 상단의 링크 버튼 클릭 후 링크 복사 해서 메모장에 붙여넣고3. 첫번째 ll 값을 csv 파일에 저장한다. > library(ggplot2)> library(ggmap)> setwd("d:/yul/temp")> loc loc> kor kor.map kor.map + geom_text(data=loc, aes(x = LON, y = LAT+0.005, label=역명), size=3)> ggsave("d:/yul/temp/line2.png", dpi=500) 제주도 여행 코스 지도에 표시하기제주 국제 공항 → 점심 돔베돈 → 공룡랜드 → 협재해수욕장/한림공원 → ..

IT기술/BigData 2014.02.28

서울시 각 구청의 위치를 지도에 표시하기

> library(ggplot2)> library(ggmap)> setwd("d:/yul/temp")> loc loc 구청명 LAT LON1 강남구청 37.52579 127.04832 서초구청 37.49093 127.03293 동작구청 37.51871 126.93644 구로구청 37.50237 126.88905 양천구청 37.52007 126.95496 영등포구청 37.54240 126.84027 관악구청 37.48467 126.95158 용산구청 37.53804 126.99139 서대문구청 37.58567 126.935710 마포구청 37.57003 126.901911 은평구청 37.60675 126.930212 종로구청 37.57615 126.979013 중구청 37.56798 126.997514 성..

IT기술/BigData 2014.02.28

ggplot2() 와 ggmap 사용한 지도 위에 표기하기 예제

> install.packages("ggmap")Installing package into ‘C:/Users/stu/Documents/R/win-library/3.0’(as ‘lib’ is unspecified)--- Please select a CRAN mirror for use in this session ---trying URL 'http://cran.nexr.com/bin/windows/contrib/3.0/ggmap_2.3.zip'Content type 'application/zip' length 4529152 bytes (4.3 Mb)opened URLdownloaded 4.3 Mb package ‘ggmap’ successfully unpacked and MD5 sums checked The..

IT기술/BigData 2014.02.27

Case 8. ggplot2() 와 ggmap 을 사용한 지도위에 표기하기

아래의 예는 ggplot2() 패키지와 ggmap 을 활용하는 방법을 보여주고 있으며 원문은http://freesearch.pe.kr/archives/3953 입니다. > rm(list=ls())> install.packages("doParallel")Installing package into ‘C:/Users/stu/Documents/R/win-library/3.0’(as ‘lib’ is unspecified)trying URL 'http://cran.nexr.com/bin/windows/contrib/3.0/doParallel_1.0.7.zip'Content type 'application/zip' length 184085 bytes (179 Kb)opened URLdownloaded 179 Kb p..

IT기술/BigData 2014.02.24

Case 7. 서울의 온도변화 차트 그리기 - ggplot2() 사용

1. 작업 디렉토리 설정> setwd("d:/yul/temp") 2. ggplot2() 패키지 설치 후 로딩> install.packages("ggplot2")Installing package into ‘C:/Users/stu/Documents/R/win-library/3.0’(as ‘lib’ is unspecified)--- Please select a CRAN mirror for use in this session ---trying URL 'http://cran.nexr.com/bin/windows/contrib/3.0/ggplot2_0.9.3.1.zip'Content type 'application/zip' length 2656354 bytes (2.5 Mb)opened URLdownloaded 2..

IT기술/BigData 2014.02.24

Case 6. 서울시 Wifi Zone 설치 정보 분석하기

> setwd("d:/yul/temp")> rm(list=ls())> install.packages("doParallel") #대량의 작업일 경우 병렬처리를 하게 해주는 패키지Installing package into ‘C:/Users/stu/Documents/R/win-library/3.0’(as ‘lib’ is unspecified)--- Please select a CRAN mirror for use in this session ---also installing the dependencies ‘foreach’, ‘iterators’ trying URL 'http://cran.nexr.com/bin/windows/contrib/3.0/foreach_1.4.1.zip'Content type 'appli..

IT기술/BigData 2014.02.21

Case 5 국가별 인구밀도 분석하기

step1. 자료 불러오기자료출처: 국토연구원 전자도서관 (http://library.krihs.re.kr/statmove.do) > rm(list=ls())> setwd("d:/yul/temp")> d names(d)[1] "국명" "국토면적" "인구밀도"> dim(d)[1] 17 3 step 2. 자료 처리하기> d[order(d$국명),] 국명 국토면적 인구밀도11 네 덜 란 드 41,530 39216 뉴 질 랜 드 267,710 153 대 만 36,190 6327 덴 마 크 43,090 1269 독 일 357,050 2325 미 국 9,632,030 312 방글라데시 144,000 98512 스 웨 덴 450,290 2013 스 위 스 41,280 17614 영 국 243,610 24610 이 탈..

IT기술/BigData 2014.02.20

데이터 핸들링 하기

데이터 프레임 사용하기데이터 프레임이란 배열과 비슷하지만 차이점은 각 컬럼별로 데이터 형태가 다를 수 있다는 점입니다. 즉 RDBMS 에서 테이블과 비슷한 형태라고 생각하면 됩니다.일반 DBMS 에서는 컬럼이라고 부르는 것을 R 에서는 라벨이라고 부릅니다.일반 DB에서 컬럼을 통해 데이터 접근이 가능하듯이 R 에서도 라벨을 이용해서 데이터 제어가 가능합니다. No Name Price Qty1 Apple 500 52 Banana 200 23 Peach 200 74 Berry 50 9 위와 같은 형태를 R 에서는 데이터 프레임이라고 하며 직접 R 에서 만들 수도 있고 외부 파일에서 읽어와서 데이터를 생성할 수도 있습니다. 1. R 에서 데이터 프레임 생성하기1) 벡터로 부터 데이터 프레임 생성하기 > no ..

IT기술/BigData 2014.02.19

R 그래프 함수 활용하기

학습개요그래프는 데이터를 시각적으로 보여주는데 중요한 역할을 한다. R프로그램에서 그래프 함수를 잘 활용하면 데이터를 보다 명료하고 해석이 용이하게 할 수 있다. 이번 장은 R프로그램에서 활용할 수 있는 그래프 함수에 대해서 알아본다. 학습목표1. PLOT 함수에 대해서 알아보자.2. PLOT 함수 옵션에 대해서 알아보자.3. R에서 제공하는 PLOT 종류에 대해서 알아보자.4. 그래프에 유용한 함수들을 알아보자.5. 통계분포 함수를 이용하여 그래프를 그려보자 주요용어Plot, Points, Lines, 분포 1. 그래프 함수 활용도입그래프라는 개념이 없었다면 어떻게 되었을까? 간단한 자료는 쉽게 파악할 수 있지만 복잡한 자료는 그렇지 못할 것이다. 머릿속으로 복잡한 자료의 구조나 형태를 파악하려면 머리..

IT기술/BigData 2014.02.18