먼저 데이터를 어떻게 R에다 입력하는지에 대해 간단히 올려보겠습니다.1. c()를 이용하여 데이터 입력하기 >data1=c(1,2,3,5) 데이터를 위와 같이 입력하면 1,2,3,5라는 데이터가 data1이라는 변수에 저장됩니다. 결과 확인은 변수이름을 아래와 같이 치고 엔터를 해줍니다. >data1 [1] 1 2 3 5 그리고 c()를 이용하여 데이터를 입력할 경우 간단한 계산들을 쉽게 할 수 있습니다. 예를 들면 >mean(data1) [1] 2.75 >var(data1) [1] 2.916667 >sum(data1) [1] 11 이외에도 sort, min, max, range, cumsum 등의 함수도 이용할수 있습니다. range는 min과 max를 보여주구요. cum sum은 누적 합계를 보여줍니다. c()를 이용하여 데이터를 입력할 경우 벡터의 형태로 데이터가 저장됩니다. 따라서, 우리가 데이터의 위치만 설정해주면 그 위치의 값만을 불러오는 것이 가능합니다. 예를 들면 >data1[2] [1] 2 >data1[4] [1] 5 또한 데이터내의 자료들의 위치를 검색할 수도 있습니다. 검색이라는 표현이 적절한지는 모르겠네요. ^^ 예를 들어 우리가 찾는 데이터가 3이라면 >which(data1==3) [1] 3 여기서 which 함수가 이용되었구요. 위의 함수의 의미는 data1 데이터 중에서 3의 값은 어디에 어느것인지 묻고 있습니다. 답은 3이구요. 여기서 3은 Third의 의미로 dataset에서 3번째 데이터를 지목함을 의미합니다. 또 데이터의 전체 갯수가 얼마나 되는지 알고 싶을 경우는 length라는 함수를 사용합니다. 예는 아래와 같습니다. >length(data1) [1] 42. sequence 데이타 만들기 : 를 이용해서 간단히 만들수 있습니다. 예를 들어 다음과 같이 입력하면 자동으로 일련의 데이터를 생성해줍니다. >1:5 [1] 1 2 3 4 5 >rev(1:5) [1] 5 4 3 2 1 여기서 rev는 reverse의 약자이구요. sequence 데이터를 만드는 다른 방법은 seq함수를 이용하는 방법이 있습니다 (sequence의 약자가 아닐까 생각합니다.). 예를 들면 >seq(1,5) [1] 1 2 3 4 5 증가정도를 조절할수도 있습니다. by를 이용해서 2씩 증가하도록 해보겠습니다. >seq(1,10,by=2) [1] 1 3 5 7 9 같은 수를 반복하고 싶을때는 rep함수를 이용합니다 (repeat의 약어정도 되겠네요). 아래의 예는 1을 5번 반복하라는 이야기입니다. >rep(1,5) [1] 1 1 1 1 1 rep안에서도 : 을 사용할 수 있습니다. >rep(1:3, 3) [1] 1 2 3 1 2 3 1 2 3 이렇게 1:3이 3번 반복됩니다.3. Matrix 형식 데이터 입력 R을 이용하면 매트릭스 형식의 데이터도 입력이 당연히 가능합니다. ^^ >data1<-matrix(c(1,2,3,4,5,6,7,8,9), nrow=3,ncol=3) >data1 [1] 1 4 7 2 5 8 3 6 9 우리가 평소알고 있던 형태랑 조금 다르게 출력되는 것을 알수 있습니다. 이럴때 t()함수를 이용하면 평소의 모습을 볼 수 있습니다. >t(data1) [1] 1 2 3 4 5 6 7 8 9 매트릭스 간의 곱은 '%*%'를 이용하여 계산하여 줍니다. 예를 들면 아래와 같구요. >data1%*%data2 매트릭스의 특정값을 지정하고 싶을경우는 다음과 같이 해줍니다. >data1[1,3] [1] 7 그외에도 기본적인 연산자들을 제공하고 있는데요. 예를 들어서 >2+2 [1] 4 >2^3 [1] 8 >sqrt(4) 2 >log(10) 2.303 >pi 3.142 등의 간단한 계산도 위와 같이 쉽게 할 수 있습니다. 너무 오랜만에 업데이트를 하게 되네요. 여튼 틈나는데로 계속 업데이트 하도록 하겠습니다. ^^
크리에이티브 커먼즈 라이선스
Posted by
Hare&Tortoise
트랙백 주소 :: http://handt.tistory.com/trackback/24
댓글을 달아 주세요