R (통계도구)
정말 오랜만에 글을 쓰게 되네요. 이번에는 제가 주로 사용하고 있는 분석도구인 R에 대해서 소개해보고자 합니다. 많은 분야에서 자료에 대한 통계처리 혹은 forecasting을 목적으로 simulation을 하기위해 다양한 분석도구를 사용하고 있으리라 생각됩니다. 프로그램을 짜는데 무리가 없으신 분들에게는 C, C++, Java와 같은 고급언어를 사용해서 이런 작업들을 할 수 있겠지만 거북이같이 프로그램 언어에 덜 친숙한 사람들은 어려운 것이 사실입니다. 그래서 나온 것들이 사용자들을 위해 미리 만들어진 함수들을 제공하는 범용 software들이 있겠는데요. 통계분석 프로그램에는 SPSS, SAS, Minitab 등이 있겠구요. Simulation을 위한 software에는 유명한 Matlab이 있겠네요. 물론 Matlab에서도 통계처리 함수를 제공하는 걸로 알고 있습니다. 제가 Matlab을 그렇게 많이 사용하지 않아서 R과 함께 비교하기는 어려울거 같구요. 여기서는 R의 특징을 이야기하고자 합니다.
초기형태의 R은 통계분석을 위해 Ross Ihaka와 Robert Gentleman에 의해 개발되었습니다. R의 문법은 S programming language를 기반으로 만들어져서 다른 프로그램 언어처럼 프로그래밍이 가능한 특징도 지니고 있구요. 특히 제가 맘에 들어하는 부분은 R이 오픈소스라서 사용자들이 개발해나가는 프로그램이라는 겁니다 (이말은 공짜라는 이야기지요 ^^). 용량도 가벼워서 어느 컴퓨터에서나 다운받아서 사용할 수 있습니다. 공짜에다가 용량이 작다고 이 녀석을 무시할 수 있느냐... 그건 아닙니다. R은 앞에서도 이야기했듯이 많은 사용자들이 업데이트를 해나가는 프로그램입니다. 그래서 사용자들이 함수를 만들고 이것을 같이 공유하면서 확장성이 아주 뛰어납니다. 그래서 처음엔 통계분석을 위해 개발되었지만 지금은 많은 분야에서 사용이 가능한 프로그램이 되었구요. 현재는 Bayesian, Cluster, Econometrics, Finance, Psychometrics, SocialSciences 등에서도 사용가능한 함수를 개발하는 프로젝트팀이 있다고 하네요. 물론 위에서 언급한 분야 이외에서도 많이 활용되고 있구요.
R Homepage: http://lib.stat.cmu.edu/R/CRAN/index.html
처음에 시작하기가 조금 힘이 들지만 SPSS와 SAS보다 유연하고 가벼우면서 훨씬 파워풀합니다. 또다른 특징은 그래프 기능이 탁월하다는 부분입니다. 지금은 활성화되지 않는것 같아보이지만 R 그래프 공유 사이트도 있더군요.
R Graph Gallery: http://addictedtor.free.fr/graphiques/
아래와 같은 그래프들의 소스코드가 올라와 있습니다.
R에 대한 소개는 요정도로 하구요. 앞으로 간략하게 제가 익힌 R의 기본명령어에 대해 정리하는 글을 올려볼까합니다.
'거북이 > 꾸준히 공부하기' 카테고리의 다른 글
| R (통계도구) - 데이터 입력하기 (0) | 2008/02/19 |
|---|---|
| R (통계도구) (2) | 2008/01/26 |
| 논문의 구성 (0) | 2008/01/09 |
이올린에 북마크하기
이올린에 추천하기


댓글을 달아 주세요
이런게 있군요.
저는 세상에는 SPSS 밖에 없는줄 알았어요.
그러고 보니 책 놓은지가 얼만지 모르겠네요. ㅡㅡ;;
거북이) 저도 R을 만나기전까지는 SPSS와 SAS가 최고인줄 알았습니다. ^^