[Statistics] package, graphic drawing tool

http://www.r-project.org

[SAS]와 MatLab을 합쳐놓은 듯한 [GNU] license의 ProgrammingLanguage. 생물학자들을 위한 라이브러리 BioConductor가 있다.

BellLabs의 [S] language와 유사하며, [S]의 코드가 그대로 돌아간다.

다양한 통계모듈이 돌아간다. (linear and NonLinear modelling, classical statistical tests, TimeSeriesAnalysis, [Clustering]등등)

관련서적

  • [RForBioinformatics]

관련포스트

기본적인 사용법

불러오기 텍스트 자료를 A 로 읽어 들이기 (첫 행이 header 이고, 각 요소에 맞게 입력된 txt문서,또는 엑셀에서 만들어진후 변화된 txt 문서)

  • A <- read.table("c:/My Docuemnts/A.txt", header = TRUE)

    • 확장자만 바꾸어 주면 Exel, SAS, SPSS... 등의 자료를 불러 들일 수 있다고 한다.

GRAPH 불러들인 자료 A에서 변수 a,b 를 사용한 코드

  • Box plot 예 ( 1, 2 는 읽는 방법만 다름, 결과 동일)
    • 1)

      x <- A$a y <- A$b plot(x, y, ...그외 option) 2) attach(A) plot(x, y, ...그외 option) detach(A)

    Histogram 예
    • attach(A) hist(a, xlab="Measured Level", main="Fig 1. Histogram of A") detach(A)
    Categorized 된 자료의 구룹별 빈도 그래프를 그리려면,
    • plot(x)
      • # x ; categorized 된 변수명

[ANOVA]

  • ANOVA 코드의 기본 골격......value a : continuous, value b : category
    • aov.A <- aov(sqrt(A$a) ~ A$b) print(aov.A) summary(aov.A)

      • # ~ 의 왼쪽이 Y, 오른쪽이 X

외부 파일에 있는 명령어 사용 source("경로 및 file명")

Console 결과를 ouput file로 만들기 sink("경로 및 file명")

  • aov.A <- aov(sqrt(A$a) ~ A$b) print(aov.A)

sink()

anova를 loop로 반복 작업시키고 결과 파일 만들기 여러 locus로 QTL 분석을 할 때 지루한 반복 작업을 줄일 수 있다. 불러들인 파일 A에 X1~X3 까지의 loci genotype이 있고, 연속 변수 V1이 있을때, 각 loci와 V1간의 QTL 분석 반복하는 코드 컴맹이 이거 만드느라고 엄청 고생했다. 혹시 더 좋은 코드가 있으면 가르쳐 주세요. 특히 list 부분에서...

k <- list(A$X1, A$X2, A$X3)

sink("c:/R/result.txt") for (x in k)

  • {aov.A <- aov(sqrt(x) ~ A$V1) print(aov.A)}

sink()

R FAQ

Operator 가 뭡니까? 메뉴얼에 아래 처럼 나와 있는데 그 정확한 의미가 무었인지?............. DrPepper

R allows the use of arithmetic expressions using operators similar to those of the C programming 
language, for instance 
> 1 + 2 
3 

Expressions can be grouped using parentheses, mixed with function calls, and assigned 
to variables in a straightforward manner 
> y <- 2 * (a + log(x)) 
  • Operator란 연산자입니다. (+, -, *, 등등...) 윗 예에서 Cee언어의 연산자랑 비슷하다는 얘기는 즉, 더할려면 + 를, 곱할려면 * 를 쓰라는 의미이고, 그 밑 문단은 소괄호로 우선순위가 지어지고, 함수와도 같이 연결해서 쓸수 있다는 의미입니다.... --[yong27], 2005-02-03


http://www.r-project.org/ 에 가면 중간 아래에 큼직하게 R version 2.0.1 이 있어서 다운 받아 다시 깔려고 했더니 좀 이상하네요. insterller 같은 것도 없고, 그냥 압축 파일인데 압축을 풀어도 실행 파일도 안 보이네요. 어떻게 해야 깔아서 실행시키지요?.....DrPepper

  • 프로그램 소스파일입니다. 원하는 OperatingSystem에 컴파일하여 쓰실 수 있습니다. [Win32]용 컴파일방법도 readme에 있네요. 어쨌건 컴파일하려면 비주얼스튜디오같은 컴파일러가 있어야하고요, 그냥 첫페이지의 다운로드 링크를 따라가시면, 윈도우용 컴파일된 파일을 구하실 수 있습니다. --[yong27], 2005-02-18


CategoryLanguage

web biohackers.net