Ⅰ. R 기초

1. R에 대하여

2020. 9. 17. 01:30

2015년 외교전문지 포린 어페어(Foreign Affairs)에서 "4차 산업혁명"이라는 용어가 등장함에 따라, 여러 산업군에서는 데이터를 핵심 가치로 인식하기 시작했습니다. 특히 다양한 도메인에서 데이터 과학(Data Science)과 기존의 방법론을 통한 기술융합⋅기술혁신에 대한 연구가 활발히 일어나고 있습니다. R은 파이썬과 더불어 데이터 과학을 통해 인사이트를 구현하는 도구이자 프로그래밍 언어라고 할 수 있습니다.

 

1.1. R의 정의와 특징

더보기

(1) R의 정의

R은 통계 및 데이터 분석을 위해 개발된 프로그래밍 언어입니다. R은 통계 언어인 S의 계보를 이어 1993년 오클랜드 대학의 로버트 젠틀맨(Robert Gentleman)과 로스 이하카(Ross Ihaka)에 의해 최초 개발되었습니다. 비슷한 시기 개발된 S+와 달리 오픈 소스 소프트웨어로 제공되고있으며, 현재는 R-core팀이 개발하고 있습니다. 

 

(2) R의 특징

 ①인터프리터 언어 : R은 소스 코드를 한 줄 씩 해석하고 처리하는 언어임

 ②객체 지향 언어 : R은 함수의 기능이 객체의 클래스에 의해 결정다는 점에서 객체 지향 언어라고 할 수 있다.

 ③함수형 언어 : R은 함수의 파라미터(인자)로 함수를 쓸 수 있고, 반환 값으로 함수를 받을 수 있음

 

1.2. R과 Python의 비교 

더보기

(1) R과 Python의 비교

빅데이터 분석용 언어로는 대표적으로 R과 Python이 양대 산맥을 이루고 있습니다. 두 언어 모두 분석을 위한 다양한 패키지 생태계가 구성되어 있으나, R 혹은 Python에서만 지원하는 패키지가 존재하기에 데이터 과학자는 두 언어에 능통해야 합니다. 허나 두 언어를 굳이 비교한다면 다음과 같은 상대적인 장점을 가지고 있습니다.

구분 R Python
  범용성  
  패키지 생태계
  문법적 통일성  
  전처리  
  시각화  
  통계 분석   
  고전 머신러닝 알고리듬
  딥러닝 알고리듬  

 

(2) R의 상대적인 장점

 ①다양한 전처리 및 EDA 함수 지원 

 ②쉬운 패키지 버전 관리 : CRAN에 등재된 패키지간 충돌이 적음

 ③마크다운, 대시보드 등 산출물 관리 용이 

 

(3) R의 상대적인 단점

 ①느린 수행 속도

 ②양립하는 문법 체계 : base 문법과 tidyverse 문법이 혼재하고 있음

 ③적은 사용 유저풀

 

'Ⅰ. R 기초' 카테고리의 다른 글

5. RStudio Project 생성하기  (0) 2020.09.21
4. RStudio 설치 및 환경 설정하기  (0) 2020.09.19
3. Rtools 설치하기  (0) 2020.09.18
2. R base 설치 및 코드 입출력 이해하기  (0) 2020.09.17