2015년 외교전문지 포린 어페어(Foreign Affairs)에서 "4차 산업혁명"이라는 용어가 등장함에 따라, 여러 산업군에서는 데이터를 핵심 가치로 인식하기 시작했습니다. 특히 다양한 도메인에서 데이터 과학(Data Science)과 기존의 방법론을 통한 기술융합⋅기술혁신에 대한 연구가 활발히 일어나고 있습니다. R은 파이썬과 더불어 데이터 과학을 통해 인사이트를 구현하는 도구이자 프로그래밍 언어라고 할 수 있습니다.
1.1. R의 정의와 특징
(1) R의 정의
R은 통계 및 데이터 분석을 위해 개발된 프로그래밍 언어입니다. R은 통계 언어인 S의 계보를 이어 1993년 오클랜드 대학의 로버트 젠틀맨(Robert Gentleman)과 로스 이하카(Ross Ihaka)에 의해 최초 개발되었습니다. 비슷한 시기 개발된 S+와 달리 오픈 소스 소프트웨어로 제공되고있으며, 현재는 R-core팀이 개발하고 있습니다.
(2) R의 특징
①인터프리터 언어 : R은 소스 코드를 한 줄 씩 해석하고 처리하는 언어임
②객체 지향 언어 : R은 함수의 기능이 객체의 클래스에 의해 결정다는 점에서 객체 지향 언어라고 할 수 있다.
③함수형 언어 : R은 함수의 파라미터(인자)로 함수를 쓸 수 있고, 반환 값으로 함수를 받을 수 있음
1.2. R과 Python의 비교
(1) R과 Python의 비교
빅데이터 분석용 언어로는 대표적으로 R과 Python이 양대 산맥을 이루고 있습니다. 두 언어 모두 분석을 위한 다양한 패키지 생태계가 구성되어 있으나, R 혹은 Python에서만 지원하는 패키지가 존재하기에 데이터 과학자는 두 언어에 능통해야 합니다. 허나 두 언어를 굳이 비교한다면 다음과 같은 상대적인 장점을 가지고 있습니다.
구분 | R | Python |
범용성 | ○ | |
패키지 생태계 | ○ | ○ |
문법적 통일성 | ○ | |
전처리 | ○ | |
시각화 | ○ | |
통계 분석 | ○ | |
고전 머신러닝 알고리듬 | ○ | ○ |
딥러닝 알고리듬 | ○ |
(2) R의 상대적인 장점
①다양한 전처리 및 EDA 함수 지원
②쉬운 패키지 버전 관리 : CRAN
에 등재된 패키지간 충돌이 적음
③마크다운, 대시보드 등 산출물 관리 용이
(3) R의 상대적인 단점
①느린 수행 속도
②양립하는 문법 체계 : base
문법과 tidyverse
문법이 혼재하고 있음
③적은 사용 유저풀
'Ⅰ. R 기초' 카테고리의 다른 글
5. RStudio Project 생성하기 (0) | 2020.09.21 |
---|---|
4. RStudio 설치 및 환경 설정하기 (0) | 2020.09.19 |
3. Rtools 설치하기 (0) | 2020.09.18 |
2. R base 설치 및 코드 입출력 이해하기 (0) | 2020.09.17 |