ADsP 내용 정리

R을 활용한 분석 실습

여연찌 2024. 4. 1. 11:46

R 언어

print: console 창에 출력

스칼라: 하나의 값

벡터: 하나의 값들이 여러개 모여있는 것, 1차원 

행렬: 2차원으로 모여있는 것

배열: 3차원 이상의 구조

 

벡터

: 명령어 C 를 이용해 선언 

c(      )

 

문자형 타입 (Character)

따옴표 혹은 쌍따옴표로 표시

숫자형 타입(Number)

numeric(숫자형), integer(정수), double(실수)

논리형 타입(Logical)

참(True)과 거짓(False)

 

 

* '='

: 할당연산자

 

 

콜론(:)을 활용하여 시작값과 끝값을 지정하여 벡터를 생성할 수 있음

 

문자형 벡터가 포함되면 합쳐지는 벡터는 문자형 벡터가 된다.

 

NaN: 연산을 했을 떄 오류와 함께 숫자가 아님을 반환

NA: 공간을 차지하는 결측값

NULL: 공간을 차지하지 않는 존재하지 않는 값

 

 

 

행렬

: 2차원 구조를 가진 벡터

: 행렬의 선언을 위해서 명령어 matrix를 사용

: 모든 데이터는 같은 타입이어야 한다.(ncol >> 열, nrow >> 행)

 

 

배열

: 3차원 이상의 구조를 가진 벡터

: 모두 같은 타입이어야 한다.

 

 

리스트

: 여러 자료형의 원소들이 포함

: 각각의 원소가 인덱스를 가진다.

 

 

데이터 프레임

: 행렬과 유사한 2차원 목록 데이터 구조

: 각 열이 서로 다른 데이터 타입을 가질 수 있다.

 

 

 

대입연산자

<-, <<-,=  오른쪽 값을 왼쪽에 대입

->,->> 왼쪽 값을 오른쪽에 대입

ex.

A = B

B 를 A에 할당해준다

 

 

비교연산자

두 값을 비교

True, False 로 구분

 

== 두 값이 같은지

!= 두 값이 다른지

 

 

산술연산자

%/%  두 숫자의 나눗셈의 몫

%%  두 숫자의 나눈셈의 나머지

^,**  거듭제곱

 

* 벡터의 길이가 동일하지 않은 경우, 원소가 많은 쪽이 기준이 된다

원소가 적은 쪽이 반복이 된다.

 

 

기타 연산자

! 부정연산자 반대
& AND 연산자 모두 참일때만
| OR 연산자 둘 중 하나가 참일때도

 

 

통계함수

summary

: 값의 요약값

: 데이터의 평균, 최솟갑, 최댓값 등 을 모두 찾아준다,

 

제어문

반복문, 조건문

 

반복문

for 반복문

: 반복할 횟수가 정해져있을 때

while 반복문

: 조건으로 자를 때

 

 

조건문

if ~ else 구문을 이용

 

* 내가 만든 함수 구문을 패키지하여 인터넷상에 배포를 하면 다른 사람도 사용할 수 있다!

 

 

 


 

 

벡터

: 동질적이다.

 

1차원 > 벡터

2차원 > 데이터프레임

3차원 > 배열

'ADsP 내용 정리' 카테고리의 다른 글

통계분석 - 통계개요  (1) 2024.04.01
데이터 전처리  (0) 2024.04.01
분석 마스터플랜  (0) 2024.04.01
데이터 분석 기획  (0) 2024.04.01
데이터의 가치와 미래  (0) 2024.04.01