TIL 120

2024-03-25

변수 선언 변수이름 = 값 a = 3 b = 2 print(a,b) # 3 2 숫자형 숫자 간에는 사칙연산이 가능하다 a = 3 b = 2 print(a+b) # 5 print(a//b) # a를 b로 나눈 값(몫) print(a**b) # a의 b승(제곱) print(a%b) # a를 b로 나눈 나머지 + a = 'sparta' 문자도 가능 참(True), 거짓(False) 담을 수 있음 + 소문자로 쓸 경우 변수명으로 인식 + 참,거짓은 변수명으로 쓸 수 없다. 3 == 5 # 같다 4 != 7 # 같지 않다 문자열 작은따옴표 또는 큰 따옴표 사용 따옴표로 감싸지 않으면 변수이름을 뜻한다 a = 2 b = 'a' print(b) + 'a' 는 문자열 문자열 간의 더하기는 문자열을 이어붙인 문자열 fi..

TIL 2024.03.25

2024-03-24 / 3

마스터플랜 수립 프레임워크 마스터플랜 수립 개요 : 첫번째 단계는 우선순위를 정하는 일 : 분석 과제의 적용 범위 및 방식을 설정 : 분석 과제의 우선순위와 적용 범위 및 방식을 종합적으로 고려하여 최종적으로 분석 구현의 로드맵을 수립 * ISP(정보 전략 계획) : 내/외부 환경을 분석 : 시스템 구축 우선순위를 결정 : 분석 마스터 플랜은 일반적인 ISP 방법론을 활용 : 단기 및 중/장기로 나누어 계획 수립 빅데이터의 특징을 고려한 분석 ROI 요소 : 3V는 투자 비용 측면의 요소라고 볼 수 있다. : 가치는 비즈니스 효과 포트폴리오 사분면 분석을 활용한 우선순위 평가 기준 시급성 : 전략적 중요도와 목표 가치(KPI) 에 부합하는지 : Value 비즈니스 효과 측면과 연결 난이도 : 데이터를 생..

TIL 2024.03.24

2024-03-24 / 2

분석 대상과 방법에 따른 4가지 분석 주제 분석대상 분석방법 주제 알고 알아 최적화(Optimization) 알고 몰라 해결책(Solution) 모르고 알아 통찰력(Insight) 모르고 몰라 발견(Discovery) 목표 시점별 분석 기획 과제 중심적: 빠르게 장기적 마스터플랜: 지속적 분석 기획 시 고려사항 1. 가용 데이터 고려 : 데이터가 확보될 수 있는지 2. 적절한 활용방안과 유스케이스의 탐색 : 기존의 방법이 있는지 탐색 3. 장애요소에 대한 사전 계획 수립 : 분석을 수행할 때 발생 가능한 장애요소에 대한 사전 계획 수립 분석 방법론 : 상세한 절차, 방법, 도구와 기법, 템플릿과 산출물 기업의 합리적인 의사결정을 가로막는 방해요소 3가지 1. 고정관념 2. 편향된 생각 3..

TIL 2024.03.24

2024-03-24 / 1

더그래니의 정의 3V - 데이터의 양(Volume), 다양성(Variety), 속도(Velocity) + 4V - 가치(Value) 또는 정확성(Veracity) 빅데이터 출현 배경 * 양질전환법칙 - 데이터의 양이 커지면 질이 좋아진다. *기술발전 - 저장기술의 발전과 가격하락 - 클라우드 컴퓨팅 보편화와 분산처리 기술 * 구글의 Ngram Viewer - 많은 양의 책을 Text 형태로 만드는 과정 * 후> 전> 양> 상 빅데이터 가치 산정이 어려운 이유 데이터 활용 방식 : 데이터 활용방식이 다양해지다보니 가치 산정이 어려워졌음 새로운 가치 창출 : 기존에 없던 가치가 나타날 수 있음 분석 기술의 발전 : 지금은 가치가 없더라도 새로운 분석 기법이 등장할 경우 가치 산정이 될 가능성이 있음 미래의 ..

TIL 2024.03.24

2024-03-23

1. 오늘 배운 것 Bit : 데이터 구성의 최소단위 0과 1 1Byte = 8Bit 1KB = 1000Byte 1MB = 1000KB 1GB = 1000MB 1TB = 1000GB 1PB = 1000TB 1EB = 1000PB 1ZB = 1000EB 1YB = 1000ZB 데이터의 특성 - 객관적 사실로의 개별 데이터는 중요하지 않다. 존재적 특성 : 있는 그대로의 객관적 사실 당위적 특성 : 추론,예측,전망,추정을 위한 근거 데이터의 유형 정성적 데이터: 언어, 문자 등 정량적 데이터: 수치,기호,도형 등 정형데이터 - 고정된 틀이 있으며 연산이 가능 표(테이블) 로 저장되어있는 것 비정형데이터 - 고정된 틀이 없으며 연산이 불가능 영상, 음성 등 반정형데이터 고정된 틀을 가지고 있지만 연산이 불가능..

TIL 2024.03.23

2024-03-22

1. 오늘 배운 것 테이블 내 데이터에 NULL 값이 있고, NULL 을 제외하거나, 사용해야할 경우 SELECT restaurant_name , AVG(rating) avg_rating -- null 을 포함해야할때 , AVG(IF(rating 'Not given', rating, NULL)) avg_rating2 -- null 을 제외해야할때 -- 필요에 따라 선택해서 사용 FROM food_orders GROUP BY 1 IF(rating 'Not given', rating, NULL) -- 자주 쓰는 문구 : rating 컬럼이 'Not given' 이면 rating 값을, 그게 아니라면 NULL 값 입력 AVG 함수는 NULL 값이 있을 경우 없는 것으로 계산한다.AVG(rating) avg_r..

TIL 2024.03.22

2024-03-21

1. 오늘 배운 것 날짜 추출 예시) 2022년 9월 데이터값 ① BETWEEN '2022-09-01' AND '2022-09-30' ② LIKE '2022-09%' ① 의 경우 30일과 31일을 잘못 작성할 경우 조회가 되지 않더라.. ② 의 경우 9월 이후의 값을 불러주기 때문에 훨씬 간편! 날짜 차이 구하기 MySQL 에서는 날짜 차이를 구하기 위해 DATEDIFF, TIMESTAMPDIFF 함수를 사용 간단하게 day 의 차이를 구할 때에는 DATEDIFF 함수를 사용 DATEDIFF(날짜1,날짜2) 날짜1 - 날짜2 TIMESTAMPDIFF(단위, 날짜1, 날짜2) SECOND: 초 MINUTE: 분 HOUR: 시 DAY: 일 WEEK: 주 MONTH: 월 QUARTER: 분기 YEAR: 연 2..

TIL 2024.03.21

2024-03-20

1. 오늘 배운 것 Subquery 연산이 여러번 필요할 경우, 연산결과를 반복해서 적어줘야 할 경우에 사용할수 있는 구문 음식 주문시간이 25분보다 초과한 시간을 가져오기 select order_id, restaurant_name, if(over_time>=0, over_time, 0) over_time -- 25분-25분=0분으로 25분초과 이기 때문에 >= from ( select order_id, restaurant_name, food_preparation_time-25 over_time -- 25분 초과 이기 때문에 -25 from food_orders ) a + 주문 시간이 25분보다 초과 이기 때문에 주문시간 컬럼에서 25분을 빼준다 서브쿼리내로만 할 경우 초과되지 않는 주문건들은 - 값을 ..

TIL 2024.03.20

2024-03-19

1. 오늘 배운 것 특정문자를 다른 문자로 바꾸기 REPLACE(바꿀 컬럼, 현재 값, 바꿀 값) 원하는 문자만 남기기 SUBSTR(조회 할 컬럼, 시작 위치, 글자 수) + 글자 수를 지정하지 않을 경우 끝까지 추출 여러 컬럼의 문자를 합치기 CONCAT(붙이고 싶은 값1, 붙이고 싶은 값2, 붙이고 싶은 값3, ...) GROUP BY 서울 지역의 음식 타입별 평균 음식 주문금액 구하기 SELECT SUBSTR(addr, 1, 2) "시도" , cuisine_type "음식 종류" , AVG(price) "평균 금액" FROM food_orders WHERE addr LIKE '%서울%' GROUP BY 1, 2 + select 절에 있는 순서 숫자대로 그룹화 할 수있음 + 그룹화도 여러개 가능 ‘[..

TIL 2024.03.19

2024-03-18

1. 오늘 배운 것 엑셀보다 쉽고 빠른 SQL - 1주차 SQL : 데이터베이스와 대화를 하기 위한 언어 데이터베이스 : 데이터가 저장되어있는 큰 폴더 SELECT : 데이터를 가져오는 명령어 FROM : 데이터를 가져올 테이블을 특정해주는 문법 * : 모든 컬럼을 가져와준다 별명(alias)지정 AS 는 없어도 괜찮음 특수문자, 한글 : "별명" , 큰 따옴표 안에 적어줌 영문, 언더바 : 별명만 적음 WHERE : 원하는 데이터만 필터링 문자를 사용 할 때는 '' 작은 따옴표 같지않다(다르다) LIKE : 비슷한 조건인 모든 값 상품 준비시간이 20~30분 사이인, 한국음식점의 식당명과 고객번호 조회하기 테이블명 : food_orders 컬럼명 : restaurant_name (식당명) custome..

TIL 2024.03.18