오늘 내용 진짜 없음...
001
오늘의 코드카타
42. 크기가 작은 부분문자열
문제 설명
숫자로 이루어진 문자열 t와 p가 주어질 때, t에서 p와 길이가 같은 부분문자열 중에서, 이 부분문자열이 나타내는 수가 p가 나타내는 수보다 작거나 같은 것이 나오는 횟수를 return하는 함수 solution을 완성하세요.
예를 들어, t="3141592"이고 p="271" 인 경우, t의 길이가 3인 부분 문자열은 314, 141, 415, 159, 592입니다. 이 문자열이 나타내는 수 중 271보다 작거나 같은 수는 141, 159 2개 입니다.
제한사항
- 1 ≤ p의 길이 ≤ 18
- p의 길이 ≤ t의 길이 ≤ 10,000
- t와 p는 숫자로만 이루어진 문자열이며, 0으로 시작하지 않습니다.
더보기
def solution(t, p):
answer = 0
n = len(t)
m = len(p)
for i in range(n-m+1):
if int(t[i:i+m]) <= int(p):
answer += 1
return answer
002
오늘 학습한 내용
1. 예측모델링 프로세스
1) 흐름
- 데이터 수집 → EDA → (전처리) → 모델링 → 평가
2) 데이터 수집 단계
- Data Source 종류: OLTP(실시간 트랜잭션 처리), Enterprise Application(회사 내부 데이터), Third-Party(구글 애널리틱스 같은 외부 소스), Web/Log(사용자 로그)
- 회사 데이터가 없으면 CSV/엑셀 다운로드, API, 크롤링으로 직접 수집
2. 탐색적 데이터 분석 (EDA)
1) EDA란
- 시각화, 기술통계로 데이터를 이해하고 탐구하는 과정
- 데이터 자체에 대한 정보뿐 아니라 "어떤 모델링이 적합할지" 힌트도 여기서 얻을 수 있음!! → 예측 모델링이 아니어도 데이터 분석에선 필수 과정
2) 기술통계로 EDA
- describe()로 기본 통계량 확인 (include='all' 옵션 주면 범주형 데이터도 같이 볼 수 있음)
3) 시각화 plot 정리
시각화는과제도 해보고 프로젝트도 해봐서 이미 아는 내용이지만 한번 더 정리해봄
- countplot: 범주형 데이터 카테고리별 빈도수 (x: 범주형, y: 빈도) (예: 제품 카테고리별 판매수)
- barplot: 범주형 카테고리별 수치 데이터 평균 비교 (x: 범주형, y: 연속형) (예: 연령대별 평균소득)
- boxplot: 분포, 중앙값, 사분위수, 이상치를 한눈에 (x: 수치형 또는 범주형, y: 수치형) (예: 그룹별 시험점수 분포 비교)
- histogram: 연속형 데이터의 분포, 몰려있는 구간 파악 (x: 수치형, y: 빈도) (예: 고객 연령 분포)
- scatterplot: 두 연속형 변수 간 관계 파악 (x, y 둘 다 수치형) (예: 키와 몸무게 관계)
- pairplot: 여러 변수를 한 번에 다 시각화, 대각선엔 히스토그램(분포) 들어감
→ 그래프 종류별로 "범주형이냐 수치형이냐"에 따라 골라 쓰면 됨
오늘은 개인적인 공부를 하는데 시간을 좀 써서... 실습한 거랑 라이브세션 복습한 내용은 정리할 시간이 없었따

더보기
부캠 경험자이신 매니저님께서, 지금이 부캠하면서 제일 힘든 시기라고 하셨는데 맞는 거 같다...
초반엔 그냥 주어진 공부 해야하는 일들 정신없이 막 하느라 별 생각이 없었는데 지금은 이 생활에 익숙해져서 그런가 전보다 해이해진 것 같고... 공부하는 내용도 어려워져서 의욕도 떨어지고......
에효 모르겠다 다음주부터 다시 갓생 ㄱㄱ
'Today I Learned' 카테고리의 다른 글
| [내일배움캠프 QA/QC 6기] TIL #032 (0) | 2026.06.25 |
|---|---|
| [내일배움캠프 QA/QC 6기] TIL #031 (0) | 2026.06.24 |
| [내일배움캠프 QA/QC 6기] TIL #030 (0) | 2026.06.23 |
| [내일배움캠프 QA/QC 6기] TIL #029 (0) | 2026.06.22 |
| [내일배움캠프 QA/QC 6기] TIL #028 (0) | 2026.06.19 |