Today I Learned

[내일배움캠프 QA/QC 6기] TIL #033

JiJi0406 2026. 6. 26. 21:07

오늘 내용 진짜 없음...

 

001

오늘의 코드카타

42. 크기가 작은 부분문자열

 

 


문제 설명

숫자로 이루어진 문자열 t와 p가 주어질 때, t에서 p와 길이가 같은 부분문자열 중에서, 이 부분문자열이 나타내는 수가 p가 나타내는 수보다 작거나 같은 것이 나오는 횟수를 return하는 함수 solution을 완성하세요.

예를 들어, t="3141592"이고 p="271" 인 경우, t의 길이가 3인 부분 문자열은 314, 141, 415, 159, 592입니다. 이 문자열이 나타내는 수 중 271보다 작거나 같은 수는 141, 159 2개 입니다.

 

 

제한사항

  • 1 ≤ p의 길이 ≤ 18
  • p의 길이 ≤ t의 길이 ≤ 10,000
  • t와 p는 숫자로만 이루어진 문자열이며, 0으로 시작하지 않습니다.

 

더보기
def solution(t, p):
    answer = 0
    n = len(t)
    m = len(p)
    for i in range(n-m+1):
        if int(t[i:i+m]) <= int(p):
            answer += 1        
    return answer

 

 


 

 

002

오늘 학습한 내용

 

 

1. 예측모델링 프로세스

1) 흐름

  • 데이터 수집 → EDA → (전처리) → 모델링 → 평가

2) 데이터 수집 단계 

  • Data Source 종류: OLTP(실시간 트랜잭션 처리), Enterprise Application(회사 내부 데이터), Third-Party(구글 애널리틱스 같은 외부 소스), Web/Log(사용자 로그)
  • 회사 데이터가 없으면 CSV/엑셀 다운로드, API, 크롤링으로 직접 수집

 

2. 탐색적 데이터 분석 (EDA)

1) EDA란

  • 시각화, 기술통계로 데이터를 이해하고 탐구하는 과정
  • 데이터 자체에 대한 정보뿐 아니라 "어떤 모델링이 적합할지" 힌트도 여기서 얻을 수 있음!! → 예측 모델링이 아니어도 데이터 분석에선 필수 과정

2) 기술통계로 EDA

  • describe()로 기본 통계량 확인 (include='all' 옵션 주면 범주형 데이터도 같이 볼 수 있음)

3) 시각화 plot 정리 

시각화는과제도 해보고 프로젝트도 해봐서 이미 아는 내용이지만 한번 더 정리해봄

  • countplot: 범주형 데이터 카테고리별 빈도수 (x: 범주형, y: 빈도) (예: 제품 카테고리별 판매수)
  • barplot: 범주형 카테고리별 수치 데이터 평균 비교 (x: 범주형, y: 연속형) (예: 연령대별 평균소득)
  • boxplot: 분포, 중앙값, 사분위수, 이상치를 한눈에 (x: 수치형 또는 범주형, y: 수치형) (예: 그룹별 시험점수 분포 비교)
  • histogram: 연속형 데이터의 분포, 몰려있는 구간 파악 (x: 수치형, y: 빈도) (예: 고객 연령 분포)
  • scatterplot: 두 연속형 변수 간 관계 파악 (x, y 둘 다 수치형) (예: 키와 몸무게 관계)
  • pairplot: 여러 변수를 한 번에 다 시각화, 대각선엔 히스토그램(분포) 들어감

→ 그래프 종류별로 "범주형이냐 수치형이냐"에 따라 골라 쓰면 됨

 

 

 

 

오늘은 개인적인 공부를 하는데 시간을 좀 써서... 실습한 거랑 라이브세션 복습한 내용은 정리할 시간이 없었따

 

 

더보기

부캠 경험자이신 매니저님께서, 지금이 부캠하면서 제일 힘든 시기라고 하셨는데 맞는 거 같다...

초반엔 그냥 주어진 공부 해야하는 일들 정신없이 막 하느라 별 생각이 없었는데 지금은 이 생활에 익숙해져서 그런가 전보다 해이해진 것 같고... 공부하는 내용도 어려워져서 의욕도 떨어지고......

에효 모르겠다 다음주부터 다시 갓생 ㄱㄱ