전체 글 17

[A/B 테스트] A/B 테스트 설계, 처음이라면 이렇게해보세요!

안녕하시옵니까! 지난번에 A/B 테스트 용어 정리해봤으니 이번에는 A/B 테스트를 어떻게 설계하는지 아주아주 간단하고 어려운 내용 없이 흐름 리뷰하는 포스팅을 써보려고 합니다. ( 사실 저도 잘 모르긴 하는데, 이전 포스팅이랑 동일하게 이번에도 사내 교육자료들도 읽어보고, 구글링하고, 내 단짝 AI 친구들이랑 물어보면서 정리한거라, 틀린부분 있다면 댓글로 알려주셔용..ㅎㅎ) 실제 A/B 테스트를 수행하게 되는 직무에서 일을 하다 보면 실험 설계에 있어서 더 복잡한 제약조건들도 있고, 용어들을 많이 쓰다보니까 어려울 수 있는데, 우리 차근차근 같이 공부하면서 A/B 테스트에 대해 알아가보자구요..ㅎㅎ 먼저, 뭘 바꿀지 목표부터 딱 잡자A/B 테스트 시작하려면 제일 먼저 “뭐를 개선하고 싶은지” 명확히 ..

카테고리 없음 2025.08.24

공공 데이터 포털 api 활용하여 데이터 수집하기 (with 파이썬, colab, SSL 오류 수정 방법)

이번 포스팅에서는 공공데이터포털의 api를 활용해서 데이터를 가져오고, CSV 형태로 저장하는 과정을 소개해보겠다. 요즘 웬만한 코드는 모두 생성형 AI를 통해 작성할 수 있게 됐다. 따라서 데이터 분석을 하더라도 코딩보다는 어떤 데이터를 가지고 어떠한 과정으로 어떤 결론을 내는지가 더 중요하다. 이에 오늘은 데이터 분석의 출발점, 데이터 수집 중 한 가지 방법인 공공데이터포털 api 활용에 대해서 설명하려고 한다. 준비물은 약간의 파이썬 지식 정도면 충분하다. 그럼 바로 시작해 보자! 목차1. 홈페이지에서 api 요청하여 다운로드하기2. 파이썬 활용하여 전체 데이터 다운로드하기 파이썬 코드 바로가기 1. 공공 데이터 포털 홈페이지에서 api 요청하여 다운로드하기1. 공공데이터 포털에 접속 후 원하는 데..

카테고리 없음 2025.08.24

[A/B 테스트] 실무에서 많이쓰이는 A/B 테스트 용어 정리

최근에 운이 좋게 이커머스 관련 기업에서 근무를 시작하게 됐는데, 관련 자료들을 보다 보니까 내가 정말 A/B 테스트에 대해서 하나도 모르는구나를 깨달을 수 있었다. 자료들을 읽는데, 이게 분명히 한국어 같은데 전혀 이해가 안된다. 관련 분야에서 약어도 많이 쓰고 전문용어도 꽤있어서, 오늘은 A/B 테스트 할때 업계에서 많이 쓰는 약어/용어들을 한번 정리해보겠다. 내가 쓴 내용들을 따로 정리할 필요까진 없는 것 같고, 서너번 읽어보면 적당히 머리속에 들어올 것이라고 생각하니 이점 참고하도록!(또 한가지 더 덧붙이자면, 내용들은 내가 본 자료에서 확인한 용어/약어들의 정의 + 지피티한테 물어본거 + 구글링 결과라서 틀린 내용이 있을 수도 있다. 읽어보시다 수정이 필요한 부분이 있다면 댓글로 정정해주시면 무..

카테고리 없음 2025.08.17

SQL 코딩테스트 문제 풀이 (4) - 세션 재정의하기 (solvesql, CTE, LAG, ROW_NUMBER, JULIANDAY, 누적합, STRFTIME, 윈도우 함수)

📝목차1. SQL 코딩테스트 문제 소개 - 세션 재정의하기 (solvesql)2. 풀이 1 - LAG 윈도우 함수 사용, CHAT-GPT 활용3. 풀이 2 - ROW_NUMBER 윈도우 함수 사용, 혼자 풀기4. SQL 시간 변수 다루기 - JULIANDAY와 STRFTIME 정답 바로가기 SQL 코딩테스트 문제 풀이 네번째 시간이다.1. SQL 코딩테스트 문제 소개 - 세션 재정의하기 (solvesql)이번 문제는 solvesql 사이트> 데이터리안 SQL 캠프 실전반> 2페이지에서 접할 수 있다.난이도는 5로 윈도우 함수를 적절히 활용해야 하고, CTE도 여러 번 사용하기 때문에 복잡하고 어렵다.특히 LAG와 누적합을 사용하지 않고 풀으면 매우 복잡해진다.(내 얘기다...) 문제 바로가기https..

[SQL로 시작하는 데이터 분석] (3) - 시계열 분석 3

이전 글에서는 시계열 분석의 기초 개념과 함께, 날짜·시간 데이터 처리 및 주요 SQL 함수를 살펴보았다.이번 글에서는 Census.gov에서 제공하는 미국 월간 소매업·외식업 매출 데이터를 활용하여,실제로 트렌드 분석과 시계열 집계를 수행하는 방법을 예제와 함께 다뤄보겠다. 1. 간단한 트렌드 분석1) 월별 매출 추세 확인하기시계열 분석의 첫걸음은 시간 순으로 데이터를 나열하고 변화 패턴을 파악하는 것이다.다음 예시는 ‘Retail and food services sales, total’(전체 소매업 및 외식업 매출) 데이터를 월별로 조회하는 쿼리이다. SELECT sales_month, salesFROM retail_salesWHERE kind_of_business = 'Retail and..

SQL 책 리뷰 2025.08.08

[SQL로 시작하는 데이터 분석] (3) - 시계열 분석 2

이전 포스팅에서는 시계열 분석의 기초 개념과 함께, 날짜·시간 데이터의 처리와 시간대 변환, 주요 SQL 함수들을 중심으로 정리해보았다. 이번 글에서는 본격적으로 날짜 계산, 시간 간격(interval) 활용, 그리고 서로 다른 날짜 데이터를 결합하는 방법 등 실전에서 자주 마주하게 될 시계열 데이터 조작 기법들을 다뤄보겠다. 단순히 날짜를 더하고 빼는 것을 넘어서, 어떻게 하면 분석 목적에 맞게 정확한 시간 데이터를 구성할 수 있을지 하나씩 예제를 통해 살펴보자! 1. 날짜 계산시계열 분석에서 날짜 간 차이를 계산하거나 날짜를 더하고 빼는 연산은 매우 기본적이면서도 자주 사용되는 작업이다. 이번 섹션에서는 날짜 계산에 유용한 SQL 문법들을 소개한다!! (1) 📆 두 날짜 간의 차이 (Interv..

SQL 책 리뷰 2025.08.05

[BDA WAVE] 네이버 서비스 기획(PM) 직무 현직자 강연 후기

지난 5월 30일 전국 대학생 연합 빅데이터 학회인 BDA에서 주관하는 강연인 BDA WAVE에 다녀왔어요! 제목: 비전공자를 위한 데이터 기반 서비스 기획 사례 및 실무 네이버 클라우드의 PM(서비스 기획)으로 근무하고 계신 연사님께서 실무 사례 위주로 많이 얘기해 주셔서 매우 유익한 시간이었습니다. 그럼 강연 내용과 후기를 작성해 볼게요~!*직접 필기한 내용으로 정리하는 거라 약간의 오류가 있을 수 있습니다. 1. 서비스 기획이란?2. 실제 사례 1 - NAVER WORKS3. 실제 사례 2 - ONA(조직 네트워크 분석)4. 서비스 기획자가 되려면...5. Q&A1. 서비스 기획이란?앱 제작에서 서비스 기획이란 전략 기획의 한 부분이다.제품의 하위개념인 서비스에 대한 기획 (제품> 서비스> 기능)전..

[프로그래머스/SQL] 조건에 부합하는 중고거래 댓글 조회하기

📍문제 : 조건에 부합하는 중고거래 댓글 조회하기 (Lv.1)https://school.programmers.co.kr/learn/courses/30/lessons/164673 프로그래머스SW개발자를 위한 평가, 교육의 Total Solution을 제공하는 개발자 성장을 위한 베이스캠프programmers.co.kr [문제 설명]다음은 중고거래 게시판 정보를 담은 USED_GOODS_BOARD 테이블과 중고거래 게시판 첨부파일 정보를 담은 USED_GOODS_REPLY 테이블입니다. USED_GOODS_BOARD 테이블은 다음과 같으며BOARD_ID, WRITER_ID, TITLE, CONTENTS, PRICE, CREATED_DATE, STATUS, VIEWS은 게시글 ID, 작성자 ID, 게시글 ..

SQL 코딩테스트 문제 풀이(3) - 레스토랑 요일 별 구매금액 Top 3 영수증(solvesql, RANK(), DENSE_RANK(), UNION, JOIN, 윈도우 함수)

📝목차1. SQL 코딩테스트 문제 소개 - 레스토랑 요일 별 구매금액 Top 3 영수증(solvesql)2. 풀이 1 - 요일별 추출 후 UNION3. 풀이 2 - DENSE_RANK(), CHAT-GPT 활용4. SQL 문법 설명 - RANK와 DENSE_RANK() 정답 바로가기 SQL 코딩테스트 문제 풀이 세 번째 시간이다.1. SQL 코딩테스트 문제 소개 - 레스토랑 요일 별 구매금액 Top 3 영수증(solvesql)이번 문제는 solvesql 사이트> 데이터리안 SQL 캠프 실전반> 2페이지에서 접할 수 있다.난이도는 4로 조금 어려운 정도인데, 사실 DENSE_RANK()에 대해 알고 있다면 그렇게 어렵지 않을 수 있다.하지만 나는 DENSE_RANK()를 몰랐기 때문에 기본 문법을 통해..

[SQL로 시작하는 데이터 분석] (3) - 시계열 분석

이제부터 본격적으로 데이터분석을 시작해 볼 것이다 ! 이번 주차는 시계열 분석으로 진행해보겠다. 내용이 많아서 아마 포스팅을 두개로 나눌 듯 싶다. 먼저, 시계열 분석이란?➡️ 시계열이란 시간 순으로 재정렬된 데이터의 배열을 뜻한다. 시계열 분석이란 시간의 흐름에 따라 수집된 시계열 데이터를 분석하여 그 안에 숨겨진 패턴, 트렌드, 계절성, 순환성 등을 파악하고 미래 값을 예측하거나 의사결정을 내리는 기법이다. 1. 시계열 데이터의 날짜 및 시간 데이터 조작 일반적인 분석이라면 단순히 특정 이벤트 이후로 며칠 혹은 몇 개월이 지났는지 계산하겠지만, 시계열 분석에서는 시간에 따른 트렌드를 분석하는 것이 주 목적이다. 이번 포스팅에서는 인터벌 개념을 이용한 날짜 계산과 시간조작 방법에 대해 ..

SQL 책 리뷰 2025.07.30