목록데이터분석 (4)
듀랑이 공부 블로그

결측값 처리하기: COALESCE와 IFNULL 💡 NULL값이 들어있는 경우, 두 컬럼의 값으로 연산을 하고 싶다면 어떻게 해야할까? 예시 1: 결측치를 포함하는 컬럼으로 연산을 해야할 때 구매번호, 매출금액, 쿠폰금액의 정보를 담고 있는 테이블이 있다. 이 때, 순매출을 구하려면 매출금액에서 쿠폰금액을 빼야 한다. COUPON 컬럼의 null값을 처리해줄 때, COALESCE 함수를 쓸 수 있다. SELECT *, amount - coupon AS after_discount1, amount - COALESCE(coupon, 0) AS after_discount2 FROM purchase COALESCE(컬럼명, 대체값) 형태로 써서 연산을 진행해주었더니 아래와 같은 결과물이 나왔다. 그냥 연산을 하면..

프로그래머스 파이썬 Level 1. 두 개 뽑아서 더하기 💡 프로그래머스 파이썬 연습문제: 정수 배열 numbers가 주어집니다. numbers에서 서로 다른 인덱스에 있는 두 개의 수를 뽑아 더해서 만들 수 있는 모든 수를 배열에 오름차순으로 담아 return 하도록 solution 함수를 완성해주세요. 그러니까 문제는 그림에서 왼쪽에 있는 각 리스트 안의 숫자들을 두 개씩 조합해서 더한 오른쪽의 새로운 리스트를 중복없이 오름차순으로 변경하라는 것. 이 세 가지 조건을 꼭 반영해야 한다. 완성한 코드 from itertools import combinations def solution(numbers): answer = set() hap = list(combinations(numbers,2)) for i..

FOR문으로 URL 여러개 크롤링하기 💡 데린이의 파이썬 여정은 멀고도 험난하다... 이번 포스트는 복수의 URL에서 데이터를 가지고 오고 싶을 때, for 문을 사용해서 한 번에 해결하는 숙제를 하며 복습 + 새롭게 알게 된 내용이다. 이번 수업 숙제였는데, 내가 처음에 짠 코드와 숙제 리뷰를 통해 얻은 내용을 비교해보면서 정리할 예정이다. 목표 : 아래 URL 세 개에서 기사 제목과 언론사를 추출해 데이터프레임 만들기 크롤링에 필수인 라이브러리 BeautifulSoup을 불러온다. 마지막에 데이터프레임으로 담아줄거라서 pandas도 불러왔다. from bs4 import BeautifulSoup import requests import pandas as pd 첫 번째 코드 : 목으로 나는 비둘기 딱 ..
데이터프레임(DataFrame), 어떻게 만드는 건데? 💡 판다스 1도 모르는데, 강의에서 나오는 데이터프레임 만드는 방법이 너무 다양해서 뭐가 뭔지 모르겠다.... 라고 생각이 든다고? 네, 그게 바로 접니다... 갓조교님이 알려주신 내용을 바탕으로 내 마음대로 이해한 데이터프레임 만드는 방법 세 가지 정리 시-작! 1. 리스트/어레이 형태일 때 먼저 pandas랑 numpy를 불러와주고! import pandas as pd import numpy as np 여러 리스트 형식이 합쳐져 있는 리스트와 array 데이터를 데이터프레임으로 만드는 방법 이런 리스트 형태를 데이터프레임으로 만들 때는 아래 2번 딕셔너리 형태랑 다르게 컬럼이름들을 또 다른 리스트 형태로 적어줘야 한다. columns 이름을 정해..