본문 바로가기

분류

(30)
DBMS / ORM 시작 오전 - JOIN SQLLITE 서버가 없어도 잘 작동하도록 만듦. DATA TYPE - NULL - INTEGER - REAL - TEXT - BLOB server PYHTON DBMS - DB Client ---> connection cursor---> 작업공간 con - cur con = sqlite3.connect('경로 file path를 적어줘도 되고, in-memory상태에서 작업 가능') cur=con.cursor() con.close() # 작업이 끝나면 db닫기 dir(cur) cur.execute('SQL문 1개') cur.executemany('SQL문이 1개가 반복 실행됨') cur.executescript('SQL문 여러개 한 번에 실행') #비표준 방법 ppt 속 예제 만들어보..
파이썬의 naming, expression a = 2 파이썬에서 a = 2 를 정의할 때, a를 변수라고 하면 50점짜리 점수! (이건 프로그래밍 관점) a는 name 또는 identify 라고 부르는게 정답! 그럼 = 기준 오른쪽은 expression(하나의 결과값으로 축약할 수 있는 것)이라고 부른다. = 은 binding 이라고 부른다. a=2라고 지정하면, 이때 2는 int 타입으로 저장된다. 즉, 사용자가 굳이 명확하게 지정하지 않아도 type을 결정한다. 내부적으로 메모리 공간을 할당. naming literal :expression에 붙이는 특수 기호 integer . 이 있으면 float j가 있으면 complex (허수) 파이썬의 naming (PEP8 참고) - 예약어로는 이름을 못 만든다. 밑의 식으로 확인 가능 import ..
loc(), iloc() # 데이터 불러오기 import pandas as pd uriage_data=pd.read_csv("C:/Users/chois/파이썬 기초/파이썬 분석 예제/2장/uriage.csv") uriage_data.head() ↓ 상품명 오류를 없앤 후의 데이터 # 데이터에 결측값 확인하기 uriage_data.isnull().any(axis=0) isnull() 을 통해서 결측치 확인 가능! any() 함수는 괄호 안의 경우가 어느 하나라고 참이면 True를 반환하고 그렇지 않으면 False를 반환한다. 괄호 안의 경우가 단일의 경우만을 의미하는 경우에는 error가 나오므로, 괄호 안의 경우를 복수의 경우로 만들어주어야 한다. *리스트 컴프리헨션처럼 for문을 이용하여 해당 경우를 순환시킬 수 있다. * a..
matplotlib() matplotlib를 사용해서 그래프를 만들어보자. import matplotlib.pyplot as plt plt.plot([100,20,30,40]) plt.show() #matplotlib.pyplot 모듈의 show() 함수는 그래프를 나타내도록 함. (없어도 그래프가 나오긴 한다.) 위 문장에서처럼 리스트가 한 개인 경우, 리스트 [10,20,30,40]은 y값으로 인식된다. x값은 자동으로 [0,1,2,3]을 만들어낸다. 다음으로는 리스트가 2개인 경우를 알아보자. plt.plot([x값(들)], [y값(들)], x, y 값 인자에 대해 선의 색상과 형태를 지정하는 포맷 문자열 (Format string)) plt.plot([1, 2, 3, 4], [1, 4, 9, 16], 'ro') plt...
groupby(), groups.func() describe()을 사용하여 join_data 테이블의 각종 통계량들을 먼저 확인해보자. 그림에서 확인할 수 있다시피, 가장 비싼 가격과 가장 저렴한 가격, 분위수 그리고 나이대 평균 등 다양한 정보들을 확인해볼 수 있다. quantity를 확인해보면, 가장 큰 수가 4이고 75%가 1이기 때문에 대부분의 고객이 PC 한 대를 구입한다는 것을 알 수 있습니다. df.groupby("column name") 위와 같은 데이터가 있다고 가정할 때, 월별 (payment_month)별로 매출(price)을 집계하고자 할 때 groupby()를 사용한다. join_data.groupby("payment_month").sum()["price"] 라는 문장을 사용하자 이는 join_data를 월별로 그룹 지어서 ..
데이터 프레임 합치기 concat(), merge(), join pd. concat() : 데이터 프레임 붙이기 # R의 rbind(), cbind()와 유사함 [디폴트 설정 보기 ] pd.concat ( objs, axis=0, # 0 : 위아래로 합치기, 1 : 왼쪽 오른쪽 합치기 join = 'outer', # 'inner' : , 'outer' : ignore_index=False, # False : 기존의 인덱스 유지, True : 기존의 인덱스 무시 keys=None, #계층적 index 사용하려면 keys 튜플 입력 levels = None, #수준 names = None, # index에 이름을 부여하려면 names 튜플 입력 verify_integrity = False, #중복 copy=True, #복사 ) 데이터 개수로 결합 확인하기 세로로 결합되기..