
안녕하세요, 여러분! 오늘은 파이썬을 이용하여 시계열 데이터 분석을 해보려고 합니다. 이번 포스트에서는 TSLA(Tesla Inc.) 주가 데이터를 활용하여 교차 상관 관계를 분석해 보도록 하겠습니다. 먼저, 필요한 데이터를 불러오는 과정을 살펴보겠습니다. df = pd.read_csv('dataset/TSLA.csv') df['Date'] = pd.to_datetime(df['Date']) df = df[['Date', 'Close']] print(df.head()) 이 코드에서는 pandas 라이브러리를 사용하여 TSLA 주가 데이터를 CSV 파일에서 읽어옵니다. 이후 날짜를 Datetime 형식으로 변환하고, Date와 Close(종가) 열만 남기도록 전처리를 진행합니다. 그리고 df.head()를..
방법 1: 주피터 노트북에서 모든 셀을 하나로 합치기 원하는 ipynb 파일을 엽니다. 첫 번째 코드 셀로 이동한 다음, Shift를 누른 채로 다른 모든 코드 셀을 클릭하여 선택합니다. Shift + M을 눌러 선택한 모든 셀을 하나로 합칩니다. 방법 2: 주피터 노트북을 Python 파일로 변환하기 주피터 노트북에서 ipynb 파일을 엽니다. 상단 메뉴에서 File > Download as > Python (.py)를 선택합니다. 이렇게 하면 주피터 노트북의 모든 코드 셀이 하나의 Python 파일로 변환되어 다운로드됩니다. 주석으로 처리된 마크다운 셀도 포함됩니다. 방법 3: 커맨드라인을 사용하여 주피터 노트북을 Python 파일로 변환하기 커맨드라인이나 터미널을 엽니다. 다음 명령어를 실행하여 주..

import pandas as pd goog = pd.read_csv('../data/GOOG.csv') goog['Date'] = pd.to_datetime(goog['Date']) goog.set_index('Date', inplace=True) goog = goog[['Open', 'High', 'Low', 'Close', 'Volume']] # index 컬럼인 Date는 필요x import mplfinance as mpf goog['20_MA'] = goog['Close'].rolling(window=20).mean() goog['50_MA'] = goog['Close'].rolling(window=50).mean() ap_mav = [mpf.make_addplot(goog['20_MA']), ..

안녕하세요, 여러분! 주식 투자와 데이터 분석에 관심이 많으신 분들이라면, 캔들스틱 차트에 대해 들어보셨을 것입니다. 캔들스틱 차트는 주가의 시가, 고가, 저가, 종가를 한눈에 볼 수 있어서 시장의 움직임을 쉽게 파악할 수 있습니다. 이번 글에서는 파이썬 코드를 이용하여 구글(GOOG) 주식의 캔들스틱 차트를 그리는 방법을 알아보겠습니다. 이 글을 통해, 코드와 함께 설명을 자세하게 들여다볼 수 있습니다. 준비물 먼저, 다음 라이브러리들을 설치해야 합니다. pip install pandas pip install matplotlib pip install mplfinance 데이터 불러오기 주가 데이터를 불러오기 위해 pandas 라이브러리를 사용하겠습니다. 아래 코드를 실행하여 CSV 파일을 불러오고, 데..

marker 매개변수를 사용하여 동그라미(o), 사각형(s), 세모(^)를 지정할 수 있습니다. import matplotlib.pyplot as plt import numpy as np # 데이터 생성 x = np.random.randn(100) y = np.random.randn(100) # 산점도 그리기 plt.scatter(x, y, marker='o') # 동그라미 plt.scatter(x, y+1, marker='s') # 사각형 plt.scatter(x, y+2, marker='^') # 세모 # 그래프 보여주기 plt.show()

본 예제는 Python 언어와 Scikit-learn 라이브러리를 이용하여 iris 데이터를 scatter plot으로 시각화하는 방법을 다루고 있습니다 1. 필요한 라이브러리 설치 및 불러오기 !pip install scikit-learn matplotlib import matplotlib.pyplot as plt from sklearn.datasets import load_iris 2. 데이터 불러오기 Scikit-learn에서 제공하는 iris 데이터를 불러옵니다. iris = load_iris() X, y = iris.data, iris.target 3. 데이터 시각화 불러온 iris 데이터를 scatter plot으로 시각화합니다. plt.scatter(X[:, 0], X[:, 1], c=y, ..

안녕하세요! 오늘은 로지스틱 회귀를 사용한 이진 분류 모델 학습과 평가에 대해 알아보겠습니다. 로지스틱 회귀는 분류 문제에 사용되는 간단하면서도 효과적인 기법입니다. 이 포스트에서는 scikit-learn 라이브러리를 사용하여 로지스틱 회귀 모델을 학습하고, 혼동 행렬(confusion matrix)을 시각화하여 모델의 성능을 평가하는 방법을 소개합니다. 먼저 필요한 라이브러리를 가져옵니다. from sklearn.datasets import make_classification from sklearn.linear_model import LogisticRegression from sklearn.metrics import plot_confusion_matrix from sklearn.model_selecti..

위 코드에서는 matplotlib 모듈의 plot() 함수를 사용하여 시간에 따른 주가 데이터를 그래프로 표현하였습니다. 결과는 다음과 같습니다. 주가가 무작위로 변동하는 것을 확인할 수 있습니다. GBM 모형은 실제 주가와 비슷한 성질을 가지므로, 자산 가격의 변동성을 모델링하고 포트폴리오 최적화, 옵션 가격 계산 등의 분석에 유용하게 사용됩니다. Geometric Brownian Motion(GBM) 모형은 확률과 통계학에서 주로 이용되며, 자산 가격을 모델링할 때 널리 사용됩니다. 이번 예제에서는 GBM 모형을 사용하여 주가 데이터를 생성하고, 이를 시각화하는 과정을 살펴보겠습니다. GBM 모형 GBM 모형은 브라운 운동(Brownian Motion)이라는 개념에서 파생되었습니다. 브라운 운동은 입..

MeanShift 클러스터링 알고리즘은 scikit-learn에서 제공되는 비지도 학습 알고리즘 중 하나로, 클러스터의 중심을 식별하고 데이터 포인트를 중심 주변의 밀도가 높은 영역에 그룹화하려고 시도합니다. 이 알고리즘은 데이터의 확률 밀도 함수를 추정하고, 클러스터의 중심을 고밀도 영역으로 반복적으로 이동시킴으로써 작동합니다. 이 예제에서는 MeanShift 알고리즘을 사용하여 합성 데이터셋을 클러스터링하는 방법을 살펴보겠습니다. 우선 필요한 라이브러리를 가져옵니다. import numpy as np import matplotlib.pyplot as plt from sklearn.cluster import MeanShift, estimate_bandwidth from sklearn.datasets i..

이번 예제에서는 scikit-learn의 Gaussian Mixture Model (GMM)을 사용하여 iris 데이터셋을 군집화하는 방법을 살펴보겠습니다. Gaussian Mixture Model은 데이터가 여러 개의 가우시안 분포에서 생성되었다고 가정하는 모델로, 데이터를 여러 개의 클러스터로 분리할 수 있습니다. 우선, 필요한 라이브러리를 가져옵니다. import numpy as np import matplotlib.pyplot as plt from sklearn import datasets from sklearn.mixture import GaussianMixture 다음으로, iris 데이터셋을 로드합니다. iris = datasets.load_iris() X = iris.data Gaussia..

안녕하세요! 오늘은 선형 회귀를 사용하여 시계열 데이터를 예측하는 간단한 예제를 살펴보겠습니다. 이 예제에서는 구글(GOOG)의 주가 데이터를 사용하여 미래 주가를 예측해 볼 것입니다. 그런 다음 예측 결과의 한계점을 살펴보고 더 나은 방식을 제시하겠습니다. 먼저 필요한 라이브러리를 가져옵니다. import numpy as np import matplotlib.pyplot as plt import pandas as pd from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split from sklearn.metrics import r2_score, mean_squared_error 구..

안녕하세요! 오늘 시계열 데이터 분석에 대한 간단한 파이썬 코드 예제를 소개합니다. 이 예제에서는 구글(GOOG)의 주가 데이터를 사용하여 자동 상관 그래프를 그리고, 계절성 분해를 통해 시계열 데이터를 분석할 것입니다. 먼저 필요한 라이브러리를 가져옵니다. import pandas as pd import matplotlib.pyplot as plt from pandas.plotting import autocorrelation_plot 그런 다음 구글의 주가 데이터를 읽어옵니다. data = pd.read_csv('../data/GOOG.csv', index_col='Date', parse_dates=True) series = data['Close'] 자동 상관 그래프를 그리기 위해 다음 코드를 사용합니..