본문 바로가기

Python

(16)
Teachable Machine으로 학습한 모델을 Streamlit 서버에 배포하기 Teachable Machine을 사용하여 강아지 표정을 학습시키고, 모델을 불러와 스트림릿 서버에 배포하는 과정을 블로그로 작성하는 방법을 설명해드리겠습니다.1. Teachable Machine 강아지 표정 학습하기Google의 Teachable Machine 웹사이트에 접속합니다.2. "이미지 프로젝트" 옵션을 선택 후 표준 이미지 모델로 학습하겠습니다.    3. 강아지 표정에 대한 데이터를 준비합니다. (예: 행복, 슬픔, 화남, 평온)  학습용 8 테스트용 2 비율로 데이터를 나눴습니다.데이터셋은 kaggle 사이트의 Dog Emotion 데이터셋을 사용하였습니다.(출처 : https://www.kaggle.com/datasets/danielshanbalico/dog-emotion) 4. 각 클..
Python에서 Jupyter Notebook을 통해 머신러닝하기 : Clustering편 K-평균 군집화(K-means Clustering)를 이용한 비지도 학습 구현K-평균 군집화는 데이터를 K개의 군집으로 나누는 비지도 학습 알고리즘입니다. 이 알고리즘은 각 군집의 중심을 기준으로 데이터 포인트들을 가장 가까운 군집에 할당하는 방식으로 작동합니다. 이번 포스트에서는 scikit-learn 라이브러리를 사용하여 K-means를 구현하고, 아이리스(Iris) 데이터셋에 적용해보겠습니다. 1. 필요한 라이브러리 임포트먼저 필요한 라이브러리들을 임포트합니다.  2. 데이터 준비아이리스 데이터셋을 로드하고 특성(X)과 타겟(y)으로 분리합니다.  3-1. 데이터 전처리인코딩 (Encoding)필요 여부: 불필요이유: 아이리스 데이터셋의 특성은 이미 숫자형 데이터입니다. 타겟 변수는 이미 숫자로 인..
Python에서 Jupyter Notebook을 통해 머신러닝하기 : Classfication편 K-최근접 이웃(K-NN) 알고리즘을 이용한 머신러닝 구현K-최근접 이웃(K-Nearest Neighbors, K-NN) 알고리즘은 분류와 회귀에 모두 사용될 수 있는 간단하면서도 효과적인 머신러닝 알고리즘입니다. 이 알고리즘은 새로운 데이터 포인트의 클래스나 값을 예측할 때, 주변의 K개의 가장 가까운 이웃들의 정보를 활용합니다. 이번 포스트에서는 scikit-learn 라이브러리를 사용하여 K-NN을 구현하는 방법을 단계별로 알아보겠습니다.1. 필요한 라이브러리 임포트먼저 필요한 라이브러리들을 임포트합니다.  2. 데이터 준비아이리스 데이터셋을 로드하고 특성(X)과 타겟(y)으로 분리합니다.이 데이터프레임은 아이리스 꽃의 특성(sepal length, sepal width, petal length, ..
Python에서 Jupyter Notebook을 통해 머신러닝하기 : Regression편 Linear Regression은 머신러닝의 기본적인 알고리즘 중 하나로, 데이터의 선형 관계를 모델링하는 데 사용됩니다. 이번 포스트에서는 scikit-learn 라이브러리를 사용하여 Linear Regression을 구현하는 방법을 단계별로 알아보겠습니다.  1. 필요한 라이브러리 임포트먼저 필요한 라이브러리들을 임포트합니다.  2. 데이터 준비 예제 데이터를 생성하거나 실제 데이터셋을 로드합니다. 여기서는 간단한 예제 데이터를 생성해보겠습니다. 3. 데이터 전처리 1. NaN값 처리  - 현재 데이터에는 NaN 값이 없지만 NaN값인 데이터가 존재할 경우 dropna() 혹은 fillna()로 NaN값 처리를 해줘야 합니다. 2. X와 y값으로 분리 - X는 예측에 필요한 값, y는 예측해야하는 값..
Python 데이터 분석 1. 소개파이썬은 데이터 분석을 위한 도구로 널리 사용되고 있습니다. 다양한 라이브러리와 풍부한 기능을 제공하여 데이터 처리, 시각화, 통계 분석 등을 효과적으로 수행할 수 있습니다. 이 글에서는 파이썬을 이용한 주요 데이터 분석 기법과 관련 라이브러리에 대해 알아보겠습니다. 2. 데이터 시각화: Matplotlib 및 Seaborn 데이터 시각화는 분석 결과를 효과적으로 전달하는 데 중요한 역할을 합니다. Matplotlib은 기본적인 그래프 작성을 위한 라이브러리이며, Seaborn은 통계적 데이터 시각화에 특화되어 있습니다. 특징:다양한 차트 및 그래프 유형 지원사용자 정의 가능한 스타일과 색상통계 모델의 시각화 기능 (Seaborn)3. 통계 분석: SciPy 및 StatsmodelsSciPy와 ..
Python 라이브러리 설명 : pandas 편 1. 소개Pandas는 파이썬에서 데이터 분석과 조작을 위한 오픈소스 라이브러리입니다. 데이터를 구조화하고 처리하는 데 필요한 다양한 도구와 함수를 제공하여, 데이터 과학자와 분석가들에게 필수적인 도구로 자리잡았습니다. 2.  Pandas의 주요 데이터 구조 Pandas는 두 가지 주요 데이터 구조를 제공합니다.Series: 1차원 레이블된 배열DataFrame: 2차원 레이블된 데이터 구조 3. 데이터 불러오기와 저장하기 Pandas는 다양한 형식의 데이터를 쉽게 불러오고 저장할 수 있습니다.    4. 이터 조작 Pandas는 데이터 조작을 위한 다양한 메서드를 제공합니다.   5. 결측치(NaN) 처리Pandas는 결측치를 쉽게 처리할 수 있는 기능을 제공합니다.   결론Pandas는 데이터 분석 ..
Python 라이브러리 설명 : numpy 편 1. 소개NumPy(Numerical Python)는 파이썬의 과학 컴퓨팅을 위한 핵심 라이브러리입니다. 대규모 다차원 배열과 행렬을 효율적으로 처리할 수 있는 도구를 제공하며, 이를 위한 다양한 고급 수학 함수들을 포함하고 있습니다. 2. NumPy의 주요 특징  특징:다차원 배열 객체(ndarray)브로드캐스팅 기능반복문 없이 배열 처리 가능선형 대수, 푸리에 변환, 난수 생성 등 다양한 수학 연산 지원C/C++로 구현되어 빠른 실행 속도3. NumPy 배열 생성 NumPy의 기본 데이터 구조인 ndarray를 생성하는 여러 방법이 있습니다.  4. NumPy 배열 연산 NumPy 배열은 요소별 연산을 지원하여 빠른 계산이 가능합니다.  5. NumPy의 수학 함수 NumPy는 다양한 수학 함수를 제..
Python에서 사용하는 조건문 알아보기 1. 소개파이썬에서 조건문은 프로그램의 흐름을 제어하는 중요한 구조입니다. 조건문을 통해 특정 조건에 따라 다른 코드를 실행할 수 있습니다. 이 글에서는 파이썬의 주요 조건문인 if, elif, else에 대해 알아보겠습니다. 2.  if 문if 문은 가장 기본적인 조건문으로, 주어진 조건이 참일 때 코드 블록을 실행합니다. 특징:조건이 True일 때만 코드 블록 실행조건은 비교 연산자나 논리 연산자를 사용하여 표현들여쓰기로 코드 블록을 구분3. else 문else 문은 if 문의 조건이 거짓일 때 실행될 코드 블록을 정의합니다. 특징:if 문과 함께 사용if 조건이 거짓일 때 실행됨선택적으로 사용 가능 4. elif 문elif 문은 여러 조건을 순차적으로 검사할 때 사용됩니다. 특징:여러 조건을 순차적..