IT

IT/데이터 사이언스

[Pandas] 데이터프레임의 생성

파이썬의 Pandas 라이브러리는 데이터 분석과 조작을 위해 사용됩니다. 그 핵심 구성 요소 중 하나가 데이터프레임(DataFrame)입니다. 데이터프레임은 테이블 형태의 데이터 구조로, 각 열이 서로 다른 종류의 데이터 타입(문자열, 숫자, 불리언 등)을 가질 수 있습니다. 1. 데이터프레임의 특징 다양한 데이터 타입 지원 한 열 내의 데이터는 동일한 데이터 타입을 지원하지만, 다른 열과는 다를 수 있습니다. 크기 변이 가능 데이터프레임의 크기는 필요에 따라 쉽게 변경할 수 있으며, 데이터를 삽입하거나 삭제함으로써 열과 행을 동적으로 조절할 수 있습니다. 데이터 조작 및 분석 도구 데이터프레임은 데이터 조작(정렬, 필터링, 그룹화 등)과 분석을 위한 다양한 기능을 제공합니다. 레이블을 가진 축 행과 열..

IT/Python

[파이썬] NumPy 기술 통계

NumPy는 데이터 분석 시 기초적인 통게 분석을 위한 다양한 함수를 제공합니다. 이러한 통계 함수들을 사용하여 데이터의 분포, 중심 경향, 변동성 등을 파악할 수 있습니다. 기술 통계 관련 함수 데이터의 개수(count) 평균(mean, average) 분산(variance) 표준 편차(standard deviation) 최댓값(maximum) 최솟값(minimum) 중앙값(median) 사분위수(quartile) 주요 기술 통계량을 계산하는 방법에 대하여 에제 코드와 함께 확인하겠습니다. import numpy as np # 임의의 데이터 생성 data = np.random.randn(1000) # 표준 정규 분포를 따르는 1000개의 데이터 1. 데이터의 개수 (Count) 데이터의 개수는 배열의 ..

IT/Python

[파이썬] 넘파이(NumPy)

NumPy는 파이썬에서 과학 연산을 위한 가장 기본적인 라이브러리입니다. 다차원 배열과 행렬 연산에 필요한 다양한 함수와 메소드를 제공합니다. NumPy의 기본 데이터 구조는 'ndarray'로, 동일한 타입의 요소들을 포함하는 n차원 배열입니다. 1. NumPy 기본 사용법 1.1. NumPy 설치 NumPy를 사용하기 전, 라이브러리를 설치해야 합니다. 일반적으로 np 별칭을 붙여 불러옵니다. # 라이브러리 불러오기 import numpy as np 1.2. 배열 생성 NumPy 배열은 'numpy.array' 함수를 사용하여 생성할 수 있습니다. 라이브러리를 불러올 때, np라고 별칭을 붙였기 때문에 'np.array'를 사용하여 생성할 수 있습니다. import numpy as np # 1차원 배..

IT/Python

[파이썬] 엑셀 파일 다루기

파이썬에서 엑셀파일을 다루는 것은 데이터 분석, 자동화 스크립트 작성, 리포트 생성 등 다양한 작업에 있어 매우 유용합니다. 파이썬에는 'pandas', 'openpyxl', 'xlrd', 'xlwt' 등의 라이브러리를 통해 엑셀 파일을 읽고, 쓰고, 수정할 수 있습니다. 1. pandas를 사용한 엑셀 파일 처리 pandas는 데이터 분석을 위한 고수준의 API를 제공하며, read_excel() 및 to_excel() 함수를 통해 간단히 엑셀 파일을 읽고 쓸 수 있습니다. 엑셀 파일 읽기 import pandas as pd # 엑셀 파일 읽기 df = pd.read_excel('example.xlsx', sheet_name='Sheet1') # 데이터 확인 print(df) 엑셀 파일 쓰기 # 데이터..

초코-모찌
'IT' 카테고리의 글 목록