본문 바로가기

Biusiness Insight

(104)
[Python] Pandas groupby, pivottable 실습 단원별 심화 연습 문제¶In [1]: !pip install seaborn==0.13.0 Defaulting to user installation because normal site-packages is not writeableCollecting seaborn==0.13.0 Downloading seaborn-0.13.0-py3-none-any.whl (294 kB) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 294.6/294.6 kB 2.1 MB/s eta 0:00:00a 0:00:01Requirement already satisfied: numpy!=1.24.0,>=1.20 in ./.local/lib/python3.9/site-pac..
[Python] Pandas 고급 전처리와 피벗테이블 모듈 import¶In [1]: !pip install seaborn==0.13.0 Defaulting to user installation because normal site-packages is not writeableCollecting seaborn==0.13.0 Downloading seaborn-0.13.0-py3-none-any.whl (294 kB) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 294.6/294.6 kB 6.1 MB/s eta 0:00:00a 0:00:01Requirement already satisfied: matplotlib!=3.6.1,>=3.3 in ./.local/lib/python3.9/site-pac..
[Python] Pandas 전처리, 추가, 삭제, 데이터 변환 모듈 import¶In [1]: !pip install seaborn==0.13.0 Defaulting to user installation because normal site-packages is not writeableCollecting seaborn==0.13.0 Downloading seaborn-0.13.0-py3-none-any.whl (294 kB) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 294.6/294.6 kB 6.6 MB/s eta 0:00:00a 0:00:01Requirement already satisfied: numpy!=1.24.0,>=1.20 in ./.local/lib/python3.9/site-packag..
[Python] Pandas 복제, 결측치 실습 단원별 심화 연습 문제¶In [1]: !pip install seaborn==0.13.0 Defaulting to user installation because normal site-packages is not writeableCollecting seaborn==0.13.0 Downloading seaborn-0.13.0-py3-none-any.whl (294 kB) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 294.6/294.6 kB 2.1 MB/s eta 0:00:00a 0:00:01Requirement already satisfied: matplotlib!=3.6.1,>=3.3 in ./.local/lib/python3.9/site-..
[Python] Pandas 복제, 결측치 모듈 import¶In [1]: !pip install seaborn==0.13.0 Defaulting to user installation because normal site-packages is not writeableCollecting seaborn==0.13.0 Downloading seaborn-0.13.0-py3-none-any.whl (294 kB) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 294.6/294.6 kB 6.1 MB/s eta 0:00:00a 0:00:01Requirement already satisfied: matplotlib!=3.6.1,>=3.3 in ./.local/lib/python3.9/site-pac..
[Python] Pandas 통계 실습 단원별 심화 연습 문제¶In [1]: !pip install seaborn==0.13.0 Defaulting to user installation because normal site-packages is not writeableCollecting seaborn==0.13.0 Downloading seaborn-0.13.0-py3-none-any.whl (294 kB) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 294.6/294.6 kB 6.6 MB/s eta 0:00:00a 0:00:01Requirement already satisfied: numpy!=1.24.0,>=1.20 in ./.local/lib/python3.9/site-pac..
[Python] Pandas 통계 모듈 import¶In [1]: !pip install seaborn==0.13.0 Defaulting to user installation because normal site-packages is not writeableCollecting seaborn==0.13.0 Downloading seaborn-0.13.0-py3-none-any.whl (294 kB) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 294.6/294.6 kB 5.8 MB/s eta 0:00:00a 0:00:01Requirement already satisfied: matplotlib!=3.6.1,>=3.3 in ./.local/lib/python3.9/site-pac..
[Python] Pandas 실습 단원별 심화 연습 문제 (난이도: 중)¶In [1]: !pip install seaborn==0.13.0 Defaulting to user installation because normal site-packages is not writeableCollecting seaborn==0.13.0 Downloading seaborn-0.13.0-py3-none-any.whl (294 kB) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 294.6/294.6 kB 2.1 MB/s eta 0:00:00a 0:00:01Requirement already satisfied: pandas>=1.2 in ./.local/lib/python3.9/site-pac..
[Python] Pandas 조회, 정렬, 조건 필터 (타이타닉 승객 데이터) 모듈 import¶In [1]: !pip install seaborn==0.13.0 Defaulting to user installation because normal site-packages is not writeableCollecting seaborn==0.13.0 Downloading seaborn-0.13.0-py3-none-any.whl (294 kB) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 294.6/294.6 kB 6.6 MB/s eta 0:00:00a 0:00:01Requirement already satisfied: numpy!=1.24.0,>=1.20 in ./.local/lib/python3.9/site-packag..
[Python] 파일 입출력 모듈 import¶In [1]: from IPython.display import Imageimport numpy as npimport pandas as pd 데이터 다운로드¶In [2]: from opendata import dataset# 데이터셋 다운로드dataset.download('서울시대중교통')dataset.download('서울시주민등록인구') ======= 다운로드 시작 =======data/seoul_transportation.xlsx 0%| | 0.00/26.2k [00:00 ======= 다운로드 완료 ============== 다운로드 시작 =======data/seoul_population.c..
[Python] Pandas 자료 구조 Pandas¶개요¶관계형 또는 레이블이 된 데이터로 쉽고 직관적 으로 작업할 수 있도록 설계되었고, 빠르고, 유연한 데이터 구조를 제공하는 Python 패키지입니다.또한, 어떤 언어로도 사용할 수 있는 가장 강력하고 유연한 오픈 소스 데이터 분석 / 조직 도구입니다.Pandas는 다음의 종류의 데이터에 적합한 분석 패키지입니다.SQL 테이블 또는 Excel 스프레드 시트에서와 같은 열과 행으로 이루어진 테이블 형식 데이터정렬되고 정렬되지 않은 시계열 데이터다른 형태의 관찰 / 통계 데이터 세트Pandas 공식 문서¶공식 문서는 다음 링크에서 확인할 수 있습니다.공식 도큐먼트Pandas의 Alias 지정¶pandas는 pd의 alias를 사용합니다.In [1]: import pandas as pd ..
[Tip] 데이터 분석 회의 진행 회의 전 (Before the meeting) 회의 목표 파악 (Indetify your objective) : 해결해야 할 문제나 요청을 포함하여 회의 목적/목표 및 원하는 결과를 설정 설득력 있는 의제 작성 (Crafting a Compelling agenda) : 데이터, 프로젝트 및 비즈니스에 대한 관점과 경험을 고려한 다양한 참가자를 지정 제시할 데이터 구성 (Organize the data to be presented) : 로우 데이터를 접근 가능한 형태로 전환하거나 시각화 의제를 준비하고 배포 (Prepare and distribute an angeda) 설득력 있는 의제 작성 (Crafting a compelling agenda) 회의 시작/종료 시간 (Meeting start and en..
Google I/O 2023 키노트 요약 Google I/O 2023 키노트 한 줄 요약 이번 구글 I/O 2023의 한 줄 요약은 『 AI 와 생성형 AI (Generative AI) 』 였다. AI-퍼스트 (AI-First) 전략으로 구글의 다양한 제품에 AI를 적용하고, 생성형 AI를 기반으로 진화해나갈 예정이다. (자세한 내용은 아래 내용과 영상을 참조) Google I/O 2023 키노트 - 10분 요약 버전 (Google Youtube) 구글 제품에 추가될 AI 기능 1. " Help me write " on 지메일 (Gmail), 워크스페이스 (Google Workspace) Google은 이메일 작성을 도와주는 "Help me write"라는 기능을 개발했다.이 기능은 방대한 텍스트 및 코드 데이터 세트로 학습된 생성형 AI를 사..
Data Analyst vs. Data Scientist (데이터 분석가 vs. 데이터 과학자) 기술이 계속 발전함에 따라, 새로운 기술로부터 데이터를 수집/분석할 수 있는 것 자체가 기업의 경쟁우위가 되었다. 웹 사이트에서 소셜미디어 피드까지 분석하고 잘 활용된다면, 비즈니스 의사결정에 도움이 될 많은 데이터가 있다. 현재 기업의 성공 여부는 데이터를 얼마나 잘 활용하고, 분석을 적용하며, 새로운 기술을 구현할 수 있는지에 달려 있다. IBM의 조사에 따르면, 미국의 데이터 분석 분야에 38만명 이상의 구인이 있는 것으로 추정했다. 수요가 워낙 강하기 때문에 사실상 모든 업종에서 일자리가 있다고 봐도 무방하다. 주요 구인 사이트를 검색하면 동물원, 보건소, 은행 등 모든 유형의 기업이 제능 있는 데이터 전문가를 찾고 있다. 데이터 분석 유관 JD 파헤치기 (Decoding the Job Descr..
[데이터 분석] 문제 유형 6가지 데이터 분석은 단순히 정보를 플랫폼에 연결하여 인사이트를 찾는 것 뿐만 아니라, 문제를 해결하는 것이다. 문제의 근원을 찾고 실질적이 해결책을 찾기 위해 창의적인 사고를 하기 위해서는 문제가 무엇이든 간에, 가장 중요한 것은 문제를 이해하는 것! 어떤 정보를 포함해야 하는지, 데이터를 변환할 수 있는 방법 및 데이터를 사용하는 방법을 결정하는데 도움이 되는 문제 해결 방법으로 분석을 진행하는 것이 바람직함. 일반적인 문제 유형 6가지 1. 예측, Making predictions Using data to make informed decisions about how things may be in the future. 예측 문제 예시 : 새로운 고객을 유치하기 위한 최상의 광고방법 과거 광고 결과를 기반으로..
데이터 분석 수명주기 vs. 데이터 수명주기 (life-cycle) 데이터 분석은 통계에 뿌리를 두고 있다. 통계는 그 자체로 꽤 오랜 역사를 가지고 있다. 고고학자들은 피라미드의 건설로 고대 이집트의 통계학이 시작되었다고 일컫는다. 고대 이집트인들은 데이터 정리의 달인이었다. 현재 스프레드 시트와 체크리스트의 가장 초기 모습으로 볼 수 있는 파피리(papyri, 종이와 같은 재료)에 계산과 이론을 문서화 했다. 데이터는 생성(created), 사용(consumed), 테스트(tested), 처리(processed) 및 재사용(reused)되는 여러 단계를 거친다. 데이터 분석 수명 주기는 전문가들 사이에는 잘 알려져 있지만, 정의된 구조는 없다. 모든 데이터 분석 전문가가 일관되게 동일 아키텍처를 따르지는 않지만, 모든 데이터 분석 프로세스에는 몇가지 기본 요소가 있다..
[학습일지] 데이터 분석 기술표 분석 기술표 (Analytical skills table)의 이해 호기심 (Curiosity) : 올바른 질문을 하며, 무언가에 대해 더 알고 싶은 욕구 맥락 이해 (Understanding context) : 정보가 전체적인 "큰 그림"에서 어디에 해당되는지 이해 기술적 사고방식 (Having a technical mindset) : 문제를 작은 단계로 세분화 데이터 설계 (Data design) : 데이터와 정보를 어떻게 조직/구성할지 생각 데이터 전략 (Data strategy) : 데이터 분석에 필요한 사람, 프로세스, 도구에 대해 생각 데이터 분석 기술표 기반 학습 계획 As of 2023-04-30
데이터 분석 프로세스 6단계 데이터 분석 프로세스 6단계를 활용한, 분석 사례 문제 : 신입사원의 이직률이 높음. 1년 미만 퇴사율 높음. 1. 질문 (Ask) 효과적인 질문 선정 신입 사원들이 입사 첫 해에 성공하기 위해서는 무엇을 배워야 한다고 생각하십니까? 이전에 신입 사원들로부터 데이터를 수집한 적이 있습니까? 그렇다면 과거 데이터에 접근할 수 있을까요? 유지율이 높은 관리자들이 신입 사원들에게 특별한 것이나 독특한 것을 제공한다고 생각하십니까? 신입사원들의 불만이 가장 큰 원인은 무엇이라고 생각하십니까? 다음 회계연도에 직원 유지율이 몇 퍼센트 증가하기를 원하십니까? 참고 강좌: https://www.coursera.org/learn/ask-questions-make-decisions 2. 준비 (Prepare) 3개월의 ..
비즈니스 분석 (Business Analytics) 비즈니스 분석(Business Analytics)이란 수학과 통계적인 방법을 사용하여 데이터를 수집, 분석, 해석하여 의미를 도출하고, 정보에 입각한 비즈니스 의사 결정을 내리는 프로세스 비즈니스 분석의 주요 유형 4가지 Descriptive (기술 분석) : 과거 데이터를 해석하여 추세와 패턴을 파악 ☞ 참고링크 Diagnostic (진단 분석) : 문제의 근본 원인을 파악하기 위한 과거 데이터 해석 ☞ 참고링크 Predictive (예측 분석) : 정보를 사용하여 미래 결과를 예측하는데 중점 ☞ 참고링크 Presciptive (처방 분석) : 주어진 시나리오에서 어떤 결과가 최상의 결과를 산출할 것인지 결정하기 위해 테스트 및 기타 기법을 사용 ☞ 참고링크 What is Business Analyti..
[OKR] 구글의 OKR 플레이북 (매뉴얼) 1. 구글의 OKR 플레이북 (매뉴얼) 1.1 효과적인 OKR 세우기 목표는 '무엇'을 말한다. 목표는... ... 목적지와 방향을 가리킨다. 공격적이면서 현실적이다. 뚜렷하고 객관적이고 구체적이어야 한다. 성공 가능성을 떠나 누구나 쉽게 이해할 수 있어야 한다. 목표를 달성했다면 구글은 뚜렷한 가치를 얻을 수 있어야 한다. 핵심결과는 '어떻게'를 말한다. 핵심결과는... ... 측정 가능한 이정표가. 모든 이정표를 거쳤다면 목적지에 도달해야 한다. 노력이 아니라 결과에 관한 것이다. "조언", "도움", "분석", "참여"라는 용어가 보인다면 그것은 노력에 관한 설명이다. 핵심결과는 이러한 노력이 최종 사용자에게 미치는 영향을 말한다. 가령 "3월 7일까지 주요 여섯 팀의 평균 및 테일 레이턴시 발표하..