본문 바로가기

Biusiness Insight

(99)
[Python] Pandas 통계 실습 단원별 심화 연습 문제¶In [1]: !pip install seaborn==0.13.0 Defaulting to user installation because normal site-packages is not writeableCollecting seaborn==0.13.0 Downloading seaborn-0.13.0-py3-none-any.whl (294 kB) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 294.6/294.6 kB 6.6 MB/s eta 0:00:00a 0:00:01Requirement already satisfied: numpy!=1.24.0,>=1.20 in ./.local/lib/python3.9/site-pac..
[Python] Pandas 통계 모듈 import¶In [1]: !pip install seaborn==0.13.0 Defaulting to user installation because normal site-packages is not writeableCollecting seaborn==0.13.0 Downloading seaborn-0.13.0-py3-none-any.whl (294 kB) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 294.6/294.6 kB 5.8 MB/s eta 0:00:00a 0:00:01Requirement already satisfied: matplotlib!=3.6.1,>=3.3 in ./.local/lib/python3.9/site-pac..
[Python] Pandas 실습 단원별 심화 연습 문제 (난이도: 중)¶In [1]: !pip install seaborn==0.13.0 Defaulting to user installation because normal site-packages is not writeableCollecting seaborn==0.13.0 Downloading seaborn-0.13.0-py3-none-any.whl (294 kB) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 294.6/294.6 kB 2.1 MB/s eta 0:00:00a 0:00:01Requirement already satisfied: pandas>=1.2 in ./.local/lib/python3.9/site-pac..
[Python] Pandas 조회, 정렬, 조건 필터 (타이타닉 승객 데이터) 모듈 import¶In [1]: !pip install seaborn==0.13.0 Defaulting to user installation because normal site-packages is not writeableCollecting seaborn==0.13.0 Downloading seaborn-0.13.0-py3-none-any.whl (294 kB) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 294.6/294.6 kB 6.6 MB/s eta 0:00:00a 0:00:01Requirement already satisfied: numpy!=1.24.0,>=1.20 in ./.local/lib/python3.9/site-packag..
[Python] 파일 입출력 모듈 import¶In [1]: from IPython.display import Imageimport numpy as npimport pandas as pd 데이터 다운로드¶In [2]: from opendata import dataset# 데이터셋 다운로드dataset.download('서울시대중교통')dataset.download('서울시주민등록인구') ======= 다운로드 시작 =======data/seoul_transportation.xlsx 0%| | 0.00/26.2k [00:00 ======= 다운로드 완료 ============== 다운로드 시작 =======data/seoul_population.c..
[Python] Pandas 자료 구조 Pandas¶개요¶관계형 또는 레이블이 된 데이터로 쉽고 직관적 으로 작업할 수 있도록 설계되었고, 빠르고, 유연한 데이터 구조를 제공하는 Python 패키지입니다.또한, 어떤 언어로도 사용할 수 있는 가장 강력하고 유연한 오픈 소스 데이터 분석 / 조직 도구입니다.Pandas는 다음의 종류의 데이터에 적합한 분석 패키지입니다.SQL 테이블 또는 Excel 스프레드 시트에서와 같은 열과 행으로 이루어진 테이블 형식 데이터정렬되고 정렬되지 않은 시계열 데이터다른 형태의 관찰 / 통계 데이터 세트Pandas 공식 문서¶공식 문서는 다음 링크에서 확인할 수 있습니다.공식 도큐먼트Pandas의 Alias 지정¶pandas는 pd의 alias를 사용합니다.In [1]: import pandas as pd ..
[Tip] 데이터 분석 회의 진행 회의 전 (Before the meeting) 회의 목표 파악 (Indetify your objective) : 해결해야 할 문제나 요청을 포함하여 회의 목적/목표 및 원하는 결과를 설정 설득력 있는 의제 작성 (Crafting a Compelling agenda) : 데이터, 프로젝트 및 비즈니스에 대한 관점과 경험을 고려한 다양한 참가자를 지정 제시할 데이터 구성 (Organize the data to be presented) : 로우 데이터를 접근 가능한 형태로 전환하거나 시각화 의제를 준비하고 배포 (Prepare and distribute an angeda) 설득력 있는 의제 작성 (Crafting a compelling agenda) 회의 시작/종료 시간 (Meeting start and en..
Google I/O 2023 키노트 요약 Google I/O 2023 키노트 한 줄 요약 이번 구글 I/O 2023의 한 줄 요약은 『 AI 와 생성형 AI (Generative AI) 』 였다. AI-퍼스트 (AI-First) 전략으로 구글의 다양한 제품에 AI를 적용하고, 생성형 AI를 기반으로 진화해나갈 예정이다. (자세한 내용은 아래 내용과 영상을 참조) Google I/O 2023 키노트 - 10분 요약 버전 (Google Youtube) 구글 제품에 추가될 AI 기능 1. " Help me write " on 지메일 (Gmail), 워크스페이스 (Google Workspace) Google은 이메일 작성을 도와주는 "Help me write"라는 기능을 개발했다.이 기능은 방대한 텍스트 및 코드 데이터 세트로 학습된 생성형 AI를 사..
Data Analyst vs. Data Scientist (데이터 분석가 vs. 데이터 과학자) 기술이 계속 발전함에 따라, 새로운 기술로부터 데이터를 수집/분석할 수 있는 것 자체가 기업의 경쟁우위가 되었다. 웹 사이트에서 소셜미디어 피드까지 분석하고 잘 활용된다면, 비즈니스 의사결정에 도움이 될 많은 데이터가 있다. 현재 기업의 성공 여부는 데이터를 얼마나 잘 활용하고, 분석을 적용하며, 새로운 기술을 구현할 수 있는지에 달려 있다. IBM의 조사에 따르면, 미국의 데이터 분석 분야에 38만명 이상의 구인이 있는 것으로 추정했다. 수요가 워낙 강하기 때문에 사실상 모든 업종에서 일자리가 있다고 봐도 무방하다. 주요 구인 사이트를 검색하면 동물원, 보건소, 은행 등 모든 유형의 기업이 제능 있는 데이터 전문가를 찾고 있다. 데이터 분석 유관 JD 파헤치기 (Decoding the Job Descr..
[데이터 분석] 문제 유형 6가지 데이터 분석은 단순히 정보를 플랫폼에 연결하여 인사이트를 찾는 것 뿐만 아니라, 문제를 해결하는 것이다. 문제의 근원을 찾고 실질적이 해결책을 찾기 위해 창의적인 사고를 하기 위해서는 문제가 무엇이든 간에, 가장 중요한 것은 문제를 이해하는 것! 어떤 정보를 포함해야 하는지, 데이터를 변환할 수 있는 방법 및 데이터를 사용하는 방법을 결정하는데 도움이 되는 문제 해결 방법으로 분석을 진행하는 것이 바람직함. 일반적인 문제 유형 6가지 1. 예측, Making predictions Using data to make informed decisions about how things may be in the future. 예측 문제 예시 : 새로운 고객을 유치하기 위한 최상의 광고방법 과거 광고 결과를 기반으로..
데이터 분석 수명주기 vs. 데이터 수명주기 (life-cycle) 데이터 분석은 통계에 뿌리를 두고 있다. 통계는 그 자체로 꽤 오랜 역사를 가지고 있다. 고고학자들은 피라미드의 건설로 고대 이집트의 통계학이 시작되었다고 일컫는다. 고대 이집트인들은 데이터 정리의 달인이었다. 현재 스프레드 시트와 체크리스트의 가장 초기 모습으로 볼 수 있는 파피리(papyri, 종이와 같은 재료)에 계산과 이론을 문서화 했다. 데이터는 생성(created), 사용(consumed), 테스트(tested), 처리(processed) 및 재사용(reused)되는 여러 단계를 거친다. 데이터 분석 수명 주기는 전문가들 사이에는 잘 알려져 있지만, 정의된 구조는 없다. 모든 데이터 분석 전문가가 일관되게 동일 아키텍처를 따르지는 않지만, 모든 데이터 분석 프로세스에는 몇가지 기본 요소가 있다..
[학습일지] 데이터 분석 기술표 분석 기술표 (Analytical skills table)의 이해 호기심 (Curiosity) : 올바른 질문을 하며, 무언가에 대해 더 알고 싶은 욕구 맥락 이해 (Understanding context) : 정보가 전체적인 "큰 그림"에서 어디에 해당되는지 이해 기술적 사고방식 (Having a technical mindset) : 문제를 작은 단계로 세분화 데이터 설계 (Data design) : 데이터와 정보를 어떻게 조직/구성할지 생각 데이터 전략 (Data strategy) : 데이터 분석에 필요한 사람, 프로세스, 도구에 대해 생각 데이터 분석 기술표 기반 학습 계획 As of 2023-04-30
데이터 분석 프로세스 6단계 데이터 분석 프로세스 6단계를 활용한, 분석 사례 문제 : 신입사원의 이직률이 높음. 1년 미만 퇴사율 높음. 1. 질문 (Ask) 효과적인 질문 선정 신입 사원들이 입사 첫 해에 성공하기 위해서는 무엇을 배워야 한다고 생각하십니까? 이전에 신입 사원들로부터 데이터를 수집한 적이 있습니까? 그렇다면 과거 데이터에 접근할 수 있을까요? 유지율이 높은 관리자들이 신입 사원들에게 특별한 것이나 독특한 것을 제공한다고 생각하십니까? 신입사원들의 불만이 가장 큰 원인은 무엇이라고 생각하십니까? 다음 회계연도에 직원 유지율이 몇 퍼센트 증가하기를 원하십니까? 참고 강좌: https://www.coursera.org/learn/ask-questions-make-decisions 2. 준비 (Prepare) 3개월의 ..
비즈니스 분석 (Business Analytics) 비즈니스 분석(Business Analytics)이란 수학과 통계적인 방법을 사용하여 데이터를 수집, 분석, 해석하여 의미를 도출하고, 정보에 입각한 비즈니스 의사 결정을 내리는 프로세스 비즈니스 분석의 주요 유형 4가지 Descriptive (기술 분석) : 과거 데이터를 해석하여 추세와 패턴을 파악 ☞ 참고링크 Diagnostic (진단 분석) : 문제의 근본 원인을 파악하기 위한 과거 데이터 해석 ☞ 참고링크 Predictive (예측 분석) : 정보를 사용하여 미래 결과를 예측하는데 중점 ☞ 참고링크 Presciptive (처방 분석) : 주어진 시나리오에서 어떤 결과가 최상의 결과를 산출할 것인지 결정하기 위해 테스트 및 기타 기법을 사용 ☞ 참고링크 What is Business Analyti..
[OKR] 구글의 OKR 플레이북 (매뉴얼) 1. 구글의 OKR 플레이북 (매뉴얼) 1.1 효과적인 OKR 세우기 목표는 '무엇'을 말한다. 목표는... ... 목적지와 방향을 가리킨다. 공격적이면서 현실적이다. 뚜렷하고 객관적이고 구체적이어야 한다. 성공 가능성을 떠나 누구나 쉽게 이해할 수 있어야 한다. 목표를 달성했다면 구글은 뚜렷한 가치를 얻을 수 있어야 한다. 핵심결과는 '어떻게'를 말한다. 핵심결과는... ... 측정 가능한 이정표가. 모든 이정표를 거쳤다면 목적지에 도달해야 한다. 노력이 아니라 결과에 관한 것이다. "조언", "도움", "분석", "참여"라는 용어가 보인다면 그것은 노력에 관한 설명이다. 핵심결과는 이러한 노력이 최종 사용자에게 미치는 영향을 말한다. 가령 "3월 7일까지 주요 여섯 팀의 평균 및 테일 레이턴시 발표하..
조직 설계 방법론: 스타 모형 (The Star Model) 이해하기 조직 설계 : 스타 모형 (Star Model) 1. 전략 (Strategy) : 방향 설정 2. 조직도 (Structure) : 의사결정 권한 대상 정의 3. 프로세스 (Processes) : 업무의 흐름 4. 평가/보상 (Rewards) : 조직의 목표를 추구하고 완수하도록 조직 구성원에게 동기 부여 5. 인재 (People) : 인적 자원 스타 모델을 이용한 조직 설계 마일스톤 5단계 1. 비즈니스 케이스와 발견 (Business cases and discovery) : 문제 정의, 영향도 결정, 갭 인지 - 달성가능한 목표, 추구하는 Vision, Mission을 구체화하고 경영의 기본 방향을 설정 - 지향점에 맞춰 제공할 제품과 서비스, 진출해야할 시장, 고객에게 제공할 가치에 대해 구체화 맥킨..
[ESG] ESG 기본 용어 탄소발자국 | Carbon footprint 탄소 발자국(Carbon footprint)은 개인 또는 단체가 직접·간접적으로 발생시키는 온실 가스, 특히 이산화탄소의 총량을 의미 2006년 영국의회과학기술처(POST)에서 처음 사용한 것으로, 소비되는 제품들에 이산화탄소가 얼마나 발생하는지를 탄소발자국으로 표시하도록 한것 표시 단위는 무게 단위인 킬로그램(kg) 또는 우리가 심어야 하는 나무 수로 나타냄 제품의 생산, 운송, 사용, 처분 시 배출되는 탄소도 모두 포함함 탄소발자국 계산기 : www.kcen.kr/tanso/intro.green 비슷한 개념으로 개인 및 단체의 생활을 위해 소비되는 토지의 총 면적을 계산하는 '생태발자국'이 있음 파리기후변화협약 | Paris Climate Agreemen ..
[ESG] ESG 실무자를 위한 참고 링크 ESG 실무자들이 꼭 알아야 할 '즐겨찾기' GRI 가이드라인 www.globalreporting.org GRI (Global Reporting Initiative) : 기업의 지속가능경영보고서 가이드라인을 제시하는 비영리기구 지속가능경영보고서 작성 시 참고해야 할 기준 확인 가능 GRI 가이드라인 : 19개 주제별 세부 지침과 우수 사례 제시 15,000여개 이상의 조직이 GRI 가이드라인을 토대로 보고서를 작성하기 때문에 보고서 작성 시 반드시 참고하는 것이 바람직함 기업들의 지속가능경영보고서(DB) 검색 : database.globalreporting.org SASB Standards www.sasb.org SASB (Sustainability Accounting Standards Board) : ..
[ESG] ESG 실무자들을 위한 업무 Tip ESG Working-level TIP - ESG 경영을 도입한 기업 실무자들의 인터뷰를 통해 알아본 ESG 실무자들이 꼭 알아야 할 핵심 노하우 1. 우리 업종의 ESG 트렌드를 읽어라 어디에 힘을 쏟을까? 가장 트렌디하고 중요한 이슈 파악이 우선이다. 업종별 핵심 이슈를 파악할 때는 '중대성 지도(Materiality Map)'를 주요하게 참고하고, 경쟁사들의 ESG 전략과 평가사의 가이드라인을 살피면 다음 할 일이 뚜렷해진다. 2. 발로 뛰어라 ESG 핵심 전략안이 나왔다? 그럼 이젠 발로 뛸 차례다. C레벨, 경영진을 만나 우리 회사에 적합한 ESG 정책을 도출해 내야 한다. 또 이해관계자는 물론 유관 부서 팀원들과 소통하며 ESG 활동을 발전시켜 나가는 것이 바람직하다. 3. 지속가능경영보고서는..
[Python] 행렬의 연산(Matrix Multiplication) Numpy Dot 예제 Numpy Dot → np.dot( ) Numpyt Array를 곱할 때 사용 두 입력 배열(행렬, 벡터)의 내적 계산 입력 값이 모두 스칼라이면 1차원 배열을 생성하고, 그렇지 않으면 n차원 배열 생성 입력 값이 모두 벡터이면 행렬의 곱을 계산 source : https://numpy.org/doc/stable/reference/generated/numpy.dot.html np.dot( )을 이용한 2x2 행렬의 곱 import numpy as np a= [[1, 0], [0, 1]] b = [[4, 1], [2, 2]] np.dot(a, b) np.dot( )을 이용한 두 행렬 값의 곱 a = np.arange(3*4*5*6).reshape((3,4,5,6)) b = np.arange(3*4*5*6)..