목록분류 전체보기 (5)
공실이의 개발 블로그

Introduction BigQuery란? 머신러닝, 지리정보 분석, 비즈니스 인텔리전스와 같은 기본 제공 기능으로 데이터를 관리하고 분석할 수 있게 해주는 완전 관리형 엔터프라이즈 데이터 웨어하우스입니다. BigQuery의 서버리스 아키텍처에서는 SQL 쿼리를 사용하여 제로 인프라 관리에 관한 조직의 가장 큰 질문을 해결할 수 있습니다. BigQuery의 확장 가능한 분산형 분석 엔진을 통해 테라바이트급 쿼리를 초 단위로 수행하고 페타바이트급 쿼리를 분 단위로 쿼리할 수 있습니다. Step 1. Google BigQuery 홈페이지에 들어가 콘솔로 이동합니다. 2. 홈페이지 상단의 프로젝트 선택에서 새 프로젝트를 생성합니다. 3. API 및 서비스 탭 > API 및 서비스 사용 설정으로 이동합니다. 4..

Introduction 캐글은 데이터과학 및 머신러닝 경진대회를 주최하는 온라인 커뮤니티. 데이터 사이언스나 머신러닝을 공부하는 사람이라면 누구나 한 번쯤은 풀어봤을 ‘타이타닉 생존자 예측’ 문제다. 성별, 연령, 탑승권 가격, 탑승지, 가족의 숫자 등 다양한 데이터와 생존의 상관관계를 찾은 뒤 이를 나머지 탑승객 정보에 적용해 생존 여부를 예측해야 한다. 이 문제를 두고 전 세계의 아마추어부터 전문가까지 수많은 사람이 자웅을 겨루는 플랫폼이 ‘캐글(kaggle)’이다. Step 1. 캐글 가입 ■ kaggle.com에 접속 > 메인홈페이지 확인 ■ 홈페이지 우측 상단의 [Register]를 클릭합니다 ■ 구글 계정으로 가입하려면 [Register with Google]을 클릭하고, 다른 메일로 가입하려..

Matplotlib vs Seabron 관계 파악하기 [Seaborn] 정형 데이터만 시각화 가능하다. (Pandas 라이브러리에 쉽게 접근하기 위해 Matplotlib에서 파생된 라이브러리이며 리턴 값은 Matplotlib로 나타난다. 장점 코드가 짧다 Matplotlib과 비교해 색감이 부드럽고 전반적으로 디자인이 이쁘다 신뢰 구간, 밀도 함수 등 통계 시각화 명령어를 보유하고 있어, 통계 데이터 시각화에 유리하다 단점 그릴 수 없는 그림이 있고 수정이 Matplotlib보다 어려워서 자유도가 낮다 Matplotlib을 모르면 세부 수정을 할 수 없다 (결국 Matplotlib을 호출해서 사용하게 됨) [Matplotlib] 이미지 데이터 및 정형 데이터까지 시각화가 가능하다. 장점 웬만하면 다 그릴..

Introduction “구글 코랩(Colaboratory)이란?” Google Colab은 웹에서 텍스트 기반의 코딩을 할 수 있도록 구글에서 제공하는 editor입니다. Setting "1. 구글 드라이브에서 Colab 실행" 내 드라이브 -> 더보기 -> Google Colaboratory 실행한다 "2. 파일 -> 새 노트" 파일 탭에서 새 노트를 만들어준다. "3. 코랩 노트북 환경 설정하기" 3-1. 런타임 -> 런타임 유형변경 -> 하드웨어 가속기 None에서 GPU로 변경 3-2. 들여쓰기 변경 도구 -> 설정 -> 편집기 들여쓰기 너비를 2 -> 4 변경 "4. 필사 확인 및 간단한 코랩 사용" 코드 셀과 텍스트 셀을 추가하며 필사를 할 수 있으며, 코드는 코드 셀에서 코드 작성 -> '..

Introduction List comprehensions provide a concise way to create lists. Common applications are to make new lists where each element is the result of some operations applied to each member of another sequence or iterable, or to create a subsequence of those elements that satisfy a certain condition. 5. Data Structures This chapter describes some things you’ve learned about already in more detail..