Tableau

Beginner_1

장수우 2024. 7. 17. 20:37
  • Excel 파일은 일반적으로 사람들이 작업을 하기에 예시로 적합하다. 엑셀과 Tableau를 연결할때 주의점이 하나있다.
    • 필드 heading에 데이터가 없으면 엑셀 파일을 들어가서 직접 삭제하고 업로드 해도 되지만 매주 업데이트 해야하는 파일이라면 귀찮을 것 
    • 일단 엑셀 파일을 엑셀 시트를 정해주지 않았기 때문에 불러오면 처음엔 아무것도 없다 

왼쪽에서 시트를 가져오면 데이터가 보인다.

데이터 해석기를 사용을 클릭하면 데이터 타입을 올바르게 설정해주고 NULL 값을 없애준다.

이후 필드에서 값이나 데이터 타입 잘 설정되었나 확인할 필요가 있다.

  • 더러운 데이터는 간단히 제거 가능하다, 모든 데이터는 자체적으로 존재해야하고 분리되어야한다.
    - Country, State, City, Postal code 4개가 한 셀에 있지만 이것을 4가지나 3가지로 분리해야 편함
    - Membership Id 같은 유니크 값을 판별해야하는데 숫자라 측정값에 들어 갈 수도 있기에 확인을 해야한다.


  • 데이터 정렬
    • 엑셀은 text to column : 단일 열에 들어있는 데이터를 여러 열로 나누는 것
    • 분할 법 2가지
      1. 분할 → 자동 분할
        맨 뒤에 분할 데이터가나온다. 이름변경으로 이름을 바꿔주자
        • 원래 데이터 셋은 파란색이고 분할한 셋은 색이 없다.
        • 파란색은 하나의 데이터 셋(여기서는 한 개의 시트만 썼기에 첫 시트가 파란색, 아마 다른 시트를 연결하면 그 시트에 해당하는 데이터셋의 색갈은 다른색으로 나올 것)
      2. 사용자 지정 분할
        구분 기호 사용 : 뭘로 칼럼을 분리할지 정하자 = 구분기호사용


        분할 범위 설정
        1. 첫 번째 는 United States 에서 몇번째 열까지 분할할꺼냐 라는 것
        2. 지난 칸은 42420 에서부터 몇 번째 까지 분할
        3. 전체는 전체 몇개로 분할
        분할 했다면 데이터 타입을 확인 잘하자 중요하

 

  • 나중에 맵으로 시각화 했을때 오류가 나지 않으려면 지리적 역할에 들어가서 타입이 제대로 들어가 있는지
    확인해야한다

  • Excel → tableau 로 정보가 이동하는 데 걸리는 시간이 있다, 컴퓨터 세계에서는 모든 것에 대가가 따름, 용량이 클 때 성능을 향상시키기 위한 트릭중 하나 = 하이퍼 파일하지만 이런 하이퍼 파일을 꺼내서 개인 PC에 저장하는 것은 매우 위험하니 회사와 상의가 필요Tableau Desktop을 사용한다면 Connection 에 Live 와 Extract가 있다.Data에 가서 - Use Extract 가 켜져 있다면 새로고침 후 사용해야한다.
  • Live는 계속 먹이를 먹는것, Extract 를 사용해서 시트1클릭하면 .hyper로 추출이 가능 추출해서 개인 Pc에 저장할 수 있다. 하이퍼 파일을 가져다가 사용하면 복제해서 PC에 저장한거라 생각하고 수정해도 원본 파일에 지장이 없다.(라이브 연결하기 전까지)
  • AWS RDS 같은 안전한 곳이 낫긴하다 (보안상)
  • 하이퍼 파일은 옷을 입히는 것과 같다. 하이퍼가 없으면 실시간 연결 모드

  • public을 사용하면 파일을 저장할 수없다 이게 한계 온라인 서버에 저장해야한다.
  • 온라인 서버에서 PC로 저장하려면 다운로드 클릭 → format을 - Tableau Workbook 으로 저장

파일은 최신 파일로 저장이 좋다.

  • 저장이 완료 되면 이런식으로 금색 테두리가 있다. twbx 이기 때문에 원본 파일이 필요는 없지만 다시 Live로 연결하기 위해선 원본 파일이 필요하다.
반응형

'Tableau' 카테고리의 다른 글

Beginner(Filtering Dates, Measures and Strings)  (1) 2024.07.22
Beginner (Grouping, Sorting, Aggregations and HeatMap)  (0) 2024.07.17
tableau 기초(total)  (0) 2024.07.16
tableau 기초(Area, Pie Chart)  (0) 2024.07.13
Tableau_기초(Date)  (0) 2024.07.13