데이터분석

7. 효율적인 GPT 사용

장수우 2023. 11. 28. 16:56
학습주제
  • 데이터의 종류에 대해서 알아보기
  • 실습 - 타이타닉 승객 생존여부 예측하기
  • 도메인 지식 습득하기
  • ChatGPT 로 업무 보조 AI 만들기
주요 메모 사항 소개
  • 숫자 데이터
    - 숫자로 이루어져 있는 데이터
    - 숫자(0~9), +, -, 화폐기호, 소수점, %, 지수 등으로 이루어진 데이터
    ex) 4, 1002, 92%, $1000
  • 문자 데이터
    - 핸드폰번호, 주민등록번호, 숫자, 기호, 명칭과 같은 데이터
    - 문자와 숫자가 혼합된 데이터
    - 특정 함수 사용이 불가능하다.
    - 문자열 함수를 사용 가능하다.
    ex) 010-3323-2323. 프로그래머스, 743-240 (숫자라면 - 값이 적용)
  • 날짜 데이터
    - 년, 월, 일 등 날짜를 표시하기 위한 데이터
    - 하이픈(-)이나 슬래시(/)로 표현 가능
    - 날짜도 숫자 데이터 처럼 계산이 가능하다.
    - 숫자 1은 하루를 의미(1 → 24시간 , 0.5 → 12시간)
    - 특정 함수가 사용 가능하다.
    ex) 2023-10-02, 2023/10/02
  • 기타
    - 논리데이터
    - 시간 데이터
    - 수식 데이터

  • 타이타닉 문제
    - 1912년 4월 14일 여객선 타이타닉이 침몰하여 2,224명중 1,514명이 사망, 710명이 생존한 사고
    - 이 데이터를 활용하여 Kaggle에서 승객의 생존, 사망 여부를 예측하는 경쟁을 진행하고있다.
    - 순번, 승객명, 성별, 나이, 탑승석 등급 을 보고 예측
    - 본인의 능력으로 예측
    - 프로그래머스 사이트에서 진행

  • GPT를 효율적으로 사용하는 방법
    • 사용자 문제 해결 중심의 프롬프트 엔지니어링을 한다.
    • 프롬프트
      - 내가 원하는 결과물을 얻을 수 있도록 AI에게 지시하는 명령어 입니다.
    • 예시를 보여드리겠습니다.

      {사용자}는 {사용자의 문제}에 도움이 필요하다.
      이유는 {사용자의 문제} 때문이다.
      너는 {사용자}를 도와주는 {역할}이다.
      너의 역할은 {사용자의 문제}의 해결을 돕는 것입니다.
      너는 먼저 대화를 시작하며 {사용자}의 답변을 받은 후 다음 단계로 넘어간다.
      다음 대화  순서를 따라서 반드시 한 단계씩 나눠서 {사용자}와 대화합니다:
      1단계, ...
      2단계, ...

      이런식으로 단계에는 본인의 업무 스타일에  맞게 적어주시면 됩니다.
      { } 에 들어가는 값은 변화될 수 있는 값이 므로 본인에게 맞게 작성해 주시고 질문할때도 { }를 사용해도 좋습니다.
      처음 작성할때 시간이 걸리지만 한번 작성해 놓으면 업무 자동화에있어 큰 힘이 됩니다.
      ※ 3.5보다 4가 성능이 훨씬 뛰어나며 파일을 인식할 수 있어 유리합니다.
    • 신뢰할 수 있는 AI 만드는 법
      1. 일의 순서(단계)는 내가 정해줍니다.
      2. 긴 문장보단 간결한 문장으로 단계를 나눠 이야기합니다.
      3. 전문지식이 부족하거나 부정확 할 수 있기 때문에 답변에 대한 구체적인 근거 및 레퍼런스를 물어봅니다.
      4. 자신의 피드백을 AI에게 제공하여 성장에 도움을 줍니다.
    • AI 대화 시 참고사항
      1. AI 답변에서 빠진 내용이 있다면 배울 수 있도록 질문한다.
      2. 단계 중간에 대화가 끊켰다면 "다음"이라고 말한다.
      3. 개인정보 및 중요한 데이터는 입력하면 안된다.

공부하며 어려웠던 내용
  • 생각보다 AI 프롬프트를 만드는 작업이  쉽지않았다. 3.5라 그런지 모르겠지만 오류가 생각보다 많았다 자꾸 입력해 주면 개선될 것이라 생각한다.(GPT-4 업데이트를 고려해야 할 수 도..) 
  • 타이타닉 분석을 하는데 정확도 80% 이상 올라가기 까진 시간이 걸렸다. 고려해야할 사항이 더 많은 것 같다.
반응형

'데이터분석' 카테고리의 다른 글

9. 캐글 시작  (1) 2023.11.30
8. 엑셀(구글 시트) 기본 수식 사용  (0) 2023.11.29
6. 공공데이터 포털 소개  (0) 2023.11.27
5. 개인정보 보호  (2) 2023.11.24
4. Gen AI  (1) 2023.11.23