학습주제
- 데이터의 종류에 대해서 알아보기
- 실습 - 타이타닉 승객 생존여부 예측하기
- 도메인 지식 습득하기
- ChatGPT 로 업무 보조 AI 만들기
주요 메모 사항 소개
- 숫자 데이터
- 숫자로 이루어져 있는 데이터
- 숫자(0~9), +, -, 화폐기호, 소수점, %, 지수 등으로 이루어진 데이터
ex) 4, 1002, 92%, $1000 - 문자 데이터
- 핸드폰번호, 주민등록번호, 숫자, 기호, 명칭과 같은 데이터
- 문자와 숫자가 혼합된 데이터
- 특정 함수 사용이 불가능하다.
- 문자열 함수를 사용 가능하다.
ex) 010-3323-2323. 프로그래머스, 743-240 (숫자라면 - 값이 적용) - 날짜 데이터
- 년, 월, 일 등 날짜를 표시하기 위한 데이터
- 하이픈(-)이나 슬래시(/)로 표현 가능
- 날짜도 숫자 데이터 처럼 계산이 가능하다.
- 숫자 1은 하루를 의미(1 → 24시간 , 0.5 → 12시간)
- 특정 함수가 사용 가능하다.
ex) 2023-10-02, 2023/10/02 - 기타
- 논리데이터
- 시간 데이터
- 수식 데이터
- 타이타닉 문제
- 1912년 4월 14일 여객선 타이타닉이 침몰하여 2,224명중 1,514명이 사망, 710명이 생존한 사고
- 이 데이터를 활용하여 Kaggle에서 승객의 생존, 사망 여부를 예측하는 경쟁을 진행하고있다.
- 순번, 승객명, 성별, 나이, 탑승석 등급 을 보고 예측
- 본인의 능력으로 예측
- 프로그래머스 사이트에서 진행
- GPT를 효율적으로 사용하는 방법
- 사용자 문제 해결 중심의 프롬프트 엔지니어링을 한다.
- 프롬프트
- 내가 원하는 결과물을 얻을 수 있도록 AI에게 지시하는 명령어 입니다. - 예시를 보여드리겠습니다.
{사용자}는 {사용자의 문제}에 도움이 필요하다.
이유는 {사용자의 문제} 때문이다.
너는 {사용자}를 도와주는 {역할}이다.
너의 역할은 {사용자의 문제}의 해결을 돕는 것입니다.
너는 먼저 대화를 시작하며 {사용자}의 답변을 받은 후 다음 단계로 넘어간다.
다음 대화 순서를 따라서 반드시 한 단계씩 나눠서 {사용자}와 대화합니다:
1단계, ...
2단계, ...
이런식으로 단계에는 본인의 업무 스타일에 맞게 적어주시면 됩니다.
{ } 에 들어가는 값은 변화될 수 있는 값이 므로 본인에게 맞게 작성해 주시고 질문할때도 { }를 사용해도 좋습니다.
처음 작성할때 시간이 걸리지만 한번 작성해 놓으면 업무 자동화에있어 큰 힘이 됩니다.
※ 3.5보다 4가 성능이 훨씬 뛰어나며 파일을 인식할 수 있어 유리합니다. - 신뢰할 수 있는 AI 만드는 법
- 일의 순서(단계)는 내가 정해줍니다.
- 긴 문장보단 간결한 문장으로 단계를 나눠 이야기합니다.
- 전문지식이 부족하거나 부정확 할 수 있기 때문에 답변에 대한 구체적인 근거 및 레퍼런스를 물어봅니다.
- 자신의 피드백을 AI에게 제공하여 성장에 도움을 줍니다.
- AI 대화 시 참고사항
- AI 답변에서 빠진 내용이 있다면 배울 수 있도록 질문한다.
- 단계 중간에 대화가 끊켰다면 "다음"이라고 말한다.
- 개인정보 및 중요한 데이터는 입력하면 안된다.
공부하며 어려웠던 내용
- 생각보다 AI 프롬프트를 만드는 작업이 쉽지않았다. 3.5라 그런지 모르겠지만 오류가 생각보다 많았다 자꾸 입력해 주면 개선될 것이라 생각한다.(GPT-4 업데이트를 고려해야 할 수 도..)
- 타이타닉 분석을 하는데 정확도 80% 이상 올라가기 까진 시간이 걸렸다. 고려해야할 사항이 더 많은 것 같다.
반응형
'데이터분석' 카테고리의 다른 글
9. 캐글 시작 (1) | 2023.11.30 |
---|---|
8. 엑셀(구글 시트) 기본 수식 사용 (0) | 2023.11.29 |
6. 공공데이터 포털 소개 (0) | 2023.11.27 |
5. 개인정보 보호 (2) | 2023.11.24 |
4. Gen AI (1) | 2023.11.23 |