ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [인공지능 공부 / 3일차] 인공지능으로 돈 벌기 프로젝트 - 과일 분류하기
    일상/인공지능으로 돈 벌기 2023. 1. 31. 00:07

    아래는 오늘의 세 가지의 이행 여부이다.

     

    1. 밤 11시 30분 전에 침대에 눕기. 

    분명 어제 12시 정도에 누웠다. 그런데 잠이 안 와버려서 결국 두시에 잤다.

    1번 실패.

     

    2. 하루 세끼 식사 규칙적으로 하기.

    늦게 잔 영향으로 10시 반에 일어났다. 결국 아점을 먹었고, 하루 두 끼 식사를 기록하게 되었다.

    2번 실패.


    3. 팔 굽혀 펴기 하루에 30개씩 하기.

    방금 10개를 채워 30개 했다.

    3번 성공.

     

    오늘은 이행률 33.3%를 기록했다. 참으로 저조한 수치이다.

    내일은 오늘의 부진을 만회해야겠다.

    늦게 일어나면 아침을 못 먹기에, 1번의 성공 여부가 중요하다. 일찍 자야지.

     


     

    다음으로는 오늘의 인공지능 공부 성과를 공유하겠다.

    오늘은 k-평균을 구하는 부분까지 공부했다.

     


     

    얘기하기에 앞서, 오늘 이상하게도 책이 잘 안 읽혔다.

    문장을 읽는데, 뜻이 이해가 안되고 글자단위로 눈에 들어왔다.

    그래서 공부하는 내내 이게 스트레스로 다가왔다.

     

    약간 이런 느낌이다.평소에 숨을 잘 쉬면서 살다가, 갑자기 숨 쉬는 걸 의식하기 시작했을 때 어색해지는?

     

    나에게는 가끔 이런 경우가 생기는데, 이럴때면 갑자기 글이 이해가 안 되어 두세 번씩 읽게 된다.

    그냥 내 몸이 오늘은 쉬어가라고 신호를 보내는구나, 생각해야겠다.

     


     

    아무튼, 오늘은 비지도학습(Unsupervised Learning) 중 하나인 k-평균 알고리즘 까지 공부했다.

    사과, 파인애플, 바나나, 이렇게 세 가지 종류의 과일 사진들이 주어졌을 때, 분류를 어떻게 할지가 오늘의 토픽이다.

     

     

    지난 포스팅에서 말했듯이, 비지도 학습의 특성상 훈련시에 타깃값이 주어지지 않는다.

    (사과인지 파인애플인지 바나나인지 안 적혀있다.)

    오직 입력값(과일 사진)만 주어진다.

     

    그래서 컴퓨터는 사진들만 보고 비슷한 과일끼리 묶어내야 한다.

    이렇게 비슷한 샘플들을 하나의 그룹으로 모으는 비지도 학습 작업을 "군집"이라고 한단다.

    그리고 이 작업으로 모인 샘플 그룹을 "클러스터"라고 하고.

     

    벌써 머리가 아플 수도 있다. 그냥 이런 게 있나 보다 하고 넘어가도록 하자.

    이미 머리가 아파진 겸, k-평균 알고리즘의 작동 방식도 알아보자.

     

    1. 무작위로 k개의 클러스터 중심을 정한다.

    2. 각 샘플에서 가장 가까운 클러스터 중심을 찾아 해당 클러스터의 샘플로 지정한다.

    3. 클러스터에 속한 샘플의 평균값으로 클러스터 중심을 변경한다.

    4. 클러스터 중심에 변화가 없을 때까지 2번으로 돌아가 과정을 반복한다.

     

    사실 위 문장들만으로는 이해하기 어렵다.

    그냥 오늘 공부한 부분의 핵심이라 책의 내용을 옮겨 쓴 거다.

    나는 3번이 중요하다고 생각해 책에도 형광펜을 그어 놓았다.

     

    궁금하면 "혼자 공부하는 머신러닝 + 딥러닝" 책을 읽어보도록 하자.

     

     

    아무튼 k-평균 알고리즘을 이용하면, 아래처럼 과일들을 분류할 수 있다.

     

     

    사과(왼쪽) - 바나나(가운데) - 파인애플(왼쪽)

     

    사과와 바나나는 꽤 잘 분류가 되었지만, 일부 사과와 바나나들이 파인애플 그룹에 가서 붙는 문제가 생겼다.

    k-평균 알고리의 성능이 완벽하지는 않음을 보여준다.

     

    아래는 k-평균 알고리즘이 과일들을 분류하면서 학습한 세 클러스터(그룹)의 특성 평균값을 이미지화한 것이다.이러한 평균값을 "클러스터 중심" 혹은 "센트로이드(centroid)"라고 부른다고 한다.

     

     

     

     

    머리가 점점 더 어지러워진다면 정상이다.

     

    마지막으로, 하나만 더 이야기하고 마치겠다.

    사실 컴퓨터가 k-평균 알고리즘으로 학습할 때, 어떤 종류의 샘플이 입력으로 들어오는지 컴퓨터는 모른다.

     

    그래서 최적의 종류(클러스터)가 몇 개인지 알아내야 하는데, 그중 한 방법이 엘보우 방법이다.

    위 방법을 사용할 때 나오는 그래프가 팔꿈치 모양을 닮았다고 하여 위처럼 이름 붙여졌단다.

     

     

    k = 3 부근에서 약간 꺽이는데, 이것이 바로 팔꿈치 방법이다.

     

     

    위의 팔꿈치 부분에 해당하는 k값이 최적의 k라고 한다.

     

    사실 나도 적으면서 어렵다.요 근래에 포스팅한 글들 중에서 제일 학술적으로 적은 것 같다.읽고 있는 여러분들에게 죄송스럽게 생각한다.

     

    사실 느낀 점을 쓰면 괜찮은데, 시간이 오래 걸린다.

    핑계를 대자면 지금 밤 12시이기 때문에, 후딱 쓰고 자려고 편법을 사용했다.

    그래서인지 예상보다 쓰는데 시간이 조금 걸렸다.

     

    세 가지의 이행 여부를 지킬 확률이 올라갔으니 오히려 좋다.

    "오히려 좋다" 기법이 무엇인지 궁금하다면 아래의 포스팅을 참고하면 좋겠다.

    그럼 포스팅은 여기서 마치도록 하겠다.

     

    긴 글 읽느라 고생하셨습니다.

     


     

    오히려 좋아 기법이 궁금하다면? ↓

     

    [Flutter 앱 개발 / 5일차] 대학생의 앱 개발로 돈 벌기 프로젝트 - 쉬어가기

    오늘은 치아 교정 때문에 치과에 갔다 왔다. 주사로 마취를 하고 상악(윗잇몸)에 스크류를 박았는데, 버스를 타고 집으로 돌아오는 길에 마취가 깨서 상당히 아팠다. 집에 도착하자마자 후다닥

    parksoffice.tistory.com

박스오피스