본문 바로가기
부업 인포

데이터 라벨러에 대하여

by 인포테이너 2024. 2. 2.
반응형

출처 Freepik

 

나는 프리랜서 데이터 라벨러다.

본업은 주부이고 부업으로 데이터 라벨링 일을 하고 있는데 재택근무를 하고 있기 때문에 비교적 자유롭게 시긴을 관리하며 돈을 벌고 있다. 

 

 요즘 N잡러(본업 외에 부업을 하는 이들을 일컫는 말) 유행이기도 하고, 마침 나도 그 물살에 실려 일을 시작한 케이스이기 때문에 오늘은 내 일에 대해 적어보려고 한다.

 

하지만 나는 전문가가 아니기 때문에 이 글은 전문적인 지식으로 보면 곤란하다. 오히려 나의 경험을 바탕으로 한 그저 알아두면 좋은 정보정도로 생각하고 보면 좋을 것 같다.

 

 

데이터 라벨러란?

데이터 라벨러란 AI가 창조되면서 덩달아 창조된 직업이다. 간단히 말하자면 AI를 가르치는 선생님이다.

일을 해보겠다고 결심을 하고 교육을 받을 때 참 인상 깊었던 설명이 있었다. 데이터 라벨러와 AI와의 관계를 엄마와 아기에 비유한 설명이었다. 엄마가 아기에게 그림을 손가락으로 가리키며

 

"이건 자동차라고 해. 이건 눈이라고 한단다. 이건 코라고 부르는 거야. 이건 입이고."

 

이렇게 가르쳐주듯이 데이터 라벨러는 AI의 엄마 역할을 한다. 데이터 라벨러는 엄마가 아기에게 가르치듯 AI에게 세상 모든 걸 가르치는 일을 하는 사람이다. 이건 글자고, 이건 바코드야, 이건 인식 번호고, 이건 사람이고, 이건 자동차야. 등등.

 처음엔 단순한 컴퓨터 프로그램이었던 AI가 데이터 라벨러들이 가르쳐 준 정보를 바탕으로 점점 정교하고 자연스럽게 자라면서 챗GPT도 되고, 밀리의 서재처럼 TTS(Text to Speech) 서비스도 해나가게 되는 것이다.  

 중요한건 엄마든 선생님이든 올바르게 가르쳐 주지 않으면 AI도 잘못된 지식을 가지고 삐뚤어질 수 있다. 그래서 데이터 라벨러는 늘 신중하고 꼼꼼하게 일해야 한다.

 

어떤 일을 하는 걸까?

 데이터 라벨링은 말 그대로 AI가 일을 할 수 있도록 대상을 선별하고 이름을 붙이거나, AI가 더 나은 방향으로 발전하도록 방향을 잡아주는 일들이기 때문에 기본적으로 컴퓨터 작업이다.

 특별한 프로그램을 가지고 일을 하는 경우도 있지만 대부분 기본적인 컴퓨터 작업만 할 수 있으면 일을 할 수 있다.

 일의 종류도 다양하다. 이미지를 선택하고 기준에 따라 라벨링(이름붙이기)을 하거나 더 나은 텍스트를 선택하는 작업도 있고 대화문을 만드는 작업도 있다. 

 예를 들어보자면, 자율주행 프로그램을 만들때 데이터 라벨러들은 수많은 상황들의 사진 이미지들를선별하고 각 대상에 라벨링을 한다. 이런 수많은 데이터들을 모아서 운전시 발생할  있는 위험상황들을 정의하고 그에 대한 대처방법을 만들어 자율주행 프로그램을 발전시킨다. 실제와는 조금 다르겠지만 대강 그렇게 이해하면  듯하다. 이처럼 데이터 라벨링은 AI를 발전시키는 기조 데이터를 만드는 작업이다.

 그 외에도 은행의 AI고객센터 프로그램이 더 자연스러운 대화문을 만들도록 대화문을 만들거나 평가하는 등의 작업도 있을  있고, TTS 서비스의 음성으로 책을 들을때  자연스러운 억양이나 말투를 쓰도록 교정하는 업무도 데이터 라벨러의 업무 예라고 하겠다. 

 분야마다 하는 업무도 다르고 같은 업무 내에서도 중점으로 하는 일이 다르기 때문에 일을 시작하기 전에 공부를 많이 할 필요는 없다. 공인된 교육프로그램으로 데이터 라벨링 교육을 수료할 수 있는데 교육을 받으면서 "아~ 이런 일이구나." 하고 개념을 이해하고 기초적인 라벨링 기술을 배운 후, 실제 일을 할 때는 각각의 가이드라인에 따라 일을 하게 된다. (공인된 교육을 해주는 곳이 몇 군데 있는데 나는 크라우드 웍스에서 교육을 받았다. 인터넷 강의 이므로 시간, 장소 구애 없이 교육을 받을 수 있다.)

  

 데이터라벨링은 하는 일에 따라 작업자와 검수자로 나뉘는데 작업자는 직접 라벨링을 하는 업무이고, 검수자는 라벨링의 정확성을 높이기 위해 작업자의 일이 올바르게 이루어졌는지를 평가하고 피드백하는 업무를 한다. 아무래도 평가를 하려면 작업자보다는 검수자가 경험이 많이 필요하기 때문에 처음에는 작업자로 일을 하다가 검수자로 넘어가는 경우가 많다고 한다.

 또한 라벨링을 하는 대상에 따라 ① 이미지 ② 텍스트 ③ 음성 ④ 비디오 ⑤ 센서 데이터 등으로도 나눌 수 있다. 일의 종류가 다양해서 모두 설명을 할 수는 없지만 그 종류가 다양한 만큼 선택의 폭이 넓다. 

 모두 다 잘하는 사람도 있겠지만, 대부분은 보통 자신에게 맞는 일이 있다는고 한다. 사람에 따라 잘하는 부분이 달라서 이미지 라벨링을 잘하는 사람이 있고, 텍스트 라벨링을 잘 하는 사람이 있다. 

 잘 맞는 작업이 많고 능력이 된다면 여러 곳에 모두 지원할 수 있어서 일자리 찾기가 편하고 돈도 많이  수 있다. 나도 그랬으면 좋겠지만 내 능력은 제한적이라 좀 아쉽다.

 

자격증이 필요할까?

 

 결론부터 말하자면 자격증이 있으면 득이 되지 실이 되지는 않는다. 하지만 굳이 자격증까지 따라고 권하고 싶지는 않다.

 나는 처음에 크라우드 웍스에서 진행하는 데이터 라벨링 교육을 들었고, 2023년도까지는 무료교육이라길래 (공짜에 눈이 멀어) 작업자 과정을 먼저 듣고 바로 검수자까지 들었다. 현재는 19000-29000원 정도 비용이 발생하고 있다.

  **크라우드웍스 아카데미 https://academy.crowdworks.kr/

데이터 라벨링이라는 게 생각보다 분야가 많아서 교육을 듣는데도 시간이 꽤 걸렸다.

 하지만 자격증은 따지 않았다. 교육과정을 수료하고 바로 실전에 도전해 봤는데 실전을 겪어보니 자격증에 대한 회의가 더 많이 생겼다.

다른 일도 마찬가지겠지만 데이터 라벨링 역시 실무에서 배우는   많은 일이다. 교육에서 기본적인 개념과 기초적인 기술을 습득하고 실제 일을  때는 기술을 바탕으로 프로젝트마다 주어지는 가이드라인에 따라 일을 하면 된다.

 따라서 자격증을 따도 실전에 투입되면 또 배워야 한다는 거다. 그리고 자격증은 크라우드 웍스에서 발급하는 데, 사실 크라우드 회사 자체에서 일할 경우가 아니라면,  타회사에서는 그 자격증으로 내 능력을 인정해주지는 않는 것 같다. (오히려 입사  따로 시험을 보는 경우가 더 많다.)

 물론 크라우드 웍스에서 일하고자 한다면,  지원할 때 자격증이 우대조건이다.

 **크라우드 웍스 https://works.crowdworks.kr/

크라우드 웍스에서도 제공해 주는 일감들이 많으니 일을 쉽게 찾는데 도움이 될 수는 있다.

선택은 각자 하면 될 것 같다.

 

구직방법

 말 그대로 프리랜서이기 때문에 한 회사에 계속 소속이 되어있는 것은 아니고 일을 계속 찾아야 한다.

알바몬, 잡코리아, 사람인, 알바천국 같은 사이트에 올라오는 공고에 이력서를 내기도 하고, 데이터 라벨링 전문 사이트들에서 공고하는 일들을 찾기도 있다. 그리고 데이터 라벨러들이 모여있는 카페에서 일자리 정보를 얻기도 한다. 나도 카페에 가입이 되어 있는데 요즘은 해외 라벨링 사이트에서 일하는 분들도 종종 보인다.

 보통 구직 사이트에 데이터 라벨링, 라벨러, 데이터 분류 등으로 검색해서 찾을 수 있고 크라우드 웍스 같은 전문 사이트에는 데이터 컬렉션 작업들도 있어서 사이트에서 원하는 조건으로 사진을 찍어서 제출하면 건당 금액을 받을 수도 있다.

  이력서를 내고 바로 일을 시작하는 경우도 있고, 업무를 할 수 있는지 능력 평가 후 합격이 되면 일을 시작하는 경우도 있다. 영어, 수학 전공자들을 우대하는 작업도 있고, 특정 직업(금융업이나 의료계, 교육계 등)의 경력자들을 우대하는 작업도 있다. 하지만 상관없이 지원할 수 있는 일도 많기 때문에 나는 일단 다양하게 지원서를 내보는 편이다. 

 덕분에 정말 나와 맞지 않는 일을 맡아 밤을 하얗게 새보기도 했고, 의외로 재미있는 일을 만나 재미있게 돈을 벌어본 적도 있다. 그러면서 경력이 되어가는 것이므로 만약 데이터 라벨링에 관심이 있다면 처음엔 이것저것 가리지 말고 많은 것을 해보는 게 좋다고 생각한다.

 

 일을 하고 있는 중에도 새로운 일을 찾아야 한 기존 프로젝트가 끝난 후 다음 일을 할 때까지 공백이 생기지 않을 수 있기 때문에 일을 하면서도 새로운 일을 찾는 게 좋다. 가끔 일이 겹쳐서 힘들어질 때도 있지만 일의 공백이 길어져 초조해지는 것보다는 일이 많아서 비명을 지르는 게 낫다고 생각하는 편이라 나는 꾸준히 일을 찾고 있다.

 처음엔 경력이 없기 때문에 지원할 곳도 많지 않고, 지원을 해도 잘 써주지 않는 경향이 있어서 지레 지치는 분들도 있는 것 같다. 실제로 데이터 라벨링 카페에 가면 그런 푸념들이 많고 나 또한 그랬다. 그래도 계속 도전을 해야 경력도 쌓이는 법이고 그렇게 경력을 쌓다 보면 조금씩 사정도 나아진다.

 

수입은?

 매달 일을 하는 만큼 번다. 일이 항상 있는 것은 아니기 때문에 편차가 있다. 많이 벌 땐 회사 다닐 때보다 더 많이 벌 때도 있고 일이 없을 땐 아주 없기도 하다. 페이도 일마다 다르긴 한데, 요즘은 재택근무일 경우 최저 시급을 밑도는 경우도 많아서 좀 우울하다. 작업 건수로 받기도 하는데 100원, 200원씩 하는 작업부터 건당 만원 이상의 작업들까지 작업의 난이도와 형태에 따라 책정이 된다. 캐시미션(https://www.cashmission.com/) 같은 사이트에선 이미지 라벨링 작업당 10-20원씩 하는 작업도 있을 정도다. 하지만 금액이 적어도 재미있고 티끌 모아 태산이다. 꾸준히 하면 어느 정도 금액이 모인다.

하지만 시간당 금액으로 보자면 아무래도 부족한 금액인 게 사실이기도 하다.

그래서 부업으로는 추천하지만 생업으로는 좀..

 매달 수입이 정산되는 시기도 다르고, 포인트로 정산이 되는 곳도 있으므로 잘 살펴보고 계약을 해야 한다.

 그리고 이 점이 처음에 좀 망설여졌는데, 개인 정보를 보내야 월급을 받을 수 있다.(신분증 사본이나 통장 사본 등. 회사에서도 월급을 주려면 소득신고를 해야 하기 때문에 어쩔 수 없는 절차라고 한다.)

 

성수기, 비수기가 있다던데..

연말이 되면 이른바 비수기가 시작된다고 한다. 진행 중이던 프로젝트들이 연말이 되면 다들 마무리 작업을 하게 되는데 덕분에 새로운 프로젝트가 없어서 라벨링 인력을 구하는 회사가 없다. 그러다 중순이 되면 연초에 시직 한 새로운 프로젝트들이 본격장으로 일을 시직 하며 다시 일이 많아진다고 하는데 내가 보기엔 매년 상황에 따라 다른 것 같다.

 국가지원 자체가 끝났기 때문에 2024년부터는  그 성수기라는 것이 다시 돌아올지도 의문이라는 관측도 많다.  그리고 코로나 시국이 끝나고 나서는 재택근무보다는 출퇴근 인력을 뽑는 곳이 많아져서 이제 부업보다는 본업으로 일하는 직업으로 변해가는 양상이다.

 하지만 아직은 성수기건 비수기건 꾸준히 찾다 보면 일거리가 나오기는 한다.

 

내가 생각한 데이터 라벨링의 장점

늘 그런 건 아니지만 그래도 일반 출퇴근 직보다는 시간활용하기가 좋다.

아이를 어린이집이나 유치원에 보내놓고 집에 있는 시간을 활용해 돈을 벌 수 있다.

출퇴근하는 시간을 절약할 수 있어서 그야말로 하루를 꽉 채워 살 수 있다.

교통비, 점심값도 안 든다. 집에 있는 밥 먹으면 된다

일한 만큼 버니까 일하는데 의욕과 동기가 생긴다. 대신 이 세계에는 월급 루팡은 없다. 일을 해야 돈이 나온다. (당연한 건데 좀 아쉬운 이유는 뭘까?)

 

내가 생각한 데이터 라벨링의 단점

일이 계속 있는 게 아니다. 즉 고용불안을 늘 안고 산다 일을 내가 직접 찾지 않으면 누가 던져주는 일은 없다. 회사 다닐 땐 누가 일 던지면 그렇게 싫었는데, 이젠 그것도 가끔 그리워진다.

위에서 말한 것처럼 이 세계에 월급 루팡은 없다. 한만큼 돈이 나온다. 

검수에서 회사에서 원하는 결과가 아니라는 판단이 나오면 일을 다시 하거나 월급에서 불이익을 받을 수 있다.

 

전망

사실 내가 일을 시작했을 때도 이미 이제 이 일은 끝이다, 전망이 없다,라는 말들이 많았다. 2-3년 전에 AI개발이 본격화되었을 때는 일자리도 매우 많고, 정부 지원금까지 있어서 수입도 훨씬 많았다고 들었다. 그래서 투잡으로 일을 하시는 분들도 많았는데, 2024년부터는 국가지원도 없고, 그래서인지 진짜 구직사이트에 일이 많이 줄어든 상태다. 그리고 재택근무는 더더욱 많이 줄었다.

 

글을 쓰다 보니 좀 걱정스럽긴 하다. 그럼에도 길이 없다고 보지는 않는다.

AI모델이 생기고 발전을 하면 점점 다른 분야로도 영역을 넓혀갈 것이고 다른 영역에서 일을 하기 위해선 라벨러의 역할이 필요해질 수밖에 없다.

그리고 국내에서 일이 없다면 해외로 눈을 돌려보는 것도 추천한다.

내가 외국계회사를 추천하는 이유는 AI 개발 후 한국어로 서비스를 지원하기 위해 원어민 작업자들을 찾는 외국계기업들이 꽤 있기 때문이다.

그리고 더 도전해 볼 만한 이유가 있다. 한국에서의 데이터 라벨러는 이미 그 수입이 최저시급에 달한 반면 외국기업은 시간당 수입이 그보다 높으며 달러 수입이다. 요즘 달러 수입 꽤 짭짤하다.

 

이상 내가 겪어본 데이터라벨링에 대한 정보들을 정리해 보았다.

많은 부업들이 있겠지만 일확천금을 바라지 않고, 차곡차곡 모으는 일을 하고자 한다면 추천한다.

내게 잘 맞는 작업을 찾아서 매일 1-2시간씩 하다 보면 익숙해질수록 곧 목돈을 모을 수 있는 일이다.

 

꼭 이 일이 아니더라도 이 글을 읽는 모든 분들이 자신에게 맞는 일을 찾아 개척해 나갈 수 있기를 응원한다.

 

반응형

'부업 인포' 카테고리의 다른 글

앱테크 추천 (시간날때 소소하게 용돈벌기)  (1) 2024.03.15