본문 바로가기
일기

데이터 라벨링 일기1

by Mia_Algarvian 2022. 11. 25.
728x90

 

어쩌다 시작하게 된 데이터 라벨링.  시작은 아주 쉽고 단가도 저렴한 바운딩 박스 (bounding box)였고

온라인 무료 강의도 들어보면서 아 이거 할 만 하구나~ 싶어서

무작위로 지원한 뒤 당첨된 시멘틱 세그먼테이션..(semantic segmentation)   

근데 이게 내 생각보다 너무 어려웠다. (사실 처음 할당된 레벨이 초보에겐 고난도였다.) 

중가에 포기할까 싶었는데 다시 일을 구해서 제대로 된 일을 찾는게 더 어렵다는 걸 알게 된 일주일간의 방황 끝에

이깟 거 내가 못할까봐 싶어 이 악물고 첫 작업물을 submit 했다. 

프로그램에 자동으로 작업 시간이 카운팅되는데 55시간을 쏟아부었더니 하나가 마무리되었다. 

 

분명 구인 공고에는 하루 6시간 정도 주 5일 하면~ 하는 식으로 예상 월급을 적어두었는데

나는 예상만큼은 하겠지 싶었는데 전혀 아니었다. ㅋㅋㅋㅋㅋ

그 와중에 생기는 오류, 재부팅, 피드백 등등 정말 스트레스가 최고조였다. 

최초의 것만 하고 관두려 했는데 눈 뜨고 보니 할당을 받았다. 읭.

그냥 보자 싶어서 쓱 훑어봤는데 좀 할만한 것 같아서 그냥 해봤더니 총 작업시간 20시간 안에 마무리가 되었다. 

 

아.. 실외 데이터는 욕 나오게 어렵고 실내는 그래도 상대적으로 쉽구나..

직선으로 만드는 폴리곤인 만큼 실내에 인공적인 구조물을 라벨링 하는 데 일종의 쾌감이 느껴졌고

나무의 수형을 따라 달고나 구멍 뚫듯 클릭을 해야 하는 야외는 완전 극혐... 하게 되었다.

 

 

할당은 내 마음대로 받는 게 아니라서 실내와 실외를 왔다 갔다 하면서 작업을 하고 있는데

어떤 사람은 얼마나 열심히 하는지 하루에 하나씩 할당을 신청하던데

누적 작업량에 따른 인센티브가 고지된 상태에서 감히 예상만 해도 우와... 대부호가 되겠는 걸 싶은 사람도 있다.

나는 그냥 오전에 쉬고 점심 먹고 오후 4~5시부터 잠들기 전까지 작업하는 편이다. 

 

아 이걸 적는데 나는 정말 TMI꾼이구나.. 이걸 이렇게 많이 쓸 의도는 아녔지만,

어쩌다 보니 쓰려던 이야기는 벌써 둥둥 떠내려가고 길을 잃었지만,

그냥 데이터 라벨링 일기 1을 쓴 걸로 만족하자.

매일매일 쓰고 싶은 푸념은 있으니까.