Q. 왜 사람들은 데이터 과학자는 죽은 직업이라고 하나요? 회사들이 많이 뽑지 않았었나요?
A. (2020. 02. 24)
데이터 과학자(Data Scientist)의 시대가 끝났다고 처음 말을 꺼낸 사람 중 한명으로서, 그렇게 주장하는 이유 10가지를 말씀드릴게요.
1. 데이터 과학자를 뽑는 수는 지난 4년 간 쭉 감소해왔습니다. 상당히 넌센스입니다. 왜냐하면 거의 매년 데이터 관련 직업의 양은 두배씩 늘었기 때문입니다.
2. 지금 가장 핫한 직업은 '머신러닝 엔지니어(machine learning engineer)'입니다. 지난 2년간 그래왔습니다.
3. 현실에서 일하다보면, 실제 적용되는 머신러닝은 모두 데이터에 의존합니다. 데이터를 구하고, 잘 가공하는 일과 거리가 먼 직종인 데이터 과학자를 비싼 연봉을 주고 채용할 이유가 없습니다.
4. 취업 전 데이터 과학자들은 대부분 SQL은 몇 주면 배울 수 있는 것이니 몰라도 된다고 생각하지만, 현실에선 그렇게 생각하지 않습니다.
5. 구글의 AutoML Tables 등 새로나오는 기술들은 데이터 과학자의 입지를 더욱 좁히고 있습니다.
6. 실제 세상을 모델링하는 머신러닝의 대다수는 지도 학습(supervised learning)입니다. 대부분의 현실 머신러닝은 잘 구조화된 데이터(structured dataset) 위에서 이뤄집니다. 현실 모델링의 대부분은 회귀(regression) 혹은 분류(classification)인데, 이는 gradient boosting을 사용한다는 말입니다. 많은 decision이 필요로 하지 않게 됩니다.
7. 구글은 머신러닝 엔지니어가 가지는 top skill로 SQL를 언급했습니다. 6번과 관련있는 얘기지요. 아직 SQL이나 다른 big data tool을 잘 다루는 데이터 과학자를 현실에서 보지 못했습니다. 대부분은 기초적인 내용도 대답을 못합니다.
8. Data science라는 분야에서 데이터 과학자를 뽑는다고 쓰여있어도, 사실 대부분은 머신러닝 엔지니어를 위한 자리입니다. 대부분의 데이터 과학자들은 프로그래밍을 잘 못하기 때문입니다.
9. 이 분야는 연봉이 높기 때문에 아무나 뽑지 않습니다. 대부분의 데이터 과학자는 면접을 통과하지 못합니다. 차라리 SQL 엔지니어를 훈련시켜서 머신러닝 엔지니어로 만드는 것이, 데이터 과학자를 훈련시켜 머신러닝 엔지니어로 만드는 것보다 쉽습니다. 실제 현실에서 데이터를 다루는 일은, 이론에서 배웠던 것과는 차원이 다릅니다.
10. 지금 40,000개가 넘는 일자리가 공석으로 비어있습니다. 사람을 쉽게 뽑을 수 있었다면, 금방 채워졌을 것입니다. 똑똑한 회사들은 초보에게 자신들의 가장 귀중한 데이터를 맡기지 않습니다.
'머신러닝' 카테고리의 다른 글
GPT-3 동작 원리 (0) | 2020.11.11 |
---|---|
TPU와 GPU의 차이점 (0) | 2020.11.11 |
AI가 쓰는/읽는 문장에 대한 이해도 (0) | 2020.11.09 |
커리큘럼 러닝 (curriculum learning) (0) | 2020.11.06 |
어포던스(Affordance)와 강화학습(Reinforcement Learning) (0) | 2020.11.04 |