취준에 앞서 직무분석은 필수이다.
같은 핸드폰 만들기어도 경영/디자인/개발/소프트웨어 등등 나뉘는 것처럼
한 분야 내에서도 세부적으로 직무가 나뉜다.
그중에서 AI 직무의 6가지 종류와 필요 역량에 대해 살펴볼 것이다.
1. 데이터 엔지니어
< 주요 업무 >
- 회사 내 고객(=데이터 분석가, 데이터 사이언티스트 등)이 사내 데이터를 쉽게 볼 수 있도록 데이터를 제공하는 일을 한다.
< 필요 역량 >
- 데이터 아키텍처 이해(DB, DW, DateLake 등 데이터 저장 및 처리시스템)
- 데이터 모델링(DB 스키마 설계, 정규화, 비정규화 등의 데이터 구조 설계)
- 데이터 파이프라인 구축(ETL 도구와 프레임워크 활용하는 능력, 수집/전처리/변환/저장 등의 데이터의 흐름)
- 워크플로우(스케쥴링) : Airflow, Argo, Luigi, Kedro 등
- 프로그래밍, 스크립팅(Python, SQL, Scala, R 등)
- 대용량 데이터 처리(분산시스템, 클러스터 환경에서 병렬처리, Hadoop, Spark, Apache kafka 등)
- DB 관리(SQL 쿼리 작성, 최적화, 인덱스 설계, 성능 모니터링, 튜닝 등)
- 클라우드 이해(AWS, Azure, 구글 클라우드)
- 서비스개발 : 크롤링, 검색, 추천, 모니터링, 이미지처리, 자연어처리, ML/DL 알고리즘 개발
2. 데이터 분석가
< 주요 업무 >
- 데이터 기반 분석 결과 및 해석을 협력자들과 공유하며 의미 있는 인사이트를 도출해 낸다. 필요에 따라 데이터 정제, 가공 등의 일도 한다.
< 필요 역량 >
- 데이터추출, EDA, Statistical Analysis, Data Mining 기술
- 데이터 시각화 (Tableau, Amplitude 등의 BI툴) 기술
- 분석 도구와 프로그래밍(Python, R, SQL 등)
- 통계적 지식과 모델링 지식
- 도메인 지식
- 문제해결 능력
- 커뮤니케이션과 협업
- A/B 테스트,AARRR,리텐션,코호트,LTV 등 다양한 방법론을 통해 인사이트 도출 기술
3. 데이터 사이언티스트
< 주요 업무 >
- 다양한 사업영역에 대한 데이터 분석 기반 인사이트 도출, ML/DL을 통한 분석 모델 개발 및 최적화 (AI계의 풀스택과 비슷함)
<필요 역량 >
- 제품/서비스에 관련 대용량 실시간 데이터 파이프라인 설계 및 구축할 수 있는 기술
- 제품/서비스를 위한 최신 ML/DL 모델의 알고리즘 연구 및 구현 최적화(성능향상) 기술
- MLOps(ML Pipeline, AutoML, CI/CD) 구축 기술
- 지표, 분석, 실험을 통해 데이터 주도로 의사 결정할 수 있는 기술
- 언어 : Python, R
- 워크플로우(스케쥴링) : Airflow, Argo, Luigi, Kedro 등
- 데이터 (분산, 실시간) 처리기술 : Kafka, Storm, hadoop, Spark 등
- RDBMS : MySQL, MariaDB, MsSQL, Olacle, PostgreSQL 등
- NoSQL : MongoDB, neo4j, cassandra, H-base 등
- ML/DL : Scikit-Learn, PyTorch, Tensorflow, Keras 등
- 서비스를 제공하는 인공지능 분야의 도메인(데이터) 지식
- 컴퓨터 과학, 통계학, 수학(논문을 이해하고 구현) 관련 고급 지식
4. AI 리서처
< 주요 업무 >
- ML/DL 기술의 효율화, 확장성 개선, 성능 최적화
< 필요 역량 >
- Python, R, C/C++
- Tensorflow, Pytorch, Keras, JAX
- Linux, Docker, Git
- Jira, Notion, Slack
- 최신 AI 이슈(논문, CV, NLP…)에 대한 관심, 이해, 구현할 수 있는 지식
- AI 관련 수학적 지식(통계, 미적분학, 선형대수학, 수치 분석…)
- 데이터 구조 및 기본 알고리즘 지식
- 운영체제, 네트워크에 대한 지식
- communication 역량
- 문제해결 역량
- 학습 역량
5. AI 엔지니어
< 주요 업무 >
- AI 서비스의 자동화, 효율화, 성능 고도화 시스템 구축을 위해 데이터를 효율적으로 처리하는 시스템, AI 모델 정확도를 높일 수 있는 시스템 연구 및 구축
< 필요 역량 >
- C/C++, Python
- Keras, Tensorflow, PyTorch 등 머신러닝 관련 라이브러리 사용
- 대용량 데이터 처리 및 분석 및 운영 경험
- 머신러닝 파이프라인을 구축
- 서빙하는 AI 모델의 정량적 지표를 수립하고 데이터를 통해 모델 개선
- 컴퓨터비전/머신러닝/딥러닝 지식 보유 및 관련 프로젝트 수행 경험
- 모델 최적화 및 성능 개선 경험
- 클라우드 서비스 환경에서의 ML 모델 개발 경험
6. MLOps
< 주요 업무 >
- (ML머신러닝팀과 Operation운영팀의 생산성 향상을 목표로) 머신러닝팀에서 개발한 모델이 정상적으로 배포(서비스)될 수 있는지 확인하고 학습-배포-테스트-운영 과정의 자동화 구축
< 필요 역량 >
- 제작된 모델이 서비스가 가능하도록 infrastructure설계, 개발, CI/CD (Continuous Integration지속적인 통합, Continuous Delivery지속적인 서비스 제공 또는 Continuous Deployment지속적인 배포)
- Python, Tensorflow, Pytorch, Keras, JAX
- Airflow, Argo Luigi, Kedro
- Linux, Docker, Kubernetes, Docker Swarm
- AWS, Azure, GCP, Git
- Jira, Notion, Slack
- 서비스를 제공하는 인공지능 분야의 도메인(데이터) 지식
- ML 프로젝트 개발 사이클에 대한 지식
- 프로그래밍에 대한 지식 : 데이터의 구조 및 기본 알고리즘 지식
- 컴퓨터 과학 관련 대한 지식 : 운영체제, 네트워크, 데이터베이스 등
이렇게 크게 여섯 가지로 나눌 수 있다.
여기서 더 나아가 관련있는 직무로 관심 있는 직무 1순위, 2순위를 정하고
그에 따른 필요 역량을 얻기 위하여 노력하면 취업 시장에 뛰어들 준비가 된다.
모든 취업준비자들 파이팅!!!
'아이펠서포터즈' 카테고리의 다른 글
관심있는 산업군 분석 (0) | 2023.06.26 |
---|---|
문과였던 내가 이 세계에서 개발자로 되어가는 건에 대하여 (2) | 2023.06.10 |
온라인 학습 방법 Honey Tip 5 (0) | 2023.05.29 |