Pages List
List view
MLXP 개요
MLXP 개요
Volume 생성하기
좌측의 Volume 탭을 클릭 후, 파란색 추가 버튼을 누르면 사진처럼 뜹니다.
- Volume title
볼륨 이름을 정합니다.
- Size
Volume의 크기를 정합니다. 단위는 Gi입니다.
- Storage Class
어떤 종류의 Storage를 사용할지 정합니다.
ddn으로 설정하는게 보통이며, 간단하게 테스트나 실험할 용도로 local-path를 지정하는것이 좋습니다.
- Access Mode
접근 방식을 정합니다. ReadWriteOnce / ReadWriteMany가 있으나, RWX로 지정합니다.
이후 생성 버튼을 누르면 됩니다.
NoteBook 생성하기
실제 작업을 할 수 있게 만들어 주는것이 Notebook입니다.(아키텍처상으로 정확히는 Pod)
Kubernetes 환경에서 project는 개별적인 kubernetes namespace를 가집니다.
이 Namespace 공간에서, Notebook을 생성하면 Notebook은 개별 Pod을 가지며,
Pod안에서 container가 실행되어 사용자가 작업할 수 있습니다.
이 Namespace 공간에서, Notebook을 생성하면 Notebook은 개별 Pod을 가지며,
Pod안에서 container가 실행되어 사용자가 작업할 수 있습니다.
노트북 생성에 대한 설명은 다음과 같습니다
- 사용 용도
Jupyter Notebook으로 작업할 지, VSC를 통해 작업할지 정합니다.
(용도에 따라서 image가 변경됩니다.)
- Image
Container에 올릴 image를 선택합니다. 사용 용도를 선택하면 자동으로 변경되나,
따로 build한 Custom Image가 있다면 그걸로 지정해주면 됩니다.
- CPU/Memory
최소 CPU core와 최소 Memory 용량(GB)를 지정할 수 있습니다.
Advanced settings에서 최대 또한 지정 가능합니다.
최소/최대 설정 의미
Kubernetes 의 스케줄러는 Requests값을 전달하고, 이 기준으로 Pod가 들어갈 빈자리가 있는 WorkNode를 찾습니다. 최대를 지정하는 이유는, 메모리 누수나 다른 결함으로 인해 해당 Node의 모든 Resourece를 차지할수 있기 때문입니다.
또한, Pod에서는 Request된 자원들을 항상 100% 사용하는건 아닙니다.
또한, Pod에서는 Request된 자원들을 항상 100% 사용하는건 아닙니다.
- GPUs
쓸 GPU의 수를 지정합니다.
- Workspace Volume
실질적인 코드들이나 부가적인 데이터들을 저장하는 공간입니다.
해당 volume은 각 notebook마다 부여됩니다. 다른 notebook과 data를 공유할 일이 보통 없으므로, RWO로 설정하시면 됩니다.
- Data Volume
이미 저장되어있는 dataset이나, .pth와 같은 모델 학습의 산출물들이 저장되는 공간입니다.
미리 만들어놓았던 Volume을 지정하거나, 여기서 새로운 Volume을 만들 수 있습니다.
같은 Project에서 만들어진 Notebook의 경우, 같은 Data Volume을 참조하는 것이 일반적입니다.
TensorBoard
MLXP는 Model의 학습 모니터링을 TensorBoard를 통해 제공하고 있습니다.
마찬가지로 추가버튼을 누르면 위와 같은 화면이 뜹니다.
- Name
Tensorboard의 이름을 지정합니다.
- Storage Type
Tensorboard의 로깅이 저장되는 장소를 정합니다.
ObjectStorage/NCloud Storage와 Volume이 존재합니다. - ObjectStorage/NCloud Storage
엔드포인트를 지정해주면 됩니다, - Volume
어떤 Volume에 저장할지 지정 후, Mount path를 입력해 저장할 장소를 정합니다.
- Configurations
둘다 꼭 체크해주셔야 합니다.