앞에 걸로 에러가 터졌다.
libdc1394 에러였다. 아마 GPU나 CPU사용 문제가 아니었을까 한다.
구글링해보니 다행히도 한글이 보인다.
https://gist.github.com/haje01/f13053738853f39ce5a2
깃허브의 김정주님이 쓴 글에서 해법을 찾았다.
학습을 시작할 때
examples/mnist/train_lenet.sh 의 기본 옵션이 GPU다.
내 인스턴스는 CPU 뿐이다. 에러뽝.
링크의 해법을 따라
examples/mnist/lenet_solver.prototxt 파일을 찾아서
nano 명령으로 파일 아래 쪽의 solver_mode: GPU 를 solver_mode: CPU로 바꾸어 주고 컨트롤 엑스 누르고 저장하고 엔터치고 나왔다.
다시 해보니까. 에러 없이 오 된다.
$ ./examples/mnist/train_lenet.sh
좀 좋은 인스턴스로 19분 걸린다고 하시네...
그러나 나에게는 많은 시간이라는 게 있다.
디자인아레테라는 분이 쓴 글이다.
[SHELL] 원격 접속해서 시간 오래 걸리는 작업, 접속 끊어도 계속 진행되게 하기 DISOWN | 웹으로 말하기
https://daworks.io/shell-%EC%9B%90%EA%B2%A9-%EC%A0%91%EC%86%8D%ED%95%B4%EC%84%9C-%EC%8B%9C%EA%B0%84-%EC%98%A4%EB%9E%98-%EA%B1%B8%EB%A6%AC%EB%8A%94-%EC%9E%91%EC%97%85-%EC%A0%91%EC%86%8D-%EB%81%8A%EC%96%B4%EB%8F%84/
여기서 컨트롤 제트를 누르면 막 작업하던게 멈춘다.
그다음 bg를 쳐주면 백그라운드로 넘어가면서 작업을 계속 한다.
그리고 disown을 치고 쉘을 닫고 나온다.
내가 놓고 나온 작업이 잘 되었는지 확인하는 방법은
./example/mnist/lenet_iter_xxxxx.Caffemodel 이 있는지 보면 되겠지?
...했는데 안먹힌다.
nohup 백그라운드로 시킬 일 & 으로 시켜놨다.
인제 nohup.out 을 확인해보면 있겠지?
AWS 프리티어 쓰고, GCP 무료 쓰고 하면서 돌리면 안 돌려지겠나.