Parseq 3

[Computer Vision]DACON 교원 그룹 AI 챌린지 Task : OCR (feat. parseq)(2)

1. Experiment https://mz-moonzoo.tistory.com/6 저번 글에 이어서 1주일 정도 시간이 흘러서 그동안의 시행착오에 대해 정리해보고자 합니다. 우선 SOTA모델인 parseq를 활용했음에도 불구하고 드라마틱한 성능변화가 나타나지는 않았습니다. 그래서 여러가지 데이터셋 증강 기법과 파라미터 조정을 통해 성능 향상을 이끌어 냈습니다. 이제부터 실험과 실험 결과에 대해 간단히 작성하도록 하겠습니다. Experiment Summary 1. baseline score -> 0.6563230797 -> model : Resnet+RNN+CTC Loss Dataset : 대회 제공 train 데이터셋 (76888개) test_size=0.2 shuffle = True 2. parseq..

DL/Computer Vision 2023.01.09

[Debugging]Parseq RuntimeError: NCCL error Call to CUDA function failed

OCR 대회를 진행하면서 Parseq 모델을 사용하면서 여러가지 Error를 접하게 됐습니다. https://mz-moonzoo.tistory.com/6 https://github.com/baudm/parseq/blob/main/train.py GitHub - baudm/parseq: Scene Text Recognition with Permuted Autoregressive Sequence Models (ECCV 2022) Scene Text Recognition with Permuted Autoregressive Sequence Models (ECCV 2022) - GitHub - baudm/parseq: Scene Text Recognition with Permuted Autoregressive S..

Debugging 2023.01.03

[Computer Vision]DACON 교원 그룹 AI 챌린지 Task : OCR (feat. parseq)

1.INTRO DACON에서 진행한 교원그룹 AI 챌린지 Task : OCR 평가지표 : Accuracy 처음으로 진행해보는 OCR Task라서 이것저것 찾아보면서 컴피티션을 진행했습니다. 컴피티션을 진행하면서 겪은 시행착오 및 결과를 얻어가는 과정에 대해 이 글에서 작성하도록 하겠습니다. 2. State-of-the-Art(SOTA) scene text recognition task에서 sota를 달성한 parseq를 사용해보기로 결정했습니다. parseq의 논문 리뷰는 다음 글을 참고 해주시면 될 것 같습니다. 논문 리뷰 링크 3. Parseq https://github.com/baudm/parseq GitHub - baudm/parseq: Scene Text Recognition with Permu..

DL/Computer Vision 2023.01.02