OpenAI 2

Molmo 논문 리뷰 - Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Multimodal Models

0. 서론LLM은 텍스트 뿐만 아니라 이미지에 대한 설명을 생성하고, 복잡한 시각적 질문에 정확하게 답하는 것과 같은 인상적인 멀티 모달 기능을 제공하고 있습니다. 그러나, 이러한 시각 언어 모델(VLM) 중 가장 성능이 좋은 모델은 모델 Weight, data, source code가 공개되지 않은채 독점 상태로 남아 있습니다. 그러나, VLM을 처음부터 구축하는 것은 매우 어려운 일이기 때문에 저자는 LLM에 대한 학문적 탐구를 촉진하기 위해 성능이 뛰어난 공개 멀티모달 모델을 개발하고 배포하고자 하였습니다. 이에 독자적으로 개발된 비전 인코더와 언어 모델을 결합해 훈련된 오픈 모델 Molmo를 공개했습니다.  Molmo는 다른 VLM들이 사용한 합성 데이터나 폐쇄적인 데이터에 의존하지 않고, 이미지..

DL/LLM 2024.09.27

[AI Tech] chatGPT API 사용방법 feat. Python

파이썬에서 chatGPT API를 사용하기 위해선 API Key를 발급받고 등록하면 끝이 아닙니다. 카드 등록 등 여러 과정을 추가로 진행해야 합니다. chatGPT API를 사용하기 위해 웹서핑을 하면서 찾은 정보를 작성하겠습니다. chatGPT API 사용방법 1. OpenAI 계정 생성 및 API 키 발급 계정 생성: OpenAI 웹사이트에 접속하여 계정을 생성합니다. API 키 획득: 계정 대시보드에서 API 키를 생성합니다. 이 키는 API 요청을 인증하는 데 사용됩니다. 먼저 Openai API 사이트에 들어가신후 회원 가입을 합니다. 회원 가입이 완료되면 https://platform.openai.com/api-keys링크에서 API Key를 발급 받을 수 있습니다. 발급 받으신 키는 다시 ..

AI Tech 2024.02.14