본문 바로가기
IT 서비스/주문 관리 플랫폼

👨‍💻[ 자동 메뉴 설명 작성 기능 - 1 ]OpenAI vs Gemini vs Llama, 그리고 Gemini 사용방법

by agong이 2025. 2. 14.

📜서론

해당글에서는 Gemini API를 적용한 경험을 정리해보려고 합니다.
Gemini를 선택하기까지의 과정과, 다른 생성형 AI 모델(OpenAI, Llama)과의 비교, 그리고 GeminiAPI 사용방법을 다뤄보겠습니다.

 

🔍 생성형 AI 모델 비교 : OpenAI vs Gemini vs Llama

모델 제공사 특징 장점 단점
OpenAI (GPT-4) OpenAI 대화형 AI 및 코드 생성에 강점 높은 정확도, 다양한 사용 사례 지원 유료 정책, 비싼 가격
Gemini (Gemini 1.5 Pro) Google 멀티모달 지원 (텍스트, 이미지, 코드) 강력한 검색 기능과 구글 생태계와의 연동 상대적으로 적은 사용 사례
Llama (Meta Llama 2) Meta 오픈소스 모델 무료 사용 가능, 로컬에서 실행 가능 성능이 다소 부족, 클라우드 지원 미흡

OpenAI(좌) Gemni(중) Llama(우)

🎯 왜 Gemini를 선택했는가?

저희 프로젝트에서는 가게 사장님이 메뉴 설명을 쉽게 적을 수 있도록 돕는 것이 가장 큰 목표였습니다.

 

✅ 1. 멀티모달 지원 및 확장 가능성

Gemini는 텍스트뿐만 아니라 이미지, 음성, 코드까지 처리할 수 있는 멀티모달 AI입니다.
이를 활용하면 추후에 메뉴 이미지 생성, 가게 로고 생성 등의 기능도 확장 가능할 것으로 보았습니다.

 

✅ 2. 가격 대비 성능

OpenAI GPT-4는 강력하지만, 사용량이 많아지면 비용이 부담될 가능성이 큽니다.

Llama는 무료이지만, 클라우드에서 바로 사용하기 어렵고 성능이 제한적입니다.

반면 Gemini는 무료 티어가 있으며, 유료 플랜도 상대적으로 저렴해서 확장성을 고려할 때 유리했습니다.

 

✅ 3. Google 생태계와의 연동

Gemini는 Google Cloud, Firebase, Search API, Vertex AI 등과 쉽게 통합할 수 있습니다.
특히, Vision AI + Gemini 조합을 사용하면, 추후에 "이미지만 업로드해도 자동으로 메뉴 설명을 생성하는 기능"을 만들 수도 있지 않을까요? 🤔

 

이러한 이유로 Gemini를 선택했습니다. 

댓글