오픈 LLM 큰형 Llama 3.3 70b 업무 능력 테스트(ft. Cerebras)
https://youtu.be/WpTcKri2qWk
오픈 LLM의 큰형 격인 메타의 Llama 3.3 70b.
deepseek r1의 출현으로 가장 큰 충격을 받은 회사가 메타가 아닐까 싶네요.
그동안 오픈 LLM 진형의 선두 주자였는데
deepseek r1 때문에 2인자로 밀려나게 생겼으니 말이죠.
그동안 deepseek r1, Qwen 2.5 max, Tulu 3 등 오픈 LLM의 업무능력을
테스트했었는데, Llama가 빠져있었던 것 같아서
Llama 3.3 70b을 테스트해봤습니다.
Cerebras라는 inference 전용 칩을 만드는 회사의 서비르를 통해서
테스트를 해봤습니다.
00:00 오프닝
00:12 메타 llama 3.3 70b 소개
03:00 Cerebras소개
05:42 논리.수학 능력 테스트
10:35 엔지니어링 테스트(필요철근량 구하기)
11:21 코딩 능력 테스트(2차방정식 풀이및그래프, H-Beam그리기및단면적계산)
14:19 마무리(Llama테스트 결과 및 다른 모델과 비교)
Links:
cerebras : https://inference.cerebras.ai/
llama 3.3 model card : https://github.com/meta-llama/llama-models/blob/main/models/llama3_3/MODEL_CARD.md
#AI #인공지능 #llama #chatGPT #deepseek #gemini #토목구조기술사
#토목시공기술사 #토질및기초기술사 #도로및공항기술사
#토목공학 #건설환경공학 #토목기사