오픈웨이트 모델중 최강급. Minimax M1. 논리,수학,엔지니어링,코딩 테스트

Minimax M1 모델이 공개됐습니다.
오픈웨이트 모델 모델 중 가장 강력한 모델은 Deekseek r1인데
Deepseek r1과 비슷한 성능을 보인다고 주장하고 있습니다.

이 모델을 만든 minimx 사이트에는 영상생성,음성생성,에이전트 등을 서비스하고 있습니다.
순수한 LLM을 만드는 Deepseek과는 다른 규모인 것 같습니다.

에이전트도 테스트를 해봤습니다.
주어진 테스크에 대해서 스스로 계획을 세우고 검색기능과 코딩기능 등을 활용하는 기능입니다.

예전에 이 모델에 대해서 4백만토큰의 첨부파일을 지원한다고 해서
용량이 큰 구조계산서 엑셀파일을 올리고 질문했던 적이 있었습니다.
당시 큰 용량의 파일에 대해서 모든 질문에 대해 잘 답변했던 기억이 있습니다.

Minimax M1 모델에 대해서 논리,수학,엔지니어링,코딩 테스트를 해봤습니다.

00:00 오프닝 및 모델 소개
05:40 에이전트 기능 테스트
09:42 논리,수학,엔지니어링,코딩 능력 테스트 (14개 문제)
22:14 테스트 결과 및 마무리

Minimax 관련 지난 영상:
https://youtu.be/dNp2V55dtIM?si=jZzabHV7BRyDXw3S

관련 Link
https://www.minimax.io/news/minimaxm1

테스트 결과 시트 공유
https://docs.google.com/spreadsheets/d/1l2LVcFs5DlIiDrkMmHht1004iZRFzClkEp8agy0KiHA/edit?gid=1278489464#gid=1278489464

#AI #인공지능 #LLM #Minimax #Agent #MinimaxM1 #미니맥스
#deepseek #chatGPT #gemini #Grok #Qwen #coding #Huggingface
#토질및기초기술사 #토목구조기술사 #토목시공기술사
#토목기사 #건설환경공학 #철도기술사 #상하수도기술사

토목엔지니어 돌종

오픈웨이트 모델중 최강급. Minimax M1. 논리,수학,엔지니어링,코딩 테스트

티스토리툴바